AI在手機(jī)里結(jié)出了果

2023年初AI大模型火爆全球,當(dāng)時就有人說,這項技術(shù)走向大眾的最佳方式就是手機(jī)。

不管消費(fèi)者怎么想這句話,苦于銷量連年下降的手機(jī)廠商們肯定是把它聽進(jìn)去了。

于是,從2023年下半年開始,所有手機(jī)新品都在標(biāo)榜AI能力,都宣稱自己是AI手機(jī)。這場盛宴持續(xù)上演到今天,即使是相對保守的蘋果也發(fā)布了“Apple Intelligence”,而那些原本被認(rèn)為已經(jīng)被擠壓到缺少生存空間的二線手機(jī)品牌,也頑強(qiáng)地依靠“All in AI”留在了牌桌上。

一時間,AI在手機(jī)市場是鑼鼓喧天,紅旗招展,人山人?!粚?,人山人??赡苓€不一定。

對于用戶來說,面對鋪天蓋地的AI手機(jī),華美無比的發(fā)布會PPT,可能有點小迷惑:AI到底能給我?guī)硎裁矗窟@么多AI手機(jī)之間有什么不同?我設(shè)想的AI是科幻電影里那種,手機(jī)能給我嗎?

事實上,從2017年深度學(xué)習(xí)火熱起來之后,手機(jī)與AI的結(jié)合一直都在持續(xù)。幾年來,我們經(jīng)歷了端側(cè)AI算力、AI攝影、端側(cè)大模型,到系統(tǒng)級AI能力的變遷。假如手機(jī)是一片果園,AI這棵果樹在里面已經(jīng)長了很多年。

那么,到2024年,AI手機(jī)無限風(fēng)光之時,這顆果子它保熟了嗎?

讓我們穿越紛繁復(fù)雜的概念,看看AI手機(jī)究竟帶來了什么。

提起AI手機(jī),我們總會有一種很空洞的感覺,甚至不知道廠商和專家到底在激動個什么。

這種虛妄感來源于業(yè)界并不存在對AI手機(jī)的標(biāo)準(zhǔn)化認(rèn)定。于是每個廠商,甚至每個人都可以對其進(jìn)行獨立闡釋。這些闡釋有共識,有差異,還有大量似是而非與文字游戲。這些聲音交織在一起,就變成了一種概念游戲。

因此,想要了解AI手機(jī),首先要避免被概念游戲干擾。就像要摘果子,首先要把枝葉撥開。如何實現(xiàn)這種免打擾呢?一個簡單的方法,叫作“AI手機(jī),我有三不看”。

首先,廠商的“AI大帽子”不用看。

不久之前,AI手機(jī)領(lǐng)域姍姍來遲地發(fā)布了此前承諾的Apple Intelligence。但這個“蘋果智能”卻沒有激起多大的市場水花。原因在于,蘋果智能更像是眾多AI功能的升級打包,而非某種新能力、新思路。

這種給眾多AI小功能起個大名字的玩法,在今天的手機(jī)界比較普遍。用戶以為得到了新東西,其實不過是新瓶裝舊酒,散裝改零售。類似的說法,經(jīng)常還包括某某智能、某某GPT、某某原生,大差不差都是一個意思。甚至很多時候這根本不是一個研發(fā)系統(tǒng)主導(dǎo)的項目,而是市場部歸攏收集一下各個部門都有哪些AI能力,最后編個名字給寫進(jìn)PPT里而已。

其次,是缺乏標(biāo)準(zhǔn)的技術(shù)名詞不用看。

任何技術(shù)在受到重視之后,都會經(jīng)歷一個造詞階段。這些新造的詞有些會最終留下來,變成約定俗成、相對標(biāo)準(zhǔn)化的說法。但絕大部分都會悄然流逝在歷史記憶里。在AI手機(jī)領(lǐng)域,我們經(jīng)常會看見大量類似的新詞。它們或多或少都有所指,但作為普通消費(fèi)者大可不必去探尋每個詞的來龍去脈,也不用被它們迷惑了判斷。

諸如智能框架、意圖識別、主動服務(wù)、全局智能等高大上的AI手機(jī)詞匯,在今天都沒有統(tǒng)一標(biāo)準(zhǔn),愛好者可以研究研究,大多數(shù)消費(fèi)者不妨敬而遠(yuǎn)之。

再次,大模型參數(shù)以及其他AI參數(shù)不用看。

從2018年預(yù)訓(xùn)練大模型開始出現(xiàn),就產(chǎn)生了一種頭部廠商說效果,其他廠商拼參數(shù)的現(xiàn)象。在核心能力上很難構(gòu)建差異化的廠商,往往會宣傳自己模型參數(shù)更大,跑分效果更好。這一點來到AI手機(jī)階段,就變成了宣傳端側(cè)大模型的參數(shù)大、數(shù)量多。但AI模型不是CPU等硬件,參數(shù)高并不意味著性能好。模型效果還取決于壓縮方案、調(diào)優(yōu)效果等一系列條件,所以不必將廠商宣傳的模型參數(shù)等同于產(chǎn)品價值。

蒸餾掉這些之后還能留下的東西,才是AI在手機(jī)里結(jié)出的果。

很多人都在說,AI沒有應(yīng)用可怎么辦。但問題是,ChatGPT本身就是一種應(yīng)用。在應(yīng)用端再誕生更強(qiáng)的超級應(yīng)用固然前景美好,但大模型本身的應(yīng)用價值本身就有跟手機(jī)結(jié)合的空間。

AI手機(jī)的第一步,就是要把類ChatGPT的大模型能力帶到手機(jī)的第一方功能里。比如iOS18.1,重點引入的AI功能,就包括AI寫作、郵件推薦與回復(fù)、消息摘要等。換個角度想想,我們會發(fā)現(xiàn)這些都是ChatGPT就能做到的事。

這種思路并沒有什么不好,而且也必須由手機(jī)廠商第一方來主導(dǎo)。因為如今智能手機(jī)提供的第一方功能非常多,而其中又有大量可以加入語義理解、內(nèi)容生成等大模型能力的地方。因此,大語言模型與手機(jī)第一方功能的點對點結(jié)合,是AI在手機(jī)里結(jié)出最多的果。

對于類似功能的選擇,建議是根據(jù)自身需求來挑選實用的功能,或者功能群組。比如去年11月,OPPO就發(fā)布了一鍵生成AI通話摘要。這個功能可以在通話結(jié)束后,智能識別通話內(nèi)容并生成重點信息摘要。再比如Find X8 Pro可以長按電源鍵呼出問屏功能,AI根據(jù)屏幕顯示來回答文章內(nèi)容、圖片信息等。小米在澎湃OS 2當(dāng)中,也推出了一系列諸如AI寫作、AI識音、AI妙畫的智能功能。

但對于手機(jī)廠商來說,大模型功能的加入顯然只是敲門磚。這種單點升級并不能滿足廠商對AI的野心。

于是,智能體來了。

AI Agent又被稱為智能體,被廣泛認(rèn)可是真正體現(xiàn)了AI思維的新應(yīng)用形態(tài)。智能體可以跨越不同的軟件工作流程,來實現(xiàn)目標(biāo)主導(dǎo)的自主判斷。這種運(yùn)行邏輯放在手機(jī)里有兩方面的好處。

對于用戶來說,智能體可以被視作獨立于點滑交互的新交互形式。用戶可以命令智能體來完成指令,并且其理解能力、生成能力與應(yīng)用范疇都遠(yuǎn)大于此前的語音助手,更加貼近用戶對個人助理的基本想象。

對于手機(jī)廠商來說,智能體不僅是一個全新賣點,還可以繞過APP的藩籬,讓第一方的應(yīng)用權(quán)限更大,體驗更加重要。把智能體做起來,有概率讓用戶習(xí)慣、第三方應(yīng)用服務(wù)都與廠商綁定更加緊密。

在這樣的驅(qū)動力下,幾個月以來手機(jī)廠商紛紛在智能體陣地上秣馬厲兵,誓有一種在2025年展開智能體決戰(zhàn)的架勢。而從AI手機(jī)的發(fā)展線上看,手機(jī)+AI Agent是一個脫離了ChatGPT基本應(yīng)用框架,同時蘋果為代表的歐美終端廠商沒有跟進(jìn)的領(lǐng)域。中國AI手機(jī)的未來成就,或許就系在智能體的機(jī)遇上。

在智能體方面,目前最為用力地就是榮耀。不久之前的榮耀Magic7發(fā)布會上,榮耀CEO趙明用YOYO智能體自動下單了2000杯咖啡,一下讓智能體手機(jī)的概念大為出圈。目前,榮耀主推的智能體體驗包括“一句話關(guān)閉自動續(xù)費(fèi)”“一句話點咖啡”“一句話發(fā)送文件”“一句話關(guān)閉應(yīng)用權(quán)限”等。在手機(jī)行業(yè)里相對完整且具體地展現(xiàn)了智能體價值。

在2024 vivo開發(fā)者大會上,vivo也亮出了自己的智能體方案Phone GPT,其不僅具有對屏幕界面的識別和操作功能,還可以接管音頻,通過電話實現(xiàn)預(yù)訂餐廳等功能。把智能體延伸到音頻領(lǐng)域,也成為接下來一個值得關(guān)注的方向。

在OPPO這邊,則有可以連續(xù)多輪自然對話,并可以跨應(yīng)用操作的OPPO AI。除了提供識物、導(dǎo)航、問答等AI能力外,OPPO AI還可以與影像能力、AIGC能力結(jié)合,幫助用戶完成圖片識別、圖片處理、排版潤色等功能。

在華為這里,HarmonyOS NEXT版本具有搭載了盤古大模型的鴻蒙智能助手小藝。其感知和推理能力較此前版本有極大提升,可以實現(xiàn)23類主要場景的交互。

這些嘗試,都可以看作是向手機(jī)+AI Agent方向的前進(jìn),只是各個廠商的具體技術(shù)實現(xiàn)方式、能力側(cè)重以及宣傳話術(shù)不同。

對于消費(fèi)者來說,如果你是深度手機(jī)用戶,今天可能已經(jīng)到了嘗鮮智能體的時機(jī),但如果并沒有被傳統(tǒng)交互方式困擾等問題,或許還可以讓智能體手機(jī)再成熟一些。

至少AI Agent這顆果子,目前看來有著碩大無朋的潛力。

AI大模型與手機(jī)的結(jié)合方案有很多,但個人認(rèn)為,二者的最佳結(jié)合點其實是很明確的,那就是無障礙能力。

AI大模型的核心功能之一,就是在圖像、音頻、文字幾種不同的媒介間進(jìn)行轉(zhuǎn)換,而這恰好也是視障、聽障人群最為需要的。因此,當(dāng)有人認(rèn)為AI大模型與手機(jī)結(jié)合并不必要時,我會說看看無障礙能力的長足進(jìn)展就能知道,AI手機(jī)必有未來。

通過與很多聽障、視障朋友的交流,以及對相關(guān)機(jī)構(gòu)的采訪,發(fā)現(xiàn)大家都希望實名表揚(yáng)華為和vivo。早些年普遍認(rèn)為蘋果的無障礙能力很好,但現(xiàn)在已經(jīng)是華為和vivo在引領(lǐng)端側(cè)無障礙能力的發(fā)展,尤其是AI時代的無障礙升級。

比如說,vivo通過AI技術(shù)為聽障、視障人群和老年人提供了一系列幫助。去年,vivo的“手語翻譯官”軟件獲得了CCL2024手語數(shù)字人翻譯質(zhì)量評測第一名。今年,vivo還升級了“手語學(xué)習(xí)”功能,推動手語的教育普及。

鴻蒙系統(tǒng)的發(fā)展,每一步都伴隨著對端側(cè)無障礙事業(yè)的大力投入。比如HarmonyOS 4就推出了助聽器直連功能。在華為開發(fā)者大會2023期間,推出了能幫助視障人群識別具體場景與物品的小藝看世界。而在今年,HarmonyOS NEXT則在業(yè)界率先推出了小藝聲音修復(fù)功能,它利用AI技術(shù)對語言障礙者的聲音進(jìn)行實時分析、修復(fù)和優(yōu)化,不僅能夠發(fā)出可懂音,還能盡可能保留用戶音色。這個功能專為四級和三級言語障礙人群設(shè)計,可以實現(xiàn)無需文本輸入的聲音修復(fù),極大拓展了端側(cè)無障礙能力的邊界。

對于很多用戶來說,手機(jī)里的AI能力或許是錦上添花,但對于有障礙群體來說,AI手機(jī)或許就是改變生活乃至生命的鑰匙。

僅為此,AI也必須在手機(jī)中存在,壯大,盛放。

回顧一下手機(jī)廠商推進(jìn)的AI能力,會發(fā)現(xiàn)其實每一步都還有很青澀的地方。如果我們愿意承認(rèn)二者結(jié)合的復(fù)雜性,那么AI手機(jī)的果子可能還真不太保熟。

如果手機(jī)只提供AI能力,那么廠商會面臨與應(yīng)用開發(fā)者的直接競爭。而應(yīng)用開發(fā)者包括互聯(lián)網(wǎng)巨頭與專業(yè)的AI廠商,手機(jī)廠商的技術(shù)能力與用戶號召力可能并不具有說服力。

于是,手機(jī)廠商希望押注智能體這樣的突破性體驗,但目前階段這類體驗還有待打磨和升級。很多時候,用戶給智能體下達(dá)的指令需要反復(fù)確認(rèn),效率還不如直接點滑,而AI接管音頻等能力則不確定性更大。面對經(jīng)常出錯的,且應(yīng)用范圍不廣的智能體,用戶的耐心與信任或許會快速枯竭。

更為重要的是,這類前沿能力還不足以影響消費(fèi)者的核心決策。AI手機(jī)大概率會導(dǎo)致手機(jī)市場短期向好,但還沒到能夠逆轉(zhuǎn)持續(xù)走低趨勢的程度。

再向上一層則比較務(wù)虛。意圖識別、主動服務(wù)、服務(wù)找人等口號,眾多手機(jī)廠商都喊了很多年。但真實情況是,最先進(jìn)的大模型也無法預(yù)測人的想法。消費(fèi)者對AI手機(jī)的期待是科幻電影里全能的個人助理。廠商為了促銷,也會在話術(shù)中將AI手機(jī)進(jìn)行包裝和夸大,但最終在可見的范圍內(nèi),手機(jī)行業(yè)只能一次次與消費(fèi)者的預(yù)期違背。

頂著這些壓力,AI手機(jī)還在趕路的途中。從技術(shù)體驗的角度,它確實還不足以帶來顛覆,但從產(chǎn)業(yè)發(fā)展的角度,AI大模型與手機(jī)結(jié)合是一個絕佳的戰(zhàn)略機(jī)遇。海外大模型進(jìn)不來,谷歌另辟蹊徑,蘋果龜速發(fā)展。AI之于中國手機(jī),多少有了點天命在身的意味。

這是一個前所未有的局面,即使果子還沒熟透。對于大多數(shù)消費(fèi)者,也不妨像《鄉(xiāng)村愛情》里謝永強(qiáng)經(jīng)常說的那樣——“我得去果園看看”。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-12-03
AI在手機(jī)里結(jié)出了果
AI在手機(jī)里結(jié)出了果

長按掃碼 閱讀全文