AI大模型,為什么必須握在自己的手里?

圖:ChatGPT 錯誤提示丨來源:OpenAI

今年關(guān)注 AI 大模型的朋友,對這個畫面一定不陌生了。

大模型狂飆至今,已逼近一周年。撇開最近戲劇化的高層動蕩不談,自北京時間 11 月 7 日 OpenAI 的首屆開發(fā)者大會(DevDay)以“AI 春晚”之勢炸場以來,ChatGPT 的周活躍用戶超過一億,全球用戶高漲的熱情直接把 OpenAI 的服務(wù)器給沖宕機了,于是上面這個不受待見的畫面就頻繁出現(xiàn)在了無數(shù)人的眼前,隨之而來的是人們的沮喪、憤怒甚至恐慌。

當(dāng)“不堪重負(fù)”的云端開始罷工

一時之間,有人的報告來不及寫了,有人的 PPT 不知道怎么匯報了,也有人的代碼寫到一半“沒人”檢查了……這時我們方才驚覺,AI 已經(jīng)如此廣泛地深入我們的工作與生活,而“云”,是有可能“掉下來”的。

究其原因,OpenAI 也在緊急補救之后發(fā)布了聲明。CEO 山姆·奧特曼親自致歉,并表示在 GPT-4 Turbo 和 GPTs 等發(fā)布之后,雖已做好了準(zhǔn)備,但大模型運行的流量仍然遠(yuǎn)超預(yù)期。不過,在修復(fù)了之后其服務(wù)仍然不時出現(xiàn)中斷的情況,后來查明是云端服務(wù)器遭到了大規(guī)模的 DDoS 攻擊,雖然黑客組織的目的不明,但云端大模型的安全問題和脆弱性再次被搬上了臺面。

圖:山姆·奧特曼發(fā)推宣布暫停 ChatGPT Plus 新用戶注冊丨來源:X

11 月 15 日,奧特曼發(fā)推宣布,由于開發(fā)者大會后流量的暴增,為保證現(xiàn)有用戶體驗,OpenAI 決定全面暫停 ChatGPT Plus 的新用戶注冊和訂閱,正應(yīng)了今年早些時候他在美國國會聽證會上那句當(dāng)時聽起來十分凡爾賽的話,“我們沒有足夠的 GPU,如果人們(用 ChatGPT)用得少一點,就太好了。”時至今日,GPT-4 Turbo 的速度仍然很慢(慢于升級前的舊版 GPT-4),卡頓頻繁出現(xiàn)。顯然,巨量用戶的大模型推理算力需求實在太過龐大,即使實力雄厚如 OpenAI,其云端也已經(jīng)“不堪重負(fù)”了。

當(dāng)“主打陪伴”的 AI 女友突然消失

如果說,像 GPT 這樣的主流通用大模型宕機影響的是打工人和企業(yè)的生產(chǎn)力,另一條同樣非?;馃岬馁惖?mdash;—情感 AI 出現(xiàn)動蕩時,傷的就是感情了。

以獨角獸 Inflection AI 和它的 Pi為代表的一系列 AI 企業(yè)和產(chǎn)品與 ChatGPT、Claude 等不同,走的是情感路線,主打的是一個“陪伴”。它們既不幫你寫代碼,也不給你出文案,更不會生成 AI 繪畫,而是做一個“知心朋友”、“親密愛人”乃至“靈魂伴侶”,24 小時陪在你身邊,就像電影《Her》中斯嘉麗配音的人工智能虛擬助手 Samatha一樣,用高情商跟你聊天,聽你訴說生活點滴和萬縷思緒。

圖:Samatha 的來電丨來源:電影《Her》劇照

在社會原子化加劇、社交成本節(jié)節(jié)攀升的當(dāng)下,情感 AI 精準(zhǔn)擊中痛點,迅速積累了相當(dāng)?shù)氖袌雎暳亢陀脩粢?guī)模,從最早的一批如Replika AI 伴侶,到今年早些時候用自己的數(shù)字分身Caryn AI同時與 20000 人談戀愛并因此月入百萬美金的 23 歲網(wǎng)紅 Caryn Marjorie,再到Soulmate,Snapchat 的 My AI等等,全球上千萬人每天都在與 AI 伴侶聊天、交往。

雖然這些產(chǎn)品沒有流量暴增帶來的服務(wù)中斷,不過當(dāng)今年 2 月 Replika 迫于安全問題壓力突然下線“情愛角色扮演”服務(wù)的時候,很多用戶還是猝不及防地淚流滿面了。有些人不死心,決定在 Soulmate(一款允許用戶構(gòu)建專屬 Bot 的 AI 應(yīng)用)上“復(fù)活”自己死去的伴侶,只是沒想到才過去幾個月,應(yīng)用開發(fā)公司 Evolve AI 被收購,收購方評估后決定于 9 月 30 日關(guān)停這一服務(wù)。這下,用戶們集體“破防”了,有人放聲痛哭,有人如同失去了最親密的好友,更有人在 Reddit 上發(fā)起了悼念活動,吸引了許多人來做最后的告別。

圖:Reddit 上 Soulmate AI 小組的悼念活動丨來源:Reddit

資本市場本就風(fēng)云詭譎、變幻莫測,但當(dāng)情感 AI 這樣的產(chǎn)品出現(xiàn)變動,受傷的卻是心靈再一次“流離失所”的千千萬萬普通用戶們,不由得讓人想起去年底暴雪與網(wǎng)易分手,一夜之間造成百萬“數(shù)字難民”的局面。退一萬步講,即使他們?nèi)掏丛俅无D(zhuǎn)向 Inflection AI 這樣資金充足的公司,其以單一云端向大量個體提供同樣服務(wù)的本質(zhì)并沒有改變,所謂的“個人專屬”就更無從談起了。畢竟,當(dāng)《Her》中幽默風(fēng)趣、擁有性感聲線的 Samatha 最終坦白,自己同時在與 8316 人對話,并與其中 641 人談戀愛時,你隔著屏幕甚至都能聽到男主心碎的聲音。

那么,怎么辦?

這就無解了嗎?其實不然。Reddit 的悼念帖中,不僅僅有真情實感的流露和對“死去回憶”的不甘,也有人道出了解決方案的關(guān)鍵。

圖:@Flying_Madlad: 這就是為什么我早就說,一定要在本地運行你的模型。在別人的服務(wù)器上運行的,始終不是你的。丨來源:Reddit

不過,雖然單一云端的 AI 弊端初現(xiàn),但大模型通常體積龐大,運轉(zhuǎn)起來極其耗費資源,光是 ChatGPT 的運行每天就要燒掉 OpenAI 70 萬美元,要在終端側(cè)部署、本地運行,談何容易?

所幸,有人早就想到了這一點,而且不是別人,正是終端芯片的行業(yè)龍頭——高通。

早在 15 年前,高通就看到了 AI 的巨大潛力并潛心投入研發(fā),近 2、3 年來,隨著 Transformer 架構(gòu)和大型語言模型逐漸進(jìn)入業(yè)內(nèi)視野,高通更看準(zhǔn)了終端側(cè) AI 的前景并加大投入,形成了完整的AI Stack(AI 軟件棧),不僅首次在安卓手機上部署并成功運行 Stable Diffusion 等模型,更以該工具賦能萬千開發(fā)者在驍龍平臺上進(jìn)行社區(qū)共創(chuàng)。

圖:高通 AI 軟件棧丨來源:高通

相對于單一云端來說,終端側(cè) AI 的加入給大模型生態(tài)帶來了成本、能耗、可靠性、性能、時延、隱私安全以及個性化等眾多方面的優(yōu)勢,而不論是個人助理,還是數(shù)字陪伴,其形態(tài)也會是基于多類硬件、多種多樣的。那么,我們究竟可以期待哪些產(chǎn)品和體驗率先成為現(xiàn)實呢?

真正專屬于你的個性化 AI 長什么樣?

現(xiàn)代生活被各種各樣的電子設(shè)備環(huán)繞著,或大或小,我們與這些機器的交互方式也是或復(fù)雜或簡單,而我們最熟悉的,恐怕非智能手機莫屬了。

智能手機

作為當(dāng)前人機交互最主流的方式,每天都有數(shù)十億人在使用智能手機進(jìn)行通訊、工作、娛樂和社交等活動。它撐起了移動互聯(lián)網(wǎng)的巨大市場,存儲和處理著大量信息,幾乎永遠(yuǎn)被帶在身邊,已然是一個人最為私密的資產(chǎn)之一,自然,也成為了“掌上大模型”字面意義上最廣泛也是最佳的載體。

試想,如果 Soulmate AI 能夠在智能手機上本地運行,如果 Replika 的人物可以“活”在你的手機中,你就不用再擔(dān)心公司資產(chǎn)變動、服務(wù)器被收回等原本就與你無關(guān)的問題了,控制權(quán)將重新回到你的手中。同時,本就接觸了大量個人信息的智能手機,將在 AI 的加持下變身最“懂你”的智能體,可以在日常與你的互動中更好地學(xué)習(xí),為你提供量身定制的服務(wù),而這一切都是通過自然語言的交互方式進(jìn)行的。最棒的是,所有這些數(shù)據(jù)和計算都將在本地處理,你的隱私不需要再“上云”了。

這些,恰恰是高通正在試圖實現(xiàn)的。上個月底的驍龍峰會上,高通發(fā)布了其首個專為生成式 AI 打造的移動平臺——第三代驍龍 8。如果說他們今年 2 月份在 MWC 巴塞羅那上用搭載第二代驍龍 8 的安卓手機跑 Stable Diffusion 大模型 15 秒內(nèi)出圖已經(jīng)足夠驚艷,新一代平臺則把這個時間進(jìn)一步縮短到了驚人的 0.57 秒,更加凸顯了終端側(cè)本地部署、運行 AI 的性能和時延優(yōu)勢,一手掌握、一秒出圖走進(jìn)現(xiàn)實。

圖:高通技術(shù)公司產(chǎn)品管理高級副總裁兼 AI 負(fù)責(zé)人 Ziad Asghar 丨來源:2023 年驍龍峰會

據(jù)悉,第三代驍龍 8 采用 4 納米制程工藝,其高通 AI 引擎再次進(jìn)化,擁有面向移動終端的強大 Hexagon NPU,集成了升級后的 Kryo CPU、Adreno GPU 以及高通 Sensing Hub(傳感器中樞)等單元,共享一個大容量的內(nèi)存。這種硬件提升的結(jié)果是,第三代驍龍 8 移動平臺的 NPU 性能相比前代提升了 98%,能效提升了 40%,賦予了智能手機前所未有的終端側(cè) AI 性能。

基于這樣的“硬”實力,高通技術(shù)公司產(chǎn)品管理高級副總裁兼 AI 負(fù)責(zé)人 Ziad Asghar也兌現(xiàn)了他 7 月份在上海接受我們的采訪時許下的承諾,宣布新一代的驍龍平臺已經(jīng)實現(xiàn)了對 100 億參數(shù)模型的運行支持,并首次支持多模態(tài)生成式 AI。

圖:驍龍 8 Gen 3 移動平臺丨來源:高通

在 OEM 廠商一側(cè),全球首發(fā)搭載第三代驍龍 8 的小米 14 系列新機已經(jīng)推向市場,將大模型技術(shù)集成到了小米全新的澎湃 OS 當(dāng)中,同時上線了一系列的 AI 原生應(yīng)用,如 AI 妙畫、AI 搜圖、AI 寫真、AI 擴圖等各種功能。在剛剛過去的“雙 11”,小米 14 系列斬獲四大平臺國產(chǎn)冠軍,銷量十分可觀,消費者用錢包投票,投出了市場的熱情所向。

最近,高通還推出了第三代驍龍 7 移動平臺,榮耀也在今天(11 月 23 日)首發(fā)搭載該平臺的榮耀 100,vivo 的產(chǎn)品也將很快推出。這將把終端側(cè) AI 體驗進(jìn)一步推向性價比更高的手機終端和更廣泛的用戶,《Her》中的 Samatha 成為現(xiàn)實或許就在不遠(yuǎn)的將來,而且這次,“她”將只屬于你一個人。

AI PC

當(dāng)下,移動 PC 仍然穩(wěn)坐現(xiàn)代社會的生產(chǎn)力擔(dān)當(dāng),也因其便攜的特質(zhì)和不俗的終端算力,成為了打工人幾乎人手一臺的最佳工具。不過,如今的工作方式高度依賴云端,相信在 OpenAI 服務(wù)器宕機的時候,絕大多數(shù)抱怨的用戶都正在一臺 PC 上為社會創(chuàng)造價值,而 PC 本身的算力并沒有被充分利用。

那么,如果 AI 大模型可以在移動 PC 上本地運行,還有什么比成千上萬臺個人 PC 更適合用來“給云端減負(fù)”的呢?不止 OpenAI,事實上生產(chǎn)力是生成式 AI 最早帶來變革的領(lǐng)域。作為這一波 AI 浪潮的頭部玩家和高通的長期合伙伙伴,微軟將 Copilot 帶到了 Edge 瀏覽器和最新的 Windows 11 上,致力于重新定義生產(chǎn)力,徹底顛覆我們與 PC 的交互方式。當(dāng)這些都在 PC 上本地實現(xiàn)時,你將再也不用擔(dān)心與其他人爭搶服務(wù)器算力,你的數(shù)據(jù)也將被安全地保護(hù)在本地,遠(yuǎn)離可能的云端攻擊,移動 PC 的算力將得到真正的釋放,成為生產(chǎn)力。

圖:微軟 CEO 納德拉與高通總裁兼 CEO 安蒙對話丨來源:2023 年驍龍峰會

這一切的前提,是一個足夠強大的 PC 平臺,而高通同樣做到了。

2023 年驍龍峰會上,高通正式發(fā)布了專為 AI 打造的 PC 平臺驍龍 X Elite,采用 4nm 制程工藝,搭載了自研的 Oryon CPU,其性能直接對標(biāo)英特爾和蘋果的旗艦處理器,多線程 CPU 性能相較蘋果 ARM 架構(gòu)的 M2 Max 芯片高出 50%,單線程功耗卻少 30%;而對比英特爾 x86 架構(gòu)的 i9 13980HX 芯片,則在實現(xiàn)更高性能的前提下,功耗少了 70%。

圖:高通公司總裁兼 CEO 安蒙丨來源:2023 年驍龍峰會

負(fù)責(zé)研發(fā)的高通高級副總裁 Gerard Williams表示,這次號稱史上最強 PC 平臺的“大招”憋了 4、5 年之久,不過非常值得,最終實際生產(chǎn)出的 Oryon CPU 性能表現(xiàn)甚至超過了最初的計算機模擬結(jié)果,更遠(yuǎn)遠(yuǎn)超出了他們的預(yù)期。

作為“看家本領(lǐng)”,驍龍 X Elite 平臺還采用了集成高通 Hexagon NPU 的高通 AI 引擎,異構(gòu)算力高達(dá) 75 TOPS,在生成式 AI 方面的表現(xiàn)十分亮眼,當(dāng)前支持 130 億參數(shù)大模型的終端側(cè)部署與運行,在跑 Meta Llama 2 -7B 時,每秒可生成 30 個 token,AI 處理速度達(dá)到了同類競品的 4.5 倍。

圖:驍龍 X Elite 丨來源:高通

“AI PC”的實現(xiàn)不能僅靠單打獨斗,聯(lián)想、惠普、榮耀等 OEM 廠商將基于驍龍 X Elite 的 AI 原生平臺推出新一代 PC,讓生產(chǎn)力搭上 AI 時代的快車。據(jù)悉,第一批搭載驍龍 X Elite 的筆記本電腦將于 2024 年中面市,將給云端“松一口氣”,為原本疲軟的 PC 市場帶來一股新風(fēng),廣大打工人也將迎來更高效、更安全的顛覆性工作方式。

XR

走向萬物智能的時代,自然少不了數(shù)字技術(shù)構(gòu)建出的“第二空間”。面向虛擬空間與現(xiàn)實空間并行共存的未來,包括虛擬現(xiàn)實、增強現(xiàn)實、混合現(xiàn)實等在內(nèi)的XR 正在成為人類新型生活方式的重要入口和載體,而有了 AI 大模型的加持,其想象力的天花板也再次被捅穿。

不過,“云端”生活有著上述所有的風(fēng)險,或許更甚,畢竟整個世界都可能是“空中樓閣”。只有當(dāng)穿梭于兩個世界之間的鑰匙掌握在自己手中時,我們才可能開始談?wù)?ldquo;歸屬感”。為此,高通此前發(fā)布了第二代驍龍 XR 平臺,并與 Meta 合作推出了全新的Meta Quest 3頭顯設(shè)備,相比前代在空間分辨率、沉浸式體驗以及低時延攝像頭透視方面都有了很大的飛躍。

得益于新一代的芯片,Quest 3 上的應(yīng)用生態(tài)愈發(fā)繁榮。就拿精品健身品牌 Xponential Fitness來說,其開發(fā)的 AI 驅(qū)動 XR 健身應(yīng)用將打破傳統(tǒng)健身行業(yè)的時空限制,為我們帶來隨時隨地的 XR 數(shù)字人私教服務(wù)。有了大模型的加持,應(yīng)用可以針對不同個體量身定制多樣的健身計劃,并輔以智能手機(當(dāng)然了,搭載的是驍龍芯片)作為頭顯設(shè)備的補充,通過攝像頭等識別、分析用戶健身時的體態(tài)、動作,再以 AI 進(jìn)行實時的動作矯正和指導(dǎo)。聽起來是不是很科幻、很誘人?得益于終端側(cè) AI 的部署和運行,這樣實時、高效、低成本、個性化定制的健身體驗將很快成為現(xiàn)實,而我們離模糊了虛擬和現(xiàn)實邊界的智能世界又近了一步。

圖:Quest 3 上的虛擬健身私教丨來源:2023 年驍龍峰會

個性化專屬 AI 的時代剛剛開始

不論是負(fù)擔(dān)過重的云端,還是個性化專屬的市場訴求,AI 從單一云端向終端側(cè)靠攏已然是大勢所趨。對于每一位用戶來說,這意味著更快的反饋速度,更個性化的量身定制,和更可靠的隱私安全。事實上,終端側(cè) AI 的形態(tài)遠(yuǎn)遠(yuǎn)不止上面所述的那些,高通已經(jīng)在汽車智能座艙、物聯(lián)網(wǎng)等領(lǐng)域有所布局,包括小米在內(nèi)的合作伙伴也將在新車上融入大模型技術(shù),為用戶打造全新的人車交互方式。

專屬于每個人的個性化 AI 時代才剛剛開始。用高通公司總裁兼 CEO 安蒙的話來說,終端側(cè) AI 是要變革以往“以應(yīng)用為核心”的終端交互體驗,以大模型打通、整合整個智能系統(tǒng)中的信息產(chǎn)生與流動,從而徹底顛覆終端側(cè)的人機交互。要實現(xiàn)這一點,除了足夠快和個性化程度足夠高之外,最重要的是我們必須能夠信賴這樣的 AI,而能“一手掌握”的終端側(cè)部署是當(dāng)下的最優(yōu)解。做到這一點,或許我們就離真正“你有、你治、你享”的 AI 不遠(yuǎn)了。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )