2月24日消息,盡管投資者曾一度產(chǎn)生疑慮,但來自大型科技企業(yè)、各國政府以及風投機構的巨額資金正以前所未有的速度流入人工智能領域。要理解這一現(xiàn)象背后的原因,關鍵在于洞察人工智能技術本身的演進趨勢。
當前,人工智能技術正從傳統(tǒng)的大語言模型向推理模型和AI代理轉變。傳統(tǒng)的大語言模型,即多數(shù)免費人工智能聊天機器人所使用的模型,其訓練過程需要消耗龐大的電力和計算時間。然而,隨著技術的進步,我們正在迅速找到方法,在用戶調(diào)用這些模型時減少其運行所需的資源。與之不同,基于大型語言模型的推理模型,其實際運行過程消耗的計算和電力資源是傳統(tǒng)模型的數(shù)倍。
自OpenAI于2024年9月發(fā)布其首款推理模型o1以來,人工智能公司紛紛加速推出能與之抗衡的系統(tǒng)。這其中包括DeepSeek R1,它震撼了整個人工智能行業(yè),并讓許多科技和能源企業(yè)的估值出現(xiàn)波動。上周,埃隆·馬斯克(Elon Musk)旗下人工智能初創(chuàng)公司xAI也推出了其推理模型Grok 3。
DeepSeek的推出之所以引發(fā)了一定程度的恐慌,是因為它證明了人工智能模型可以以更低的成本進行訓練,這可能會削減對數(shù)據(jù)中心和昂貴先進芯片的需求。然而,DeepSeek實際上推動了人工智能行業(yè)更堅定地邁向資源密集型的推理模型,這意味著計算基礎設施的需求依然十分強勁。
鑒于推理模型具備更強大的能力,它們可能很快成為人們使用人工智能執(zhí)行多種任務時的默認方式。OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)曾表示,該公司人工智能模型的下一次重大升級將包含高級推理能力。
那么,為何推理模型及其相關產(chǎn)品(如“深度研究”工具和AI代理)需要如此多的算力資源?答案在于它們的工作原理。
英偉達人工智能產(chǎn)品管理副總裁卡里·布里斯基(Kari Briski)在最近一篇博客中解釋稱,人工智能推理模型消耗的算力資源,通常是傳統(tǒng)大語言模型的100倍以上,這是因為推理模型在“思維鏈”中需要長時間與自己對話,而這些推理過程用戶往往看不見。模型消耗的算力資源與其生成的詞匯量成正比,因此,如果推理模型生成的詞匯量是常規(guī)模型的100倍,那么它也將消耗相應的電力和算力資源。
當推理模型接入互聯(lián)網(wǎng)時,如谷歌、OpenAI和Perplexity的“深度研究”模型所做的那樣,資源消耗會更多。這些模型對算力資源的需求還只是開始。對此,谷歌、微軟和Meta計劃在2025年總共投入至少2150億美元用于資本支出,其中大部分將用于建設人工智能數(shù)據(jù)中心。這標志著他們的資本支出較去年增長了45%。
今年1月,隨著中國AI模型DeepSeek R1的發(fā)布,每token的算力成本(包括電力與硬件支出)似乎將迎來斷崖式下降。DeepSeek通過論文證明,其AI模型的訓練與部署效率遠超美國AI實驗室此前公開的方法。
表面上看,這似乎預示著人工智能未來對算力資源的需求將大幅降低,可能只有當前需求的十分之一,甚至更少。但隨著推理模型的問世,當它們回答查詢時對算力資源的需求可能會大幅增加。簡而言之,若基于DeepSeek技術的新型高效模型將AI算力需求削減至十分之一,而推理模型的普及使其使用需求激增100倍,未來整體算力需求仍將凈增10倍。
而這只是起點。隨著企業(yè)發(fā)現(xiàn)新型人工智能模型的能力更強,它們會越來越頻繁地調(diào)用這些模型,這使得對算力資源的需求從模型訓練轉向模型使用,即人工智能行業(yè)所稱的“推理”。
為其他公司提供人工智能算力資源的Baseten公司首席執(zhí)行官圖欣·斯里瓦斯塔瓦(Tuhin Srivastava)表示,這種向推理需求的轉變已在進行中。他的客戶包括在應用程序和服務中使用人工智能的科技公司,如允許內(nèi)容創(chuàng)作者通過轉錄編輯音頻和視頻的Descript,以及處理醫(yī)療記錄的初創(chuàng)公司PicnicHealth。
斯里瓦斯塔瓦稱,隨著客戶自身產(chǎn)品需求的快速增長,他們發(fā)現(xiàn)需要更多的人工智能處理能力。他補充道:“六個月前,我們幫助一位客戶將算力資源需求降低了60%,但僅僅三個月后,他們的算力消耗已反超原水平。”
OpenAI、谷歌和Meta等公司仍在競相訓練能力更強的人工智能模型。無論成本多高,它們的目標都是盡可能搶占尚處萌芽階段的人工智能市場。Fractional AI首席執(zhí)行官克里斯·泰勒(Chris Taylor)表示:“我認為,尖端實驗室很可能需要持續(xù)投入巨額資金以推動前沿技術的發(fā)展。”他的公司,如同Baseten及蓬勃發(fā)展的人工智能生態(tài)系統(tǒng)中的許多其他企業(yè),依賴這些尖端模型為客戶提供服務。
風險投資家、Theory Ventures創(chuàng)始人托馬斯·通古茲(Tomasz Tunguz)預測,未來幾年,新的創(chuàng)新和更多人工智能專用微芯片可能使得人工智能系統(tǒng)比今天更高效,或使終端系統(tǒng)效率提升千倍。投資者和大型科技公司押注的是,在未來十年內(nèi),由于推理模型的普及和快速采用,對人工智能模型的需求可能會急劇增長。
通古茲表示:“你每一次鍵盤敲擊,或對著麥克風說的每一個音節(jié),每個操作節(jié)點都將由至少一個AI系統(tǒng)實時處理?!比绻媸沁@樣,他補充道,人工智能市場的規(guī)模可能很快會比現(xiàn)在擴大1000倍。(小?。?/p>
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )