伯克利團隊以30美元復制DeepSeek AI的核心功能,推出開源項目TinyZero,證明AI研究不再是高成本領域,降低了進入門檻,推動了更廣泛的技術應用。
人工智能研究通常是巨頭企業(yè)的專屬游戲,這些公司擁有深厚的財力支持。然而,伯克利加州大學的一支研究團隊卻打破了這一局面。他們僅以30美元復制了DeepSeek R1-Zero的核心功能。他們的項目名為TinyZero,證明先進的人工智能推理模型并不需要耗費巨額資金。更重要的是,人工智能研究比以往任何時候都更容易接近。
在Jiayi Pan的帶領下,該團隊旨在通過強化學習(Reinforcement Learning,RL)重新構建DeepSeek的推理模型。與依賴昂貴的云服務或巨大的計算能力不同,他們使用了一個基本的語言模型、一個簡單的提示和一個獎勵系統(tǒng)來訓練TinyZero。
Pan在X平臺上分享了他的興奮之情,表示:“你可以親身經歷那一刻,只需不到30美元?!彼€將TinyZero描述為第一個開源的推理模型復現(xiàn)項目,強調了它如何學會驗證和完善自己的答案。
如何開發(fā)TinyZero
為了測試模型,研究人員選擇了一個名為Countdown的游戲,玩家需要通過基本的數(shù)學運算來達到目標數(shù)字。盡管TinyZero最初是隨機猜測,但隨著時間的推移,它學會了驗證自己的答案、尋找更好的解決方案并相應地進行調整。
他們嘗試了不同規(guī)模的模型,從50億參數(shù)到700億參數(shù)。結果是什么?參數(shù)規(guī)模較小的模型(50億參數(shù))只是隨機猜測答案然后停止。而參數(shù)規(guī)模較大的模型(150億參數(shù)及以上)則學會了自我驗證、完善解決方案并顯著提高了準確率。
TinyZero真正引人注目的地方在于,與傳統(tǒng)的人工智能模型相比,它的成本低得驚人??纯催@些對比:
* OpenAI的API:每百萬tokens收費15美元
* DeepSeek-R1:每百萬tokens收費0.55美元
* TinyZero的總成本:一次性訓練成本30美元
這意味著任何人(不僅僅是大型科技公司)都可以在無需燒錢到破產的情況下實驗人工智能推理模型。
可用性
TinyZero是開源的,并且可以在GitHub上找到,因此任何人都可以嘗試改進它。盡管它目前僅在Countdown游戲中進行了測試,但潘佳乂希望這個項目能夠使強化學習研究更加普及。
當然,這仍然是一個早期階段?!爱斎?,其中一個缺點是,它僅在Countdown任務中得到了驗證,但尚未在一般推理領域中得到驗證。”Pan承認。但即便如此,其影響仍然是顯而易見的:人工智能的發(fā)展并不一定要昂貴。有了像TinyZero這樣的項目,低成本、開源的人工智能或許將成為未來的趨勢。
本文譯自 Gizmochina,由 BALI 編輯發(fā)布。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )