撰文 | 李信馬
編輯 | 楊博丞
題圖 | IC Photo
時隔近一個月之后,零一萬物再次發(fā)聲。
此前,由李開復創(chuàng)辦的AI獨角獸零一萬物,在11月6日正式發(fā)布了首款開源中英雙語大模型——Yi。
不過在原阿里技術副總裁、深度學習框架Caffe發(fā)明者賈揚清暗指某國內大廠新模型套殼LLaMA架構后,零一萬物受到波及,陷入了“套殼”風波。LLaMA是Meta創(chuàng)建的大語言模型,在今年7月發(fā)布并完全開源。曾有開發(fā)者表示,除了兩個張量被重命名外,Yi完全使用了LLaMA的架構 。
面對質疑,在11月15日,零一萬物官微發(fā)布了《零一萬物對 Yi-34B 訓練過程的說明》,其中提到“大模型持續(xù)發(fā)展與尋求突破口的核心點不僅在于架構,而是在于訓練得到的參數”。零一萬物在訓練模型過程中,沿用了GPT/LLaMA的基本架構,得以快速起步,對開發(fā)者也更友好。Yi-34B和Yi-6B模型則是零一萬物從0開始訓練的,并做了大量原創(chuàng)性的優(yōu)化和突破工作。
至于沿用LLaMA部分推理代碼經實驗更名后的疏忽,原始出發(fā)點是為了充分測試模型,執(zhí)行對比實驗,對部分推理參數進行了重新命名,并非為了刻意隱瞞。
圖片來源:零一萬物
今日,零一萬物對表示,公司內部經過幾個周的國際國內法律研判,已經確認完全不涉及套殼、抄襲,并給出了進一步的澄清。
Eric Hartford就是本次風波的起點之一,在Yi-34B開源發(fā)布后,他向官方發(fā)出郵件:“感謝你們提供了一個優(yōu)秀的模型。Yi模型使用了與LLaMA模型完全相同的架構,只是將兩個張量改了名字。由于圍繞LLaMA架構有很多投資和工具,保持張量名稱的一致性是有價值的?!?/p>
之后,零一萬物接受了Eric建議,很快在各開源平臺重新提交模型及代碼,完成了開源社區(qū)的版本更新。雖然依舊在國內引起了風波,但Eric卻自發(fā)且不遺余力為Yi辯護,并在X(twitter)上寫道:“他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構。架構是學術研究的產物,已經發(fā)表在論文中,任何人都可以自由使用,這絲毫不減損Yi團隊的成就。他們從零開始使用自己創(chuàng)建的數據集訓練Yi,對開源領域的貢獻是值得贊揚的?!?/p>
圖片來源:X
值得一提的是,選擇在一個月后再次發(fā)聲,還有一個原因是,近期零一萬物在多個榜單上憑實力 “揚眉吐氣”。
11月24日,Yi-34B-Chat微調模型開源上線,在斯坦福大學研發(fā)的大語言模型評測 AlpacaEval Leaderboard 中,Yi-34B-Chat以94.08%的勝率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT,成為經由Alpaca官方認證的,全球僅次GPT-4英語能力的大語言模型。
AlpacaEval Leaderboard排行榜(發(fā)布于2023年12月7日)
圖片來源:零一萬物
在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat也以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現追平GPT-3.5。而且,伯克利LMSYS ORG排行榜采用的是接近用戶體感的“聊天機器人競技場”特殊測評模式,讓眾多大語言模型在評測平臺隨機進行比試,通過眾籌真實用戶來進行線上實時盲測和匿名投票。LMSYS ORG 在12月8日官宣11月份總排行時評價:“Yi-34B-Chat 和 Tulu-2-DPO-70B 在開源界的進擊表現已經追平 GPT-3.5”。
LMSYS ORG榜單(發(fā)布于2023年12月8日)
圖片來源:零一萬物
在中文能力方面,11月底發(fā)布的《SuperCLUE中文大模型基準評測報告 2023》中 ,Yi-34B Chat迅速晉升到“卓越領導者”象限,在“SuperCLUE 大模型對戰(zhàn)勝率” 這項關鍵指標上,Yi-34B-Chat 取得31.82%的勝率,僅次于GPT4-Turbo。
中文SuperCLUE排行榜(發(fā)布于2023年11月28日)
圖片來源:零一萬物
目前,Yi模型在Hugging Face社區(qū)下載量為16.8萬,魔搭社區(qū)下載量1.2萬。在GitHub 獲得超過4900個Stars。多家知名公司和機構也推出了基于Yi模型基座的微調模型,比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型,南方科技大學和粵港澳大灣區(qū)數字經濟研究院認知計算與自然語言研究中心聯合發(fā)布的SUS-Chat-34B等,AMD和Hugging Face合作的GPU加速大模型的實驗中,也選擇了Yi-6B作為范例項目。
知名技術寫作者蘇洋表示,在他觀察的近期Hugging Face榜單中,前三十名有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的68B和70B模型的數量目前只留有幾個,“從這點看 Yi 對于開源生態(tài)的幫助還是非常巨大的。”
隨著新成就的不斷取得,和更多開發(fā)者與權威機構的認可,外界對零一萬物的質疑,想必也會逐漸平息。除了表現出的硬實力外,也期待,零一萬物能在應用落地方面,創(chuàng)造出更多的價值。
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調整區(qū)間
- 阿里巴巴于上海新設智信普惠科技公司,布局多領域技術服務
- 馬化騰短暫登頂中國富豪榜,騰訊科技與股價雙輪驅動成關鍵
- 本地生活賽道:2025年紅海變“血?!?,平臺競逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復接收中國包裹,貿易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對美股市場造成新一輪打擊
- 谷歌股價暴跌:收入增長放緩,人工智能支出引投資者擔憂
- 華為去年銷售收入超8600億元:ICT基礎設施穩(wěn)健,新業(yè)務快速發(fā)展
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。