11月16日消息,針對近日零一萬物被質(zhì)疑完全使用 LLaMA 架構(gòu),只對兩個張量(Tensor)名稱做修改,李開復(fù)在朋友圈進行了回應(yīng)。
IT之家報道,李開復(fù)表示:“全球大模型架構(gòu)一路從 GPT2 --> Gopher --> Chinchilla --> Llama2 --> Yi,行業(yè)逐漸形成大模型的通用標(biāo)準,就像做一個手機 App 開發(fā)者,不會去自創(chuàng) iOS、Android 以外的全新基礎(chǔ)架構(gòu)。01.AI 起步受益于開源,也貢獻開源,從社區(qū)中虛心學(xué)習(xí),我們會持續(xù)進步?!?/p>
創(chuàng)新工場董事長兼 CEO 李開復(fù)于 2023 年創(chuàng)辦了 AI 大模型創(chuàng)業(yè)公司“零一萬物”,該公司已推出 Yi-34B 和 Yi-6B 兩個開源大模型,號稱對學(xué)術(shù)研究完全開放,同步開放免費商用申請。
然而在 Yi-34B 的 Hugging Face 開源主頁上,開發(fā)者 ehartford 質(zhì)疑稱該模型使用了 Meta LLaMA 的架構(gòu),只對兩個張量(Tensor)名稱進行了修改,分別為 input_layernorm 和 post_attention_layernorm。
零一萬物開源團隊總監(jiān) Richard Lin 回應(yīng)稱,這一命名問題是開發(fā)人員疏忽導(dǎo)致,開發(fā)人員在代碼中進行了幾次重命名,以滿足實驗要求。但是開發(fā)人員“忘記將張量名稱修改回 LLaMA”,開發(fā)人員對此感到抱歉。
值得一提的是,原阿里首席 AI 科學(xué)家賈揚清吐槽國內(nèi)某一新模型中用的其實是 LLaMA 架構(gòu),僅在代碼中更改了幾個變量名引發(fā)網(wǎng)絡(luò)熱議。在被指大模型回應(yīng)并發(fā)布訓(xùn)練模型過程后,賈揚清最新發(fā)文,表示開源領(lǐng)域“魔改”要不得。
15日,零一萬物官方對 Yi-34B 訓(xùn)練過程進行了說明,表示大模型持續(xù)發(fā)展與尋求突破口的核心點不僅在于架構(gòu),而是在于訓(xùn)練得到的參數(shù)。
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設(shè)智信普惠科技公司,布局多領(lǐng)域技術(shù)服務(wù)
- 馬化騰短暫登頂中國富豪榜,騰訊科技與股價雙輪驅(qū)動成關(guān)鍵
- 本地生活賽道:2025年紅海變“血?!?,平臺競逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復(fù)接收中國包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對美股市場造成新一輪打擊
- 谷歌股價暴跌:收入增長放緩,人工智能支出引投資者擔(dān)憂
- 華為去年銷售收入超8600億元:ICT基礎(chǔ)設(shè)施穩(wěn)健,新業(yè)務(wù)快速發(fā)展
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。