10月31日,在2023云棲大會(huì)上,百川智能創(chuàng)始人兼CEO王小川分享了百川智能在大模型時(shí)代的思考與實(shí)踐。日前,百川推出全球最長(zhǎng)上下文窗口大模型Baichuan2-192K引發(fā)媒體關(guān)注。王小川介紹,百川成立僅半年便發(fā)布了7款大模型,快速迭代背后離不開云計(jì)算的支持。
2023年4月,搜狗公司原CEO王小川官宣創(chuàng)辦AI大模型公司“百川智能”,此后百川短短數(shù)月便躋身科技獨(dú)角獸行列。尤其令人矚目的是,僅半年時(shí)間,百川先后發(fā)布7款基礎(chǔ)大模型,研發(fā)速度遠(yuǎn)超行業(yè)水平,且開源模型表現(xiàn)優(yōu)異。今年8月底,百川更是率先通過國(guó)家《生成式人工智能服務(wù)管理暫行辦法》備案,是首批公司中唯一一家今年成立的大模型公司。
王小川認(rèn)為,大模型浪潮將超越外界之前所有的想象,技術(shù)大爆炸正在發(fā)生,人類已步入通用人工智能時(shí)代。2018年,王小川便提出,“機(jī)器掌握語(yǔ)言,通用人工智能時(shí)代就來了?!彼J(rèn)為,語(yǔ)言代表認(rèn)知世界的邊界,大模型一旦掌握了語(yǔ)言的規(guī)律,就意味著掌握了語(yǔ)言背后的知識(shí)、思考、溝通和文化。在智能時(shí)代,就像互聯(lián)網(wǎng)時(shí)代的芯片提供信息化基礎(chǔ)一樣,大模型會(huì)在社會(huì)各個(gè)方面起到“點(diǎn)亮智能”的作用。
但客觀而言,國(guó)內(nèi)大模型的發(fā)展與“不計(jì)成本登月”的OpenAI還存在差距。王小川表示,國(guó)內(nèi)大模型的現(xiàn)狀是“理想上慢一步,落地上快三步”。雖然在技術(shù)創(chuàng)新和技術(shù)理想上美國(guó)有所領(lǐng)先,但是中國(guó)的應(yīng)用落地能力更強(qiáng)。百川擁有經(jīng)驗(yàn)豐富的搜索團(tuán)隊(duì),過去成功打造過基于語(yǔ)言模型的超級(jí)應(yīng)用,且擁有經(jīng)過市場(chǎng)驗(yàn)證的技術(shù)、產(chǎn)品、商業(yè)化能力,團(tuán)隊(duì)掌握的搜索技術(shù)可以助力大模型研發(fā),且能補(bǔ)齊大模型在幻覺等問題上的短板。
通過結(jié)合過去經(jīng)驗(yàn)和技術(shù)積累“小步快跑”,百川目前已成為中國(guó)大模型創(chuàng)業(yè)公司引領(lǐng)者之一。百川開源大模型總下載量3個(gè)月突破600萬次,Baichuan2在通用及垂直領(lǐng)域均達(dá)到領(lǐng)先水平,中英文表現(xiàn)超過LLaMA2。10月30日最新發(fā)布的Baichuan2-192K更是成為全球支持最長(zhǎng)上下文窗口的大模型,一次可輸入35萬字,全面領(lǐng)先Claude2-100K。
除了團(tuán)隊(duì)、經(jīng)驗(yàn)等優(yōu)勢(shì)外,百川實(shí)現(xiàn)平均每月迭代一款模型的另一重要原因是云計(jì)算的支撐。王小川介紹,模型的快速迭代和部署離不開云計(jì)算,百川智能和阿里云作為緊密的合作伙伴,在模型預(yù)訓(xùn)練和模型部署等方面進(jìn)行了深入合作。在雙方的共同努力下,百川很好地完成了千卡大模型訓(xùn)練任務(wù),有效降低了模型推理成本,提升了模型部署效率。
百川的開源模型在阿里云的魔搭社區(qū)上也吸引了大量的開發(fā)者,借助社區(qū)的力量,開發(fā)者們?cè)诎俅ù竽P偷幕A(chǔ)上針對(duì)眾多垂直領(lǐng)域進(jìn)行微調(diào),并將其能力集成到各類AI應(yīng)用,極大豐富了國(guó)內(nèi)的大模型生態(tài)。
王小川表示,未來,百川智能將與阿里云持續(xù)深入合作,攜手探索更前沿的大模型技術(shù)創(chuàng)新,推動(dòng)大模型落地到更豐富的應(yīng)用場(chǎng)景,共同助力大模型生態(tài)更加繁榮。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- ?新一代核心系統(tǒng)全面上線!中華財(cái)險(xiǎn)與阿里云達(dá)成數(shù)智化升級(jí)新合作
- 阿里云通過信通院首批企業(yè)用云治理能力成熟度評(píng)測(cè)
- 2025年云預(yù)測(cè):傳統(tǒng)漏洞、人工智能增長(zhǎng)和邊緣繁榮
- 云遣返:工作負(fù)載分配的關(guān)鍵戰(zhàn)略考慮因素
- 告別加班!華為云推薦數(shù)智員工“入職”會(huì)無憂
- 阿里云支持疊紙新游《無限暖暖》全球多平臺(tái)開服!
- Gartner:到2027年,90%的企業(yè)機(jī)構(gòu)將采用混合云
- Gartner:到2025年,全球公有云終端用戶支出將達(dá)到7230億美元
- AI熱潮推動(dòng)全球云計(jì)算市場(chǎng)增長(zhǎng),Q3支出增長(zhǎng)21%至820億美元
- 阿里云百煉上線百萬長(zhǎng)文本模型Qwen2.5 -Turbo,百萬tokens僅需0.3元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。