全球熱議阿里千問(wèn)3:給開(kāi)源AI模型注入強(qiáng)行針

極客網(wǎng)·人工智能4月30日 近日,阿里正式推出全新開(kāi)源模型Qwen3(千問(wèn)3)。作為中國(guó)首個(gè)混合推理模型,其將“快思考”與“慢思考”集成于一體。面對(duì)簡(jiǎn)單需求時(shí),它能實(shí)現(xiàn)秒級(jí)響應(yīng);處理復(fù)雜問(wèn)題時(shí),可通過(guò)多步深度思考抽絲剝繭。這種創(chuàng)新設(shè)計(jì)能有效節(jié)省算力資源,為人工智能的應(yīng)用落地開(kāi)辟新路徑。 

從技術(shù)架構(gòu)來(lái)看,千問(wèn)3是混合專(zhuān)家模型(MoE,Mixture of experts),它將多個(gè)專(zhuān)業(yè)模型有機(jī)整合。在模型運(yùn)行過(guò)程中,會(huì)根據(jù)任務(wù)需求智能激活相關(guān)模型,實(shí)現(xiàn)“按需調(diào)用”,這種靈活機(jī)制極大提升了運(yùn)行效率。

數(shù)據(jù)顯示,在嚴(yán)苛的ArenaHard評(píng)測(cè)中,千問(wèn)3預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)36T,總參數(shù)量達(dá)235B,但實(shí)際激活僅需22B。憑借強(qiáng)大的“硬實(shí)力”,千問(wèn)3成功超越DeepSeek R1和OpenA Io1,與谷歌最新的Gemini 2.5-Pro性能處于同一梯隊(duì)。

Gppj9_kbEAAkO9U.jpg

更令人驚喜的是,千問(wèn)3在性能飛躍的同時(shí)大幅降低了部署成本。以往需要大量高端硬件才能實(shí)現(xiàn)的效果,如今僅需4張H20顯卡就能部署滿(mǎn)血版,顯存占用僅為同類(lèi)模型的三分之一。

此次千問(wèn)3模型家族陣容強(qiáng)大,一次性推出8款“混合推理”模型,涵蓋30B和235B兩款混合專(zhuān)家(MoE)模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,可滿(mǎn)足不同場(chǎng)景下的多樣化需求。

目前,用戶(hù)可通過(guò)Hugging Face、ModelScope、Kaggle和GitHub等平臺(tái)獲取模型并部署安裝,也能直接通過(guò)chat.qwen.ai網(wǎng)站或App體驗(yàn)千問(wèn)3的強(qiáng)大功能。

性能與全球化特征突出,阿里千問(wèn)3引起全球熱議

Venturebeat評(píng)價(jià)稱(chēng):“簡(jiǎn)短試用Qwen Chat網(wǎng)站后,發(fā)現(xiàn)新模型可以以相對(duì)快的速度生成圖片,在遵循提示方面表現(xiàn)尚可,難能可貴的是模型能夠直接將文本融入圖像中,而且還能保持風(fēng)格一致?!?/p>

全球化能力是千問(wèn)3的另一張王牌,它支持119種語(yǔ)言及方言,極具應(yīng)用潛力。其預(yù)訓(xùn)練數(shù)據(jù)達(dá)到36T,數(shù)據(jù)來(lái)源包括網(wǎng)絡(luò)抓取、類(lèi)PDF文檔提取、前幾代千問(wèn)模型合成的內(nèi)容(主要是數(shù)學(xué)編程內(nèi)容)。

再看部署靈活性,0.6B-32B密集模型可直接在筆記本電腦運(yùn)行,個(gè)人開(kāi)發(fā)者與大型團(tuán)隊(duì)都能輕松駕馭。

橫向?qū)Ρ?,千?wèn)3性能足以對(duì)標(biāo)DeepSeek、OpenAI等國(guó)內(nèi)外頭部模型。相較Meta開(kāi)源模型,其遵循Apache 2.0協(xié)議,完全開(kāi)放商業(yè)使用權(quán)限,而Meta模型有諸多限制。

這一次千問(wèn)3的進(jìn)步非常大,它的目標(biāo)直指AGI、ASI,也就是比人類(lèi)還聰明的AI。未來(lái),千問(wèn)計(jì)劃進(jìn)一步拓展模型規(guī)模,增加文本處理長(zhǎng)度,拓寬對(duì)多種模式的支持范圍,并借助環(huán)境反饋機(jī)制提升自身的強(qiáng)化學(xué)習(xí)能力,持續(xù)進(jìn)化。

AI專(zhuān)家向CNBC透露,千問(wèn)3的誕生意義重大,對(duì)阿里巴巴在中國(guó)的AI競(jìng)爭(zhēng)對(duì)手而言是巨大威脅。同樣,美國(guó)同行們也感受到更大壓力。

市場(chǎng)咨詢(xún)公司Counterpoint Research的AI分析師Wei Sun高度評(píng)價(jià)千問(wèn)3,認(rèn)為它是一款具有里程碑意義的突破性產(chǎn)品。其性能超越同類(lèi)產(chǎn)品,在模型特性上也展現(xiàn)出巨大的應(yīng)用潛力,混合思考模式、支持119種語(yǔ)言和方言,以及開(kāi)源特性,都為其加分不少。

華盛頓專(zhuān)注于中美經(jīng)濟(jì)和科技競(jìng)爭(zhēng)的分析師Ray Wang表示:“阿里巴巴千問(wèn)3系列產(chǎn)品的推出,再次證明中國(guó)實(shí)驗(yàn)室具備強(qiáng)大的競(jìng)爭(zhēng)力與創(chuàng)新力。即便美國(guó)實(shí)施出口管制,也無(wú)法阻擋中國(guó)在AI領(lǐng)域穩(wěn)步向前,開(kāi)發(fā)出媲美國(guó)際頂尖水平的開(kāi)源模型?!?nbsp;

數(shù)據(jù)顯示,千問(wèn)已成為全球最流行的開(kāi)源模型之一,全球下載量超3億次,在Hugging Face上衍生模型數(shù)量突破10萬(wàn)個(gè)。

分析師Ray Wang認(rèn)為,千問(wèn)3將延續(xù)阿里模型的熱度與影響力,其性能有望問(wèn)鼎全球最佳開(kāi)源模型,僅略遜于OpenAI的專(zhuān)有模型o3和o4-mini。他還說(shuō),當(dāng)前中美在人工智能領(lǐng)域的差距已大幅縮小,可能僅剩幾個(gè)月、甚至幾周的差距。(小刀)

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2025-04-30
全球熱議阿里千問(wèn)3:給開(kāi)源AI模型注入強(qiáng)行針
為人工智能的應(yīng)用落地開(kāi)辟新路徑

長(zhǎng)按掃碼 閱讀全文