阿里云Qwen3開源8款「混合推理模型」

4月29日消息,今日阿里云Qwen3正式發(fā)布并全部開源8款混合推理模型。

此次開源包括兩款MoE模型:Qwen3-235B-A22B(2350多億總參數(shù)、 220多億激活參),以及Qwen3-30B-A3B(300億總參數(shù)、30億激活參數(shù));以及六個Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

全球開發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)在魔搭社區(qū)、HuggingFace等平臺下載模型并商用,支持Apache2.0協(xié)議開源,也可以通過阿里云百煉調(diào)用Qwen3的API服務(wù),

個人用戶可立即通過通義APP直接體驗(yàn)Qwen3,夸克也即將全線接入Qwen3。

Qwen3 模型支持 119 種語言和方言。

Qwen3 模型支持兩種思考模式:1. 思考模式,適合需要深入思考的復(fù)雜問題。2. 非思考模式,適用于對速度要求高于深度的簡單問題。這種靈活性使用戶能夠根據(jù)具體任務(wù)控制模型進(jìn)行“思考”的程度。這兩種模式的結(jié)合大大增強(qiáng)了模型實(shí)現(xiàn)穩(wěn)定且高效的“思考預(yù)算”控制能力,讓用戶能夠更輕松地為不同任務(wù)配置特定的預(yù)算,在成本效益和推理質(zhì)量之間實(shí)現(xiàn)更優(yōu)的平衡。

據(jù)介紹,旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測試中,與一眾頂級模型相比,表現(xiàn)出極具競爭力的結(jié)果。性能表現(xiàn)超OpenAI-o1、DeepSeek-R1等大模型。

小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B10%,表現(xiàn)更勝一籌, Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能。

對于部署,阿里云推薦使用 SGLang 和 vLLM 等框架;而對于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 這樣的工具也非常值得推薦。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2025-04-29
阿里云Qwen3開源8款「混合推理模型」
今日阿里云Qwen3正式發(fā)布并全部開源8款混合推理模型。Qwen3 模型支持 119 種語言和方言。Qwen3 模型支持兩種思考模式:1. 思考模式,適合需要深入思考的復(fù)雜問題。據(jù)介紹,旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測試中,與一眾頂級模型相比,表現(xiàn)出極具競爭力的結(jié)果。

長按掃碼 閱讀全文