4月29日消息,今日阿里云Qwen3正式發(fā)布并全部開源8款混合推理模型。
此次開源包括兩款MoE模型:Qwen3-235B-A22B(2350多億總參數(shù)、 220多億激活參),以及Qwen3-30B-A3B(300億總參數(shù)、30億激活參數(shù));以及六個Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
全球開發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)在魔搭社區(qū)、HuggingFace等平臺下載模型并商用,支持Apache2.0協(xié)議開源,也可以通過阿里云百煉調(diào)用Qwen3的API服務(wù),
個人用戶可立即通過通義APP直接體驗(yàn)Qwen3,夸克也即將全線接入Qwen3。
Qwen3 模型支持 119 種語言和方言。
Qwen3 模型支持兩種思考模式:1. 思考模式,適合需要深入思考的復(fù)雜問題。2. 非思考模式,適用于對速度要求高于深度的簡單問題。這種靈活性使用戶能夠根據(jù)具體任務(wù)控制模型進(jìn)行“思考”的程度。這兩種模式的結(jié)合大大增強(qiáng)了模型實(shí)現(xiàn)穩(wěn)定且高效的“思考預(yù)算”控制能力,讓用戶能夠更輕松地為不同任務(wù)配置特定的預(yù)算,在成本效益和推理質(zhì)量之間實(shí)現(xiàn)更優(yōu)的平衡。
據(jù)介紹,旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測試中,與一眾頂級模型相比,表現(xiàn)出極具競爭力的結(jié)果。性能表現(xiàn)超OpenAI-o1、DeepSeek-R1等大模型。
小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B10%,表現(xiàn)更勝一籌, Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能。
對于部署,阿里云推薦使用 SGLang 和 vLLM 等框架;而對于本地使用,像 Ollama、LMStudio、MLX、llama.cpp 和 KTransformers 這樣的工具也非常值得推薦。
- 華為擎云自主創(chuàng)新PC高效辦公實(shí)測,快不止一點(diǎn)重塑政務(wù)辦公生產(chǎn)力新格局
- 巨人網(wǎng)絡(luò)一季度營收7.24億元,同比增長3.94%
- 網(wǎng)絡(luò)文學(xué)行業(yè)發(fā)布《反洗稿自律公約》:遏制AI濫用導(dǎo)致的抄襲
- 百望股份CEO付英波:以“數(shù)據(jù)智能”戰(zhàn)略領(lǐng)跑“AI戰(zhàn)國時代”
- 螞蟻數(shù)科發(fā)布可信數(shù)據(jù)空間軟硬一體解決方案 聯(lián)合清華大學(xué)落地雙碳場景
- “數(shù)據(jù)+場景”雙引擎驅(qū)動,馬蜂窩“AI游貴州”系列打造垂直場景實(shí)踐新樣本
- 馬蜂窩孫云蕾:“數(shù)據(jù)+場景+智能體”推動目的地旅游產(chǎn)業(yè)化升級
- IDC:2024年下半年中國MaaS及AI大模型解決方案市場百度第一
- 華為筆記本Linux版換裝Windows系統(tǒng)攻略:輕松開啟高效辦公
- 北汽藍(lán)谷一季度營收大增150.75%,極狐品牌銷量暴漲
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。