精品国产一区二区三区久久无码,亚洲中文字幕网站你懂得,久久99热免费精品久久

全球開源模型新王登基，阿里千問3超越DeepSeek-R1、OpenAI-o1

人閱讀

2025-04-29 09:11:19

來源：極客網(wǎng)
相關(guān)關(guān)鍵詞
- 開源模型
- 阿里千問

4月29日凌晨，阿里巴巴開源新一代通義千問模型Qwen3（簡稱千問3），參數(shù)量僅為DeepSeek-R1的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等全球頂尖模型，登頂全球最強(qiáng)開源模型。千問3是國內(nèi)首個(gè)“混合推理模型”，“快思考”與“慢思考”集成進(jìn)同一個(gè)模型，對(duì)簡單需求可低算力“秒回”答案，對(duì)復(fù)雜問題可多步驟“深度思考”，大大節(jié)省算力消耗。

千問3采用混合專家（MoE）架構(gòu)，總參數(shù)量235B，激活僅需22B。千問3預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T ，并在后訓(xùn)練階段多輪強(qiáng)化學(xué)習(xí)，將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調(diào)用、多語言能力等方面均大幅增強(qiáng)，即創(chuàng)下所有國產(chǎn)模型及全球開源模型的性能新高：在奧數(shù)水平的AIME25測評(píng)中，千問3斬獲81.5分，刷新開源紀(jì)錄；在考察代碼能力的LiveCodeBench評(píng)測中，千問3突破70分大關(guān)，表現(xiàn)甚至超過Grok3；在評(píng)估模型人類偏好對(duì)齊的ArenaHard測評(píng)中，千問3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同時(shí)，千問3的部署成本還大幅下降，僅需4張H20即可部署千問3滿血版，顯存占用僅為性能相近模型的三分之一。

千問3性能圖

千問3還提供了豐富的模型版本，包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，每款模型均斬獲同尺寸開源模型SOTA（最佳性能）：千問3的30B參數(shù)MoE模型實(shí)現(xiàn)了10倍以上的模型性能杠桿提升，僅激活3B就能媲美上代Qwen2.5-32B模型性能；千問3的稠密模型性能繼續(xù)突破，一半的參數(shù)量可實(shí)現(xiàn)同樣的高性能，如32B版本的千問3模型可跨級(jí)超越Qwen2.5-72B性能。

同時(shí)，所有千問3模型都是混合推理模型，API可按需設(shè)置“思考預(yù)算”（即預(yù)期最大深度思考的tokens數(shù)量），進(jìn)行不同程度的思考，靈活滿足AI應(yīng)用和不同場景對(duì)性能和成本的多樣需求。比如，4B模型是手機(jī)端的絕佳尺寸；8B可在電腦和汽車端側(cè)絲滑部署應(yīng)用；32B最受企業(yè)大規(guī)模部署歡迎，有條件的開發(fā)者也可輕松上手。

Qwen3開源模型家族

千問3為即將到來的智能體Agent和大模型應(yīng)用爆發(fā)提供了更好的支持。在評(píng)估模型Agent能力的BFCL評(píng)測中，千問3創(chuàng)下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等頂尖模型，將大幅降低Agent調(diào)用工具的門檻。同時(shí)，千問3原生支持MCP協(xié)議，并具備強(qiáng)大的工具調(diào)用（function calling）能力，結(jié)合封裝了工具調(diào)用模板和工具調(diào)用解析器的Qwen-Agent 框架，將大大降低編碼復(fù)雜性，實(shí)現(xiàn)高效的手機(jī)及電腦Agent操作等任務(wù)。

據(jù)了解，千問3系列模型依舊采用寬松的Apache2.0協(xié)議開源，并首次支持119多種語言，全球開發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)在魔搭社區(qū)、HuggingFace等平臺(tái)下載模型并商用，也可以通過阿里云百煉調(diào)用千問3的API服務(wù)。個(gè)人用戶可立即通過通義APP直接體驗(yàn)千問3，夸克也即將全線接入千問3。

據(jù)悉，阿里通義已開源200余個(gè)模型，全球下載量超3億次，千問衍生模型數(shù)超10萬個(gè)，已超越美國Llama，成為全球第一開源模型。

（完）

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）