ICLR 2025 Oral | Diffusion Planner: 毫末智行與清華AIR等機(jī)構(gòu)聯(lián)合發(fā)布全新自動(dòng)駕駛規(guī)劃算法

1月28日,毫末智行聯(lián)合清華大學(xué)AIR智能產(chǎn)業(yè)研究院、自動(dòng)化所、港中文、上海交大、上海人工智能實(shí)驗(yàn)室在ICLR 2025上正式發(fā)布了最新自動(dòng)駕駛研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。該算法創(chuàng)新性地設(shè)計(jì)了一種基于Diffusion Transformer 的自動(dòng)駕駛規(guī)劃模型架構(gòu)——Diffusion Planner,可以高效處理復(fù)雜場(chǎng)景輸入,并聯(lián)合建模周車運(yùn)動(dòng)預(yù)測(cè)與自車規(guī)劃中的多模態(tài)駕駛行為,充分發(fā)揮擴(kuò)散模型在閉環(huán)規(guī)劃中的潛力,可以解決現(xiàn)有基于學(xué)習(xí)的規(guī)劃方法對(duì)后處理的嚴(yán)重依賴問題。此外,借助“擴(kuò)散模型的引導(dǎo)機(jī)制”,這一模型在部署階段能夠靈活適應(yīng)不同的駕駛需求,有效提高自動(dòng)駕駛規(guī)劃決策端泛化能力與實(shí)用性,能夠極大提升自動(dòng)駕駛的安全性和復(fù)雜場(chǎng)景的適應(yīng)性。

AIR等機(jī)構(gòu)聯(lián)合發(fā)布全新自動(dòng)駕駛規(guī)劃算法" alt="ICLR 2025 Oral " Diffusion Planner: 毫末智行與清華AIR等機(jī)構(gòu)聯(lián)合發(fā)布全新自動(dòng)駕駛規(guī)劃算法" loading="lazy"/>

ICLR(國(guó)際學(xué)習(xí)表征會(huì)議) 是機(jī)器學(xué)習(xí)和人工智能領(lǐng)域最重要的國(guó)際學(xué)術(shù)會(huì)議之一。ICLR 2025 作為第十三屆會(huì)議,將于2025年4月24日至28日在新加坡博覽中心(Singapore EXPO)舉行。本屆ICLR 2025中,本論文從全球11,672份投稿中脫穎而出,不僅被ICLR2025正式接收,并以1.8%的占比成功入選Oral Paper(即可以參加會(huì)議正式演講),代表了大會(huì)對(duì)該算法成果的高度認(rèn)可,極具技術(shù)前瞻性。

當(dāng)前,自動(dòng)駕駛系統(tǒng)正在從傳統(tǒng)的模塊化架構(gòu)向端到端架構(gòu)演進(jìn),而實(shí)現(xiàn)在復(fù)雜環(huán)境下的靈活決策規(guī)劃的認(rèn)知模塊的模型化,成為實(shí)現(xiàn)端到端的一大關(guān)鍵挑戰(zhàn)。傳統(tǒng)的基于規(guī)則的方案,雖然已經(jīng)產(chǎn)業(yè)中得到應(yīng)用,但存在適應(yīng)性差,調(diào)整成本高的問題。而行業(yè)正在嘗試的一些模仿學(xué)習(xí)方案,雖然能直接學(xué)習(xí)專家駕駛行為,并隨訓(xùn)練數(shù)據(jù)擴(kuò)展來提升性能,但是模仿學(xué)習(xí)在多模態(tài)行為適應(yīng)性、泛化能力和駕駛風(fēng)格靈活調(diào)控上仍存挑戰(zhàn),特別是需要依賴后處理來優(yōu)化模型輸出。因此自動(dòng)駕駛認(rèn)知模型化需要探索新的思路。

近年來,擴(kuò)散模型在決策領(lǐng)域得到廣泛應(yīng)用,但在自動(dòng)駕駛規(guī)劃中的探索仍然有限?,F(xiàn)有研究多聚焦于運(yùn)動(dòng)預(yù)測(cè)和場(chǎng)景生成,關(guān)注開環(huán)性能,而非閉環(huán)規(guī)劃。一些方法嘗試將擴(kuò)散模型應(yīng)用于規(guī)劃任務(wù),但僅僅是沿用現(xiàn)有結(jié)構(gòu)或擴(kuò)展模型參數(shù),缺乏針對(duì)性結(jié)構(gòu)設(shè)計(jì),導(dǎo)致仍然高度依賴后處理。

基于這些技術(shù)挑戰(zhàn),本論文提出了一種創(chuàng)新的“基于擴(kuò)散模型的自動(dòng)駕駛規(guī)劃方法”——Diffusion Planner。通過擴(kuò)散模型強(qiáng)大的數(shù)據(jù)分布擬合能力,Diffusion Planner能夠精準(zhǔn)捕捉復(fù)雜場(chǎng)景中周車與自車的多模態(tài)駕駛行為,并實(shí)現(xiàn)周車預(yù)測(cè)與自車規(guī)劃的聯(lián)合建模。同時(shí),基于Transformer的結(jié)構(gòu)設(shè)計(jì)高效處理復(fù)雜場(chǎng)景輸入,能夠?qū)崿F(xiàn)20Hz的高速實(shí)時(shí)推理。此外,借助靈活的引導(dǎo)機(jī)制,模型在部署階段即可適應(yīng)不同的駕駛需求。

ICLR 2025 Oral

在大規(guī)模真實(shí)數(shù)據(jù)集 nuPlan 的閉環(huán)評(píng)估中,Diffusion Planner取得了SOTA級(jí)表現(xiàn),?幅降低了對(duì)后處理的依賴,并在額外收集的 200 小時(shí)物流小車數(shù)據(jù)上驗(yàn)證了其在多種駕駛風(fēng)格下的魯棒性和遷移能力。

ICLR 2025 Oral

從對(duì)比現(xiàn)有基于擴(kuò)散模型的自動(dòng)駕駛規(guī)劃算法來看,Diffusion Planner 有效降低了對(duì)后處理的依賴,同時(shí)實(shí)現(xiàn)了更高的推理頻率,進(jìn)一步驗(yàn)證了這一算法設(shè)計(jì)結(jié)構(gòu)的有效性。再通過引入現(xiàn)有的后處理模塊,算法性能又得到了進(jìn)一步提升,這得益于模型生成的高質(zhì)量軌跡,為后處理模塊提供了更優(yōu)的初始化參考軌跡。

ICLR 2025 Oral

該論文使用了毫末智行提供的200小時(shí)真實(shí)世界物流小車配送數(shù)據(jù),作為nuPlan數(shù)據(jù)集的補(bǔ)充,并計(jì)劃在后續(xù)開源。與nuPlan數(shù)據(jù)集中的車輛相比,毫末的物流自動(dòng)配送車具有以下特點(diǎn):尺寸較小,運(yùn)行速度較低;可以在主干道和自行車道上行駛;與行人和騎行者的交互更為頻繁,同時(shí)面臨不同的行駛規(guī)則。通過在該數(shù)據(jù)集的測(cè)試結(jié)果顯示,Diffusion Planner依然保持了最佳表現(xiàn)。

ICLR 2025 Oral

(毫末末端物流自動(dòng)配送車小魔駝HD05)

毫末智行無人物流技術(shù)負(fù)責(zé)人趙祖軒表示,針對(duì)這一算法,毫末團(tuán)隊(duì)已經(jīng)進(jìn)入實(shí)車測(cè)試階段,即以車端感知端的BEV+認(rèn)知端的Diffusion Planner相結(jié)合的方案,率先實(shí)現(xiàn)端到端方案在末端物流自動(dòng)配送場(chǎng)景的應(yīng)用落地。

毫末智行,作為一家致力于自動(dòng)駕駛的人工智能技術(shù)公司,始終堅(jiān)持以數(shù)據(jù)驅(qū)動(dòng)為核心,重點(diǎn)布局在乘用車智能駕駛、末端物流自動(dòng)配送車、智能硬件三大業(yè)務(wù),為客戶提供領(lǐng)先的自動(dòng)駕駛產(chǎn)品和無人配送服務(wù)的同時(shí),也在源源不斷地產(chǎn)出高質(zhì)量的真實(shí)場(chǎng)景數(shù)據(jù),有效地推動(dòng)自身自動(dòng)駕駛技術(shù)的升級(jí)和行業(yè)技術(shù)能力的發(fā)展。

Diffusion Planner方案的提出并取得 nuPlan SOTA 的成績(jī),表明該算法在技術(shù)、性能和適應(yīng)性等方面都達(dá)到了行業(yè)領(lǐng)先水平。這不僅為自動(dòng)駕駛實(shí)際應(yīng)用下的安全性、效率和舒適性提供了解決方案,也為自動(dòng)駕駛認(rèn)知端的模型化升級(jí)提供了新的思路,有利于整個(gè)自動(dòng)駕駛行業(yè)技術(shù)的升級(jí)發(fā)展。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )