大模型上車,汽車智能化的機遇or挑戰(zhàn)?

TechWeb 文/卞海川

眾所周知,隨著以ChatGPT為代表的生成式AI大模型的火爆,汽車產(chǎn)業(yè)產(chǎn)業(yè)的競爭正在從新能源駛向智能化,而無論是傳統(tǒng)車企,還是造車新勢力,也無一例外地都將智能化作為發(fā)展的重點。那么問題來了,大模型真的可以讓汽車智能化更上層樓嗎?

大模型上車,智能座艙與自動駕駛是重點

從汽車行業(yè)與大模型的關(guān)系看,大模型可以在自動駕駛、駕駛艙智能化、人車傳感器互聯(lián)、工廠數(shù)字化等諸多方面產(chǎn)生價值。而從功能層面來看,大模型在汽車智能化方面主要體現(xiàn)在智能座艙和智能駕駛,也是車企們關(guān)注和用戶體驗的重點。

以智能座艙為例,當(dāng)下,汽車的人機交互能力被許多用戶詬病。如何改善車機交互水平,提升用戶體驗?AI大語言模型為OEM廠商提供了新的思路。當(dāng)下,大語言模型等生成式AI大模型應(yīng)用在智能座艙等車聯(lián)網(wǎng)場景中展現(xiàn)出了巨大潛力,許多車企都將其視為戰(zhàn)略儲備技術(shù)之一。例如車載ChatGPT語音助手,可以處理完整的對話,比如追問,并能保持對前后文的理解,形成較為良好的語音交互體驗。

比如,今年美國微軟公司和德國汽車廠商梅賽德斯奔馳公司宣布,雙方將展開合作,把ChatGPT人工智能服務(wù)整合到存量汽車中,美國地區(qū)90萬輛汽車將因此受益。

據(jù)梅賽德斯奔馳介紹,未來車主在使用語音助手提問時,ChatGPT將會負(fù)責(zé)回答問題,增強汽車語音助手的negligible。微軟公司發(fā)言人介紹稱,這也是ChatGPT產(chǎn)品第一次應(yīng)用在汽車環(huán)境中。實際上,微軟與梅賽德斯—奔馳探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務(wù)集成開辟了可能性,未來駕駛員可以通過車載系統(tǒng)完成預(yù)訂餐廳、預(yù)訂電影票等任務(wù),將會極大豐富和提升智能汽車與人之間的交互體驗。

而從目前國內(nèi)的情況來看,已有多家車系宣布將在旗下車型上接入AI大模型,如長安、集度、吉利、嵐圖、紅旗、長城、東風(fēng)日產(chǎn)、零跑等,它們均為文心一言的早期客戶。

同樣是在今年,百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果。百度Apollo演示了基于文心大模型能力探索下,智艙將具備出行場景對話式交互、邏輯推理、策略規(guī)劃和知識問答等多項能力,同時也展示了在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級響應(yīng)、免喚醒全時交互的體驗。

除了智能座艙,AI大模型在自動駕駛領(lǐng)域同樣有著廣泛的應(yīng)用前景。許多專家學(xué)者認(rèn)為,AI大模型在自動駕駛領(lǐng)域的應(yīng)用將會成為未來智能出行的重要驅(qū)動力之一,為自動駕駛技術(shù)的發(fā)展和普及做出重要貢獻(xiàn)。

眾所周知,大模型可以處理海量數(shù)據(jù),同時具備多維度分析能力,可以提供更精準(zhǔn)、更全面的數(shù)據(jù)分析和預(yù)測能力。保持對大模型的優(yōu)化升級,就可以提高自動駕駛的準(zhǔn)確性和可靠性。具體表現(xiàn)在在云端,車企可以發(fā)揮模型參數(shù)量的大容量優(yōu)勢,通過大模型完成絕大多數(shù)的數(shù)據(jù)標(biāo)注和數(shù)據(jù)挖掘工作,節(jié)省數(shù)據(jù)標(biāo)注成本,還能夠借助仿真場景構(gòu)建賦能。在車端,大模型可以將細(xì)分為多個附屬子模型,分管不同子任務(wù),節(jié)省車端的推理計算時間,增加行車安全性。

以特斯拉為例,隨著AI大模型技術(shù)的發(fā)展,特斯拉率先采用了基于TransFormer大模型的BEV+占用網(wǎng)絡(luò)感知算法,提升了環(huán)境建模的效率,成為目前主流車企下一代智能化的主要架構(gòu)。通過這套感知架構(gòu)能夠減少對于激光雷達(dá)等高成本傳感器的依賴,有效降低系統(tǒng)成本,減輕車企及消費者的負(fù)擔(dān)。

新挑戰(zhàn)顯現(xiàn),真正落地仍需時日

綜上,我們看到,大模型在智能座艙上的應(yīng)用是可以直觀感受的,且已有應(yīng)用出現(xiàn),但對于自動駕駛,大模型上車還有很長的路要走或者說挑戰(zhàn)更大。

首先從“硬”的方面看,業(yè)內(nèi)知道,AI大模型的運行需要高規(guī)格的硬件配置支持,需要具備高算力、大容量內(nèi)存以及低時延的特性。但現(xiàn)階段車載設(shè)備的硬件水平雖然有所提升,但還無法達(dá)到支撐AI大模型運行的水平。以自然語言處理(NLP)的預(yù)訓(xùn)練模型GPT-3為例,需要數(shù)萬億次TOPS的計算能力,這就要求芯片的算力至少要在萬級TOPS以上才能夠勝任計算工作。

但從目前的車載硬件部署來看,即便目前蔚來、理想等造車新勢力使用的英偉達(dá)Orin X芯片,單顆算力也僅為254TOPS,這已經(jīng)是目前量產(chǎn)車中算力最高的芯片,遠(yuǎn)遠(yuǎn)達(dá)不到大模型的計算要求。而這也是為何特斯拉要自研芯片和建立云端智算中心Dojo的主要原因。

其次在“軟”的數(shù)據(jù)層面,對其的處理也是不小的挑戰(zhàn),特別是現(xiàn)在日益流行的多模態(tài)數(shù)據(jù),包括自動駕駛中激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)等,以及專用的高清攝像頭、GPS設(shè)備等搜集到的數(shù)據(jù)、場景數(shù)據(jù)(比如對交通標(biāo)志與地面標(biāo)線的學(xué)習(xí)與識別、對車流與人流的行為與相關(guān)應(yīng)對模型等)等,這本就使得數(shù)據(jù)的處理、管理和使用變得相當(dāng)困難,相比之下,大模型的數(shù)據(jù)量是有過之而無不及。

此外,諸如數(shù)據(jù)的隱私、安全的挑戰(zhàn)也會隨著數(shù)據(jù)量的爆炸式增長而增加。

值得一提的是,從“軟”的感知算法的推進(jìn)看,行業(yè)總體2022年及之前的的商業(yè)化應(yīng)用主要為2D+CNN算法,而隨著ChatGPT等AI大模型的興起,感知算法已經(jīng)升級至BEV。如我們前述,特斯拉在2021年就已經(jīng)采用BEV+Transformer,國內(nèi)的小鵬+華為+理想等今年才切換到BEV+Transformer,但仍應(yīng)用于感知端,而受限于算法復(fù)雜性+大算力要求,感知決策一體的端到端算法落地尚需時日。

寫在最后:綜上,不可否認(rèn),大模型已經(jīng)成為智能汽車行業(yè)的競爭焦點,可以為自動駕駛和智能座艙帶來了巨大的潛力,改善駕駛安全性、優(yōu)化交通流量和提供個性化的駕駛體驗。與此同時,其在算力、算法及數(shù)據(jù)方面的新挑戰(zhàn)也成為能否最終實現(xiàn)上述目標(biāo)的阻礙,那么未來究竟是挑戰(zhàn)大于機遇,還是機遇大于挑戰(zhàn),還需我們邊走邊看。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-09-01
大模型上車,汽車智能化的機遇or挑戰(zhàn)?
大模型真的可以讓汽車智能化更上層樓嗎?

長按掃碼 閱讀全文