TechWeb 文/卞海川
在距離上次“AI Talk”整整130天之后,理想汽車創(chuàng)始人兼CEO李想再度接受張小珺專訪,系統(tǒng)闡述了理想汽車在人工智能,特別是“司機大模型”(VLA)方面的最新進展。
人工智能尚未減少工作時長,核心挑戰(zhàn)仍是“熵增”
“人工智能發(fā)展得這么快,但我每天的工作時長并沒有減少。”李想的一句開場白引發(fā)共鳴。在他看來,當前大多數(shù)人仍將AI視為信息工具,而信息的質量受限于索引機制,尤其是RAG(檢索增強生成)依賴的源頭往往已“失真”,導致“推理很認真,但結果是錯的”。
李想進一步提出AI工具的三層分級:信息工具、輔助工具、生產(chǎn)工具。
“只有成為生產(chǎn)工具,人工智能才真正實現(xiàn)爆發(fā)?!?他強調,AI若無法切實改善產(chǎn)出質量、壓縮時間成本,就無法對工作效率產(chǎn)生實質影響。
擁抱DeepSeek,加速理想VLA模型推進9個月
對于中國大模型行業(yè),李想毫不掩飾自己的贊譽:“無論是DeepSeek還是千問,中國AI在基礎模型、推理模型、多模態(tài)能力上已經(jīng)跟美國的距離基本上拉近了?!?/p>
李想對DeepSeek以及其創(chuàng)始人梁文鋒給出了高度評價,包括“自律”、“會在全世界范圍之內(nèi)去研究和學習最佳實踐和最好的方法論的人”。
李想介紹了他從DeepSeek上吸取到的經(jīng)驗。DeepSeek運用了人類的最佳實踐,比如說DeepSeek V3采用了一個671B的MoE(混合專家模型)。
專家能力如何構建?李想認為,DeepSeek展示了一個最佳實踐:第一步一定要先搞研究。
“任何時候當我們想去改變和提升能力,第一步一定是搞研究,第二步是研發(fā),第三步是把能力表達出來,第四步是能力變成業(yè)務的價值。這四個步驟是個極簡的人類最佳實踐,但我們經(jīng)常做著就忘掉了,看到什么東西就直接去啟動研發(fā),而沒有去搞研究?!崩钕胝f道。
正是基于DeepSeek的開源,理想汽車在VLA司機大模型的語言能力研發(fā)上提速顯著,節(jié)省了近9個月的時間和數(shù)億元成本。
“我們內(nèi)心很簡單:DeepSeek幫助我們太大,所以我們決定開源自研的星環(huán)OS系統(tǒng)作為回饋?!崩钕氡硎荆褪荄eepSeek給我們帶來那么大的幫助,我們應該給對社會貢獻點什么,不讓行業(yè)那么卷。說白了純粹是感謝DeepSeek。
為什么有了DeepSeek,理想還要自研基座模型?李想回應說:“核心在場景需求不同,我們要做車載多模態(tài)交互,尤其是VLA(視覺語言行動模型)——需要3D/2D視覺融合,疊加汽車、交通、家庭場景的專業(yè)語料,這些垂直領域的數(shù)據(jù)和訓練邏輯,是通用模型沒覆蓋的?!?/p>
理想汽車的AI主航道:打造司機級大模型
目前的L2、L2+組合駕駛輔助仍屬于輔助工具階段,而VLA能夠讓AI真正成為司機,成為交通領域的專業(yè)生產(chǎn)工具。對理想汽車而言, 未來的VLA就是一個像人類司機一樣工作的司機大模型”。
在李想看來,輔助駕駛的真正突破點是VLA——一個能像人類司機一樣觀察、理解并執(zhí)行行動的多模態(tài)大模型。
他將VLA的發(fā)展劃分為三階段:
1. 昆蟲智能階段:依賴規(guī)則算法、高精地圖,智能程度有限;比較像螞蟻的行動和完成任務的一個方式。
2. 哺乳動物階段:通過端到端學習模仿人類操作,泛化能力增強;去面對它從來沒有學到的、特別復雜的,其實就會遇到問題。
3. 人類智能階段:VLA具備理解物理世界的能力,結合3D視覺、語言理解和行動執(zhí)行,“像司機一樣工作”。
李想總結稱,它會像人類一樣的用3D的vision和2D的組合,去看整個真實的物理世界,也包含它能夠去看懂導航軟件是怎么在運行的,而不是像VLM那樣只能看到一張圖片。另外一方面,它有自己的整個腦系統(tǒng),不但要看到物理世界,還能夠理解這個物理世界。它有它的language,然后它也有它的CoT(思維鏈),有推理的能力。
目前,理想正在訓練一個32B參數(shù)量級的VL(視覺-語言)基座模型,加入了高清2D圖像、3D視覺、交通語言語料及VL聯(lián)合語料(如導航與行為的關聯(lián))。
基于此前李想對于人工智能的判斷,他認為,只有讓輔助駕駛變成一個真正的司機,它才是一個生產(chǎn)力工具,不只是一個輔助工具。
最新公布的視頻顯示,基于 VLA 模型的輔助駕駛系統(tǒng),駕駛員可以用語音操控車輛,包括走收費站的人工通道、掉頭、靠邊停車、停在停車場的 C3 區(qū)域等等,這都是輔助駕駛從未有過的體驗。
對于行業(yè)普遍存在的對輔助駕駛安全性的質疑,李想則表示,“這正是黎明前的黑暗”。他表示,正因為輔助駕駛行業(yè)遇到了問題,我最喜歡、最開心的方式,就是去解決行業(yè)解決不了的問題,這是我們自己堅決相信的。
李想認為,只要人類會雇傭司機,人工智能技術是把類似這樣的一些功能和角色,去變成真正的生產(chǎn)力、生產(chǎn)工具,然后進行替代。
成長帶來能量,在痛苦中保持正能量
今年7月,理想汽車將迎來成立十周年。李想表示,創(chuàng)業(yè)路上苦多于甜,他選擇保留那些有價值的美好片段,用來激勵自己保持正能量?!皠?chuàng)業(yè)確實不容易,但是沒必要苦哈哈的。苦和甜是一個硬幣的正反面,取決于看哪一面?!彼麑⑵髽I(yè)遭遇的打擊視為必須面對的挑戰(zhàn),也正是這些挑戰(zhàn),賦予了理想汽車更多的能力。
談及如何成為更有能量的人,李想認為,關鍵在于關注自我,接受自身的優(yōu)點和不足,并用成長替代改變——成長意味著增強能力。除此之外,李想強調親密關系同樣重要,關注他人的成長也能帶來能量,家人和同事能夠和他形成互補,相互支撐?!拔倚枰胰撕屯律踔脸^了他們需要我,首先是我需要他們,然后才是他們需要我,我們在一起能夠形成非常強的腦力和心力?!崩钕氡硎?。
回顧幾次創(chuàng)業(yè)經(jīng)歷,李想表示,從高中創(chuàng)辦個人網(wǎng)站至今,自己的思維方式?jīng)]有什么變化:遇到問題解決問題,解決別人不愿解決的難題,解決用戶的痛點,不斷向他人學習。不同的是,如今面臨的問題更復雜、服務的用戶群體更多、公司規(guī)模和組織也更龐大?!皫状蝿?chuàng)業(yè)一路走來,最難時有人相助,遇坑也能迅速爬出,一幫人齊心協(xié)力變得更好,這是種幸運,也沒什么可后悔的?!?/p>
AI的真正爆發(fā),不僅是技術參數(shù)的躍升,更是從“參考”到“生產(chǎn)”的范式轉移。司機大模型,或許正是理想汽車投向未來的一張王牌。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )