科技云報道原創(chuàng)。
推進工業(yè)新質生產力,機器人有望成為AI下一個“新引擎”?
“人工智能的下一波浪潮是機器人技術,這是一個‘0億美元市場’,但未來將價值數(shù)十億美元,就像Nvidia剛起步時的GPU加速計算一樣……”這是英偉達CEO黃仁勛對加州理工2024屆畢業(yè)生的勸勉。
這不免讓人想起初創(chuàng)公司Figure的人形機器人,其外表和動作都與人類十分相似。它可以與人流暢對話,理解人的意圖。當聽到工程師“想吃點東西”的口令后,它遲疑了一下,準確地拿起了蘋果。它甚至可以解釋自己為什么要這樣做。
這一人形機器人背后,是OpenAI公司為其配置的大語言模型。多模態(tài)技術加持下,它具備高級視覺和語言智能。
隨著大模型、機器人制造等技術發(fā)展,賦予人工智能“形體”的具身智能(Embodied AI)正逐步走入人工智能舞臺中央。
AI技術的集大成者
“具身智能”,字面意思是“具有身體的人工智能”。簡言之,具身智能就是讓機器人或智能系統(tǒng)像生物一樣,通過自己的身體去感知世界、理解世界,并在世界中行動和完成任務的智能技術。一年多來,隨著政策、資本、產業(yè)、學術界的共同推動,具身智能成為廣為人知的熱門詞匯。
如今,具身智能是人工智能產業(yè)發(fā)展的重要方向之一。英偉達近期發(fā)布人形機器人通用基礎模型Project GR00T,希望能讓機器人擁有更聰明的“大腦”。由Project GR00T驅動的機器人能夠理解自然語言,并通過觀察人類行為來模仿人類動作。在特斯拉2023股東大會上,馬斯克也向大眾展示了人形機器人Optimus的全新型號。這些都是具身智能駛入發(fā)展快車道的縮影。
值得一提的是,在大眾語境中,具身智能常常會被認知為人形機器人,以此作為其通俗意義的指代稱呼。但具身智能不能完全等同于人形機器人,它代表的是一種智能技術,當具身智能走進物理世界、與不同硬件結合時,形成的硬件有可能是機械手臂、四足或六足機器人、輪式機器人,或者人形機器人,因此二者的范疇是不同的,人形機器人只是可能承載具身智能的一個本體。
具身智能強調的是機器能夠像人類一樣感知和交互的能力,不僅僅局限于思維和計算能力。它涉及多個學科和技術,包括機器人學、計算機視覺、計算機圖形學、語音與自然語言處理技術等,這些技術共同作用,使機器能夠理解、推理并與物理世界進行有效的互動。換句話說,具身智能的獨特意義在于為實體機器人安上“大腦”,讓“機器”真正變成“機器人”。
隨著AI技術的不斷突破,機器人產業(yè)或將成為下一個萬億市場。人形機器人是AI最有前景的落地方向之一,未來不僅能將人類從低級和高危行業(yè)中解放出來,提升人類生產力水平和工作效率,還可以在工業(yè)、商業(yè)、家庭、外太空探索等領域具有廣闊應用場景。
根據(jù)Precedence Research數(shù)據(jù),2022年全球人形機器人市場規(guī)模約為16.2億美元,預計到2032年,全球人形機器人的市場規(guī)模將增至286.6億美元,2022-2032年的CAGR高達33.28%市場空間廣闊。
當前,阻礙人形機器人商業(yè)化量產的原因包括大規(guī)模應用場景不足以及存在諸多技術問題亟待解決。
一方面,應用場景直接影響機器人需求的剛性程度,目前人形機器人應用場景仍有待挖掘。
另一方面,人形機器人尚處于功能相對簡單、初步智能的形態(tài)。其解決路徑核心仍是機器人功能和智能化水平提升,支撐機器人從封閉場景走向開放場景,從單一場景進入復雜場景。提升通用化水平是未來人形機器人行業(yè)發(fā)展的必由之路,必須依靠AI技術的進步和發(fā)展,AI技術與機器人的結合,將彌補當前機器人在智能性、易用性、經(jīng)濟性上的短板,有效提升機器人在各個行業(yè)的滲透率。
傳統(tǒng)的深度學習模型中,機器智能往往局限于特定場景,而在ChatGPT、PaLM為代表的AI多模態(tài)大模型的賦能下,機器人可以與真實世界進行多模態(tài)交互,從而實現(xiàn)具身智能,并擁有不斷進化、跨場景應用的能力。
技術進步與挑戰(zhàn)并存
依托大規(guī)模數(shù)據(jù)和強大算力的大模型,為機器理解世界提供了前所未有的能力。它與具身智能的結合,預示著機器人的未來將更加智能化、互動化。
在制造業(yè)領域,機器人集成了人工智能、高端制造、新材料等先進技術,被譽為“制造業(yè)皇冠頂端的明珠”。而結合大模型的人形機器人,更是新質生產力發(fā)展的重要代表。
去年11月,工業(yè)和信息化部印發(fā)《人形機器人創(chuàng)新發(fā)展指導意見》,提出人形機器人集成人工智能、高端制造、新材料等先進技術,發(fā)展?jié)摿Υ蟆们熬皬V,是未來產業(yè)的新賽道。
發(fā)展具身智能,主要可從三方面發(fā)力。
一是仿生機制。具身智能的一個關鍵目標是使機器能像生物體一樣具備感知、決策和運動能力。因此,更深入地研究和模仿復雜的生物機制,如神經(jīng)系統(tǒng)的運行方式、生物體的自我修復能力等,是實現(xiàn)這一目標的重要途徑。
二是基于物理的智能決策能力。智能系統(tǒng)需要更緊密地與其所處的物理形態(tài)融合,以便在各種環(huán)境中自然、高效地執(zhí)行任務。這意味著需要發(fā)展出更先進的機器人硬件和軟件技術,支持智能系統(tǒng)在復雜環(huán)境中的運動和操作。
三是自主學習和適應環(huán)境。具身智能系統(tǒng)需要具備自主學習和適應環(huán)境能力,以便能在復雜多變的環(huán)境中執(zhí)行任務和解決問題。這可以通過強化學習、遷移學習等機器學習技術實現(xiàn)。
然而,難題和挑戰(zhàn)也如影隨形。
首當其沖的是算力。具身智能需要進行大量計算來支持感知、決策和運動過程。隨著任務和環(huán)境復雜性的升級,其對算力的需求會不斷增加。目前,大模型的參數(shù)已經(jīng)達到萬億級別。這類大模型存在過度消耗數(shù)據(jù)和算力的問題。沒有深度學習時,算力對電力的依賴每20個月翻一番;大模型時代,算力對電力的依賴,每年都要翻10到100倍??梢?,算力對電力的消耗呈幾何指數(shù)增長。
數(shù)據(jù)安全也不可忽視。具身智能系統(tǒng)需要收集和處理大量數(shù)據(jù)進行學習優(yōu)化,這些數(shù)據(jù)可能包含用戶個人隱私信息。除了隱私泄露,具身智能在實踐應用中,還可能帶來模型中毒、數(shù)據(jù)竄改、內部威脅、蓄意攻擊等數(shù)據(jù)安全威脅。
隨著具身智能技術不斷發(fā)展,也需要關注其可能帶來的倫理和道德問題。例如,如何確保機器人在執(zhí)行任務時不傷害人類或造成不必要的損失,如何保證機器人行為符合人類道德和價值觀等。
具身智能的萬里長征
在2024北京智源大會上,針對當下人形機器人賽道參與者眾多、創(chuàng)業(yè)項目層出不窮的現(xiàn)象,零一萬物CEO、創(chuàng)新工場董事長李開復“潑”了一盆冷水,他透露,目前創(chuàng)新工場投資了約6家無人駕駛公司,卻并沒有投資任何一家具身智能、人形機器人公司。李開復指出,具身智能是物理世界跟AI的結合,一旦大模型接入物理世界,就需要面臨包括安全問題、機器問題、機械問題、故障問題在內的各種問題,難度會增加很多倍。
具身智能是重要的,它可以很好地結合大模型多模態(tài)能力,而且一旦實現(xiàn)之后就可以產生數(shù)據(jù),形成數(shù)據(jù)飛輪閉環(huán),有很大的想象空間。但具身智能要在短期做好,難度很大,必然要走漫長的道路。
張亞勤從AI安全方面發(fā)出了提醒,隨著AI能力的不斷擴大,AI的安全風險也在擴大,因此現(xiàn)在考慮未來的風險是很重要的。當AGI達到一定能力并被大規(guī)模部署,那么可能會有失控的風險。目前AI仍存在可解釋性問題,未來機器人數(shù)量可能會比人要多,當大模型被用到基礎物理設施、金融系統(tǒng),包括國家安全、軍事系統(tǒng)等方面,就可能會有失控的風險。
人工智能的未來就像“薛定諤的貓”,充滿不確定性。但可以確定的是,人類不會在各種陷阱面前望而卻步、畏首畏尾。面對人工智能帶來的陷阱,堅持開放而審慎、包容而敬畏、大膽而自信的心態(tài),我們就能與新技術的更迭保持同頻,站在人工智能的肩膀之上抓住機遇,確保AI技術朝著有益于人類福祉的方向發(fā)展。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美國無人機禁令升級?當?shù)乜茖W家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實力
- 自動駕駛第一股的轉型迷途:圖森未來賭上了AIGC
- 明星熱劇、品牌種草、平臺資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機看它就夠了!
- 游戲體驗天花板,一加 Ace 5 系列售價 2299 元起
- 16個月沒工資不敢離職,這些打工人“自費上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問界M9,中國豪華車的龍門一躍
- 科技云報道:人工智能時代“三大件”:生成式AI、數(shù)據(jù)、云服務
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。