自動駕駛狂飆突進(jìn),數(shù)據(jù)標(biāo)注需求激增
據(jù)不完全統(tǒng)計(jì),2022年1月至10月,國內(nèi)自動駕駛領(lǐng)域共融資67起,披露融資額累計(jì)達(dá)143億元;而從10月到12月,國內(nèi)智能駕駛相關(guān)領(lǐng)域發(fā)生融資事件40多起,累計(jì)融資超百億元,自動駕駛“狂飆”之勢顯著。
這一方面得益于前景的牽引——麥肯錫研究報告指出,2030年中國自動駕駛汽車總銷售額將達(dá)2300億美元,基于自動駕駛的出行服務(wù)訂單金額將達(dá)2600億美元,是全球最大的自動駕駛市場;另一方面也受益于政策的驅(qū)動——工信部發(fā)文對L3、L4自動駕駛車輛展開試點(diǎn)工作,國家首次發(fā)放城市高級輔助駕駛地圖許可……
在自動駕駛狂飆突進(jìn)之際,其背后關(guān)鍵的數(shù)據(jù)標(biāo)注需求也在激增。IDC數(shù)據(jù)顯示,2021年我國人工智能數(shù)據(jù)采集、標(biāo)注服務(wù)市場規(guī)模為30億元左右。未來幾年將保持快速增長,增速維持在20%以上,預(yù)計(jì)2025年市場規(guī)模將達(dá)到123.4億元。自動駕駛正是其中需求巨大且增長迅速的一個領(lǐng)域。
自動駕駛行業(yè)的數(shù)據(jù)標(biāo)注,指的是在采集自動駕駛各場景數(shù)據(jù)后,通過分類、分割、關(guān)鍵點(diǎn)線標(biāo)注、畫框、追蹤等處理方式,對圖像、文本、語音、視頻、3D點(diǎn)云等原素材中的各類對象進(jìn)行標(biāo)記注釋,將多源異構(gòu)的數(shù)據(jù)轉(zhuǎn)化成可識別的AI訓(xùn)練數(shù)據(jù),從而成為機(jī)器學(xué)習(xí)的價值數(shù)據(jù)。
據(jù)英特爾推算,在全自動駕駛時代,每輛汽車每天產(chǎn)生的數(shù)據(jù)量高達(dá)4000GB,但這些數(shù)據(jù)中可用于訓(xùn)練的價值數(shù)據(jù)占比不到5%。因此自動駕駛訓(xùn)練需要從海量的數(shù)據(jù)中“淘”到有用的價值數(shù)據(jù)。在自動駕駛算法拉不開差距的情況下,越是高級別的自動駕駛,越是依賴數(shù)據(jù)標(biāo)注的質(zhì)量。
數(shù)據(jù)標(biāo)注范式生變,AI破局人海戰(zhàn)術(shù)
數(shù)據(jù)標(biāo)注是一個勞動密集型產(chǎn)業(yè),非常依賴人工,拼的是規(guī)模和人力成本。為此還興起了一個名為“數(shù)據(jù)標(biāo)注師”的職業(yè),他們每天在各種圖片上框選物體,標(biāo)注名稱,做著簡單重復(fù)的工作。同時,這個產(chǎn)業(yè)也像汽車自動駕駛一樣不斷在進(jìn)化。
一般認(rèn)為,智能駕駛/自動駕駛領(lǐng)域的數(shù)據(jù)標(biāo)注發(fā)展大致經(jīng)歷了三個階段。2012年前的第一代數(shù)據(jù)標(biāo)注以開源的單機(jī)標(biāo)注工具為代表,具備有限場景的標(biāo)注能力,主要滿足10K以下數(shù)量級的標(biāo)注處理;2012年后隨著深度學(xué)習(xí)走熱,新興的數(shù)據(jù)標(biāo)注平臺具備了多場景數(shù)據(jù)標(biāo)注能力,可以滿足10K-100K數(shù)量級的標(biāo)注處理;2019年后自動駕駛的火熱對數(shù)據(jù)標(biāo)注的量級提出更高要求,純?nèi)斯つJ诫y以應(yīng)對100K、1000K甚至更大規(guī)模的數(shù)據(jù)標(biāo)注,AI開始介入形成人機(jī)協(xié)同的智能化數(shù)據(jù)平臺。
經(jīng)過數(shù)年的耕耘,在2022年這個自動駕駛商業(yè)化進(jìn)程顯著加速的轉(zhuǎn)折之年,國內(nèi)已經(jīng)出現(xiàn)一批優(yōu)質(zhì)的主打自動化、精細(xì)化的數(shù)據(jù)標(biāo)注平臺,利用AI的無限生產(chǎn)力,代替有限的人工生產(chǎn)力,為自動駕駛數(shù)據(jù)標(biāo)注行業(yè)降本、提質(zhì)、增效。
以曼孚科技為例,這家國內(nèi)最早專注自動駕駛數(shù)據(jù)標(biāo)注領(lǐng)域的企業(yè),在2022年7月宣布完成5000萬元Pre-B輪融資(近三年累計(jì)融資金額數(shù)億元)后,已經(jīng)進(jìn)化為一家AI驅(qū)動的數(shù)據(jù)智能平臺。其MindFlow SEED 數(shù)據(jù)服務(wù)平臺通過AI+RPA驅(qū)動自動駕駛數(shù)據(jù)標(biāo)注規(guī)?;慨a(chǎn),在數(shù)據(jù)處理(尤其是3D點(diǎn)云數(shù)據(jù)處理)領(lǐng)域建立起6-12個月的技術(shù)壁壘,將綜合人效平均提升30%,數(shù)據(jù)生產(chǎn)成本平均降低40%,突破了產(chǎn)能局限,實(shí)現(xiàn)了AI數(shù)據(jù)規(guī)?;慨a(chǎn)。
這方面國際標(biāo)桿是一家名為Scale AI的創(chuàng)業(yè)企業(yè)。該公司人利用AI訓(xùn)練數(shù)據(jù),借助美國大力發(fā)展自動駕駛的東風(fēng),2022年已成為估值73億美元的行業(yè)獨(dú)角獸。
受限于美國高昂的人力成本,Scale AI很早就將人工智能應(yīng)用到自己的數(shù)據(jù)標(biāo)注服務(wù)中,即先用AI識別一遍,再用人工主要負(fù)責(zé)校對其中的錯誤;校對完的數(shù)據(jù)再度用來訓(xùn)練AI系統(tǒng),使得下一次標(biāo)注更精準(zhǔn)……如此往復(fù)循環(huán),隨著訓(xùn)練數(shù)據(jù)越來越多,做標(biāo)注的效率也就越來越快,需要人工參與也就越來越少,成本自然也就越來越低。
先進(jìn)技術(shù)需要落地,產(chǎn)品力決定生命力
當(dāng)然需要指出的是,隨著自動駕駛市場提速以及Scale AI憑借AI標(biāo)注大獲成功,國內(nèi)一些泛數(shù)據(jù)標(biāo)注企業(yè)也火速搭上自動駕駛和AI自動標(biāo)注的便車,仿佛一夜之間從過去的人海時代升級到AI時代,但其實(shí)這并沒有解決根本問題,背后極有可能還是人海戰(zhàn)術(shù)。
極客智庫研究認(rèn)為,AI在自動駕駛數(shù)據(jù)標(biāo)注領(lǐng)域的應(yīng)用是一個行業(yè)+AI的過程,兩者融合的成效取決于廠商在自動駕駛數(shù)據(jù)標(biāo)注這個行業(yè)的專注程度以及Know-how水平。換句話說,那些起步較早且專注于自動駕駛數(shù)據(jù)標(biāo)注領(lǐng)域的企業(yè),往往能夠?qū)⑿袠I(yè)知識與AI技術(shù)深度磨合,打造出AI人機(jī)協(xié)同的數(shù)據(jù)標(biāo)注產(chǎn)品及智能化數(shù)據(jù)平臺,獲得市場的檢驗(yàn)和認(rèn)可。
總之,自動駕駛的星辰大海需要更多價值數(shù)據(jù)作為“養(yǎng)料”,我們呼喚更多真正的AI標(biāo)注產(chǎn)品及智能數(shù)據(jù)平臺為此助力,共創(chuàng)共贏美好明天!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )