借力算法,海天瑞聲駕馭自動駕駛“新引擎”

2022 年的 3 月,或?qū)⒈粚懭胱詣玉{駛史冊——美國頒布無人駕駛法規(guī),中國也許將從政策層面允許 L3 自動駕駛乘用車上路,國內(nèi)首條支持自動駕駛的快速路通車運(yùn)營…… 毫無疑問,自動駕駛已經(jīng)逐漸從快速迭代邁入大規(guī)模落地階段。在這個(gè) “臨門一腳” 的關(guān)鍵時(shí)刻,想要讓汽車本身的算法做到處理更多、更復(fù)雜的場景,不可或缺的是海量的場景數(shù)據(jù)支撐。

通過對話國內(nèi)唯一 A 股上市數(shù)據(jù)服務(wù)商—海天瑞聲,透視 AI 數(shù)據(jù)在助推自動駕駛實(shí)現(xiàn)的路上,所面臨的機(jī)會與挑戰(zhàn)。

一、自動駕駛數(shù)據(jù)迎來爆發(fā)期

2022 年將會是自動駕駛商業(yè)化轉(zhuǎn)折點(diǎn)。

回溯 2021 年底,北京成為國內(nèi)首個(gè)明確認(rèn)可 「 RoboTaxi 」 商業(yè)化試點(diǎn)的城市,標(biāo)志著國內(nèi)自動駕駛賽道迎來商業(yè)化運(yùn)營階段。

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

相關(guān)數(shù)據(jù)和圖片來自 36 氪、漢能投資發(fā)布的《2022 中國自動駕駛行業(yè)研究報(bào)告》

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

Gartner 公司 2022 年汽車行業(yè)十大業(yè)務(wù)趨勢

常規(guī)自動駕駛汽車服務(wù)啟動,挑戰(zhàn)隨之而來,也是值得關(guān)注的業(yè)務(wù)趨勢之一

目前,自動駕駛主流算法模型主要以有監(jiān)督學(xué)習(xí)為主,這需要大量的標(biāo)注數(shù)據(jù)對模型進(jìn)行訓(xùn)練和調(diào)優(yōu)。只有通過各個(gè)場景的數(shù)據(jù)迭代,自動駕駛才可能真正落地。

是否能高效獲取大量標(biāo)注數(shù)據(jù)直接決定了各家能否獲得自動駕駛市場上的先發(fā)優(yōu)勢。

盡管一些行業(yè)頭部企業(yè)已經(jīng)內(nèi)部搭建起數(shù)據(jù)標(biāo)注團(tuán)隊(duì),訓(xùn)練數(shù)據(jù)服務(wù)商依然是它們背后無法忽略的存在。

作為國內(nèi)訓(xùn)練數(shù)據(jù)行業(yè)的領(lǐng)頭羊,海天瑞聲近幾年也開始與一些傳統(tǒng)車企、造車新勢力以及頭部自動駕駛技術(shù)公司合作,探索如何幫助合作伙伴最大程度釋放自動駕駛數(shù)據(jù)的價(jià)值。

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

IDC 預(yù)測,到 2025 年,中國人工智能數(shù)據(jù)采標(biāo)服務(wù)市場規(guī)模將達(dá)到 123.4 億元人民幣。市場的發(fā)展驅(qū)動力一方面來源于人工智能市場的迅猛發(fā)展,另一方面來源于行業(yè)用戶加大數(shù)據(jù)采集力度。

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

IDC 數(shù)據(jù)顯示,自動駕駛也是 AI 基礎(chǔ)服務(wù)市場當(dāng)中最具增長潛力的行業(yè)

二、把好「第一關(guān)」:數(shù)據(jù)方案的設(shè)計(jì)能力

與智能家居、新零售、安防等垂直領(lǐng)域相比,自動駕駛的數(shù)據(jù)需求格外“苛刻”,對數(shù)據(jù)服務(wù)商也提出了新的挑戰(zhàn)。

例如,數(shù)據(jù)樣本豐富度層面,場景覆蓋全面的數(shù)據(jù)集對自動駕駛系統(tǒng)安全性至關(guān)重要。想象一下,如果高速路上突然出現(xiàn)一群野象,或者突然有人橫穿馬路,自動駕駛汽車該如何應(yīng)對?

這類 Corner case 數(shù)據(jù)很難采集,我們不可能真的找一群野象去高速上漫步,然后采集數(shù)據(jù)。

對于這些現(xiàn)實(shí)生活中完全有可能發(fā)生的情況,系統(tǒng)如果識別不了,將會導(dǎo)致嚴(yán)重的后果甚至生命損失。所以,相應(yīng)的數(shù)據(jù)必不可少,無論是通過技術(shù)手段合成還是模擬,數(shù)據(jù)方案的設(shè)計(jì)能力都尤為重要。

此時(shí),海天瑞聲作為綜合數(shù)據(jù)服務(wù)商的顯著優(yōu)勢就凸顯出來:總的說來,行業(yè)現(xiàn)階段訓(xùn)練數(shù)據(jù)采集標(biāo)注的定制化需求較多,海天瑞聲在基礎(chǔ)研究上的多年積累,使得其能夠更好把握現(xiàn)有技術(shù)方向,深入了解客戶對訓(xùn)練數(shù)據(jù)的運(yùn)用邏輯和需求痛點(diǎn),保證客戶算法取得盡可能好的落地效果。

具體到自動駕駛項(xiàng)目需求上,海天瑞聲在項(xiàng)目啟動前會安排專業(yè)團(tuán)隊(duì)先根據(jù)需求設(shè)計(jì)好訓(xùn)練數(shù)據(jù)集結(jié)構(gòu),讓容量有限的訓(xùn)練數(shù)據(jù)集能夠覆蓋盡可能多的現(xiàn)象,并制定相應(yīng)合理的數(shù)據(jù)比例。

比如,項(xiàng)目如果涉及卡車,覆蓋高速路場景的比例會很高,上下閘道之類的相關(guān)場景也要考慮到;如果涉及市內(nèi)乘用車,設(shè)計(jì)方案時(shí)需要覆蓋各種路口情況,諸如三叉路的十字路口、轉(zhuǎn)向線等,有沒有掉頭的,或者不是兩側(cè)掉頭的,甚至左轉(zhuǎn)道在最右側(cè)等罕見情況,都要覆蓋到。

為了讓數(shù)據(jù)集更完整、豐富,諸如道路兩側(cè)場景、路上障礙物,車輛擁擠、稀疏以及行人多少之類情況也要提前考慮,特別是一些突發(fā)情況,比如突然橫穿馬路,盡管這種場景的覆蓋難度會更大。

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

海天瑞聲自動駕駛數(shù)據(jù)業(yè)務(wù)的主要內(nèi)容

有時(shí),客戶也并不清楚什么樣的數(shù)據(jù)方案更符合算法需求。例如較之經(jīng)驗(yàn)相對豐富的互聯(lián)網(wǎng)大廠,傳統(tǒng)車企更需要擁有豐富方案設(shè)計(jì)經(jīng)驗(yàn)的服務(wù)商,幫忙引導(dǎo)、梳理并細(xì)化出具體需求。

比如,面對突發(fā)狀況司機(jī)踩剎車,對于自動駕駛決策系統(tǒng)來說,急剎車之前多少秒的數(shù)據(jù)更有價(jià)值?低可視度惡劣天氣場景的數(shù)據(jù)量需要多少?需要以何種方式采集?以多少秒一幀的速度采集?

通過技術(shù)對技術(shù)、算法層面的反復(fù)溝通,海天瑞聲可以幫助客戶找到更加貼合使用場景的數(shù)據(jù)方案,縮減研發(fā)周期、加快落地進(jìn)程,同時(shí)避免客戶花費(fèi)更多成本。

三、「人機(jī)耦合」下的精度、效率與規(guī)模

高質(zhì)量自動駕駛訓(xùn)練數(shù)據(jù),除了來自樣本豐富度的“刁難”,還要面臨標(biāo)注過程高精度、高效率規(guī)?;鳂I(yè)帶來的挑戰(zhàn)。

舉例來說,同樣是 99% 精準(zhǔn)度,對語音合成任務(wù)中的大多場景來說已經(jīng)足夠優(yōu)質(zhì),但對于自動駕駛場景來說,卻極有可能埋下安全隱患。

基于對安全性的嚴(yán)苛要求,智能駕駛數(shù)據(jù)(主要是艙外)正朝著多模態(tài)的方向發(fā)展,所謂多模態(tài),是指多維時(shí)間、空間、環(huán)境數(shù)據(jù)的感知與融合。比如,一輛車可能配置少則 4-5 個(gè)、多則十幾個(gè)攝像頭,外加雷達(dá)(激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)等)。

市面采用的激光雷達(dá)基本都是 64 線甚至以上,受限于各種硬件設(shè)備,傳回來的數(shù)據(jù)很難做到完全同步。由于點(diǎn)云是一個(gè)連續(xù)幀的概念,標(biāo)注多路數(shù)據(jù)如果不一致,會影響到算法模型訓(xùn)練。另一方面,3D 激光雷達(dá)數(shù)據(jù)和 2D 普通攝像頭數(shù)據(jù)標(biāo)注如何同步,也是一個(gè)難點(diǎn)。這些都成為橫亙在高精度標(biāo)注需求面前的難題。

與此相對應(yīng)的卻是標(biāo)注環(huán)節(jié)生產(chǎn)力的落后。

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

訓(xùn)練數(shù)據(jù)生產(chǎn)過程示意圖

《2019 年中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)白皮書》分析指出,2010-2016 年早期數(shù)據(jù)標(biāo)注需求激增,加之入行門檻低,涌入了大量玩家,魚龍混雜。直到今天,絕大部分?jǐn)?shù)據(jù)服務(wù)商還處于解決「數(shù)據(jù)標(biāo)注工具有無」的階段。

很多團(tuán)隊(duì)依靠開源工具完成絕大部分項(xiàng)目,不僅沒有點(diǎn)云標(biāo)注工具,基本流程管理也沒有(比如,哪類數(shù)據(jù)應(yīng)該被篩選?質(zhì)量不合格的標(biāo)注該怎么辦?),根本不可能交付自動駕駛所需的高質(zhì)量、高精度數(shù)據(jù)集。

而伴隨 AI 在出行領(lǐng)域的深入落地,智能駕駛級別越高,所需的傳感器數(shù)量則越多、精度要求也越高,相應(yīng)的數(shù)據(jù)量就會急劇增加,一個(gè)項(xiàng)目動輒數(shù)百萬條的數(shù)據(jù)處理量,早已不是作坊式作業(yè)可以應(yīng)對。

例如,Waymo Open Dataset 有 16.7 個(gè)小時(shí)的視頻數(shù)據(jù),3,000 個(gè)駕駛場景,60 萬視頻幀,將近 200 萬 3D 多邊形和 2200 萬 2D 多邊形標(biāo)注,而這只是 Waymo 大量私有自動駕駛數(shù)據(jù)集的一小部分。

快速變化的市場環(huán)境,對數(shù)據(jù)交付工期的要求也更為苛刻,只有更加自動化、智能化、平臺化的數(shù)據(jù)服務(wù),才能更好地滿足客戶需求。

作為浸潤行業(yè)十幾年的頭部服務(wù)商,海天瑞聲從成立之初,就在摸索各環(huán)節(jié)人機(jī)協(xié)作的可能,實(shí)現(xiàn)數(shù)據(jù)標(biāo)注服務(wù)質(zhì)量、速度和規(guī)模化的最佳平衡。

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

一體化數(shù)據(jù)處理平臺示意圖

其十多項(xiàng)核心技術(shù)應(yīng)用于訓(xùn)練數(shù)據(jù)生產(chǎn)的設(shè)計(jì)、采集、加工、質(zhì)檢中,自主研發(fā)一體化數(shù)據(jù)處理平臺,將項(xiàng)目流程管理、質(zhì)量把控、數(shù)據(jù)安全管理融入其中,并嵌入上千款自主開發(fā)積累的,適用于各種業(yè)務(wù)場景訓(xùn)練數(shù)據(jù)處理需求的工具,充分提高了數(shù)據(jù)訓(xùn)練的生產(chǎn)效率與質(zhì)量控制水平。

具體到自動駕駛場景,一般人眼中,3D 點(diǎn)云只是一片點(diǎn)狀物,很難直觀看出具體是什么。但資深標(biāo)注員會就同一個(gè)連續(xù)幀的前、后幾幀來回看,有時(shí)還會搭配 2D 圖片一起看,「腦補(bǔ)」點(diǎn)云數(shù)據(jù)無法呈現(xiàn)的部分。

海天瑞聲自動駕駛標(biāo)注平臺有一個(gè)叫做「輔助構(gòu)建物體腦補(bǔ)框」的工具,能幫助標(biāo)注員進(jìn)行更為精確的「腦補(bǔ)」。比如,拉框后,系統(tǒng)會自動就同一個(gè)連續(xù)幀的前、后幾幀內(nèi)容進(jìn)行預(yù)判,還會給出一些諸如車輛大小的參考。

其次,這一標(biāo)注平臺覆蓋自動駕駛場景下不同類型數(shù)據(jù)的標(biāo)注工具,能夠大幅提升標(biāo)注效率。例如,平臺支持 3D 點(diǎn)云標(biāo)注、3D 點(diǎn)云連續(xù)幀標(biāo)注、3D 連續(xù)幀與 2D 聯(lián)合的標(biāo)注、3D 語義分割等,還可根據(jù)客戶的個(gè)性化需求對平臺工具進(jìn)行二次開發(fā),當(dāng)屬業(yè)內(nèi)領(lǐng)先。

借力算法,海天瑞聲駕馭自動駕駛“新引擎”

海天瑞聲 3D 點(diǎn)云標(biāo)注平臺

3D 點(diǎn)云連續(xù)幀標(biāo)注時(shí),前兩幀標(biāo)注的物體,自動化工具會在第三幀上自動預(yù)測物體位置。由于算法會先介入做判斷,標(biāo)注員的工作很大程度上是一個(gè)校正過程,效率和準(zhǔn)確率都有極大的保證。

最后,一體化數(shù)據(jù)處理平臺的先進(jìn)性不僅在于提供了統(tǒng)一入口和統(tǒng)一風(fēng)格,有助于提升數(shù)據(jù)采集、加工效率,還將公司多年行業(yè)深耕經(jīng)驗(yàn)沉淀到平臺上,不僅簡化并統(tǒng)一了訓(xùn)練數(shù)據(jù)生產(chǎn)流程,模塊式的項(xiàng)目生成和管理方式使得生產(chǎn)人員可以根據(jù)實(shí)際項(xiàng)目需求有機(jī)結(jié)合、靈活調(diào)整。

四、系統(tǒng)化平臺:落腳質(zhì)保與安全

除了精度、效率和規(guī)?;?,一體化平臺還能為數(shù)據(jù)標(biāo)注質(zhì)量保駕護(hù)航。

質(zhì)量檢測和控制理念被嵌入到平臺各環(huán)節(jié)工具之中:比如在采集環(huán)節(jié),采集工具可對原始數(shù)據(jù)質(zhì)量進(jìn)行即時(shí)質(zhì)檢,不符合要求的原始數(shù)據(jù)會被系統(tǒng)工具提示因某項(xiàng)要求不達(dá)標(biāo),無法錄入;中端加工環(huán)節(jié),運(yùn)用自動標(biāo)注工具 + 人工校對檢驗(yàn)的方式,對數(shù)據(jù)標(biāo)注情況進(jìn)行檢查,提升數(shù)據(jù)質(zhì)量;在后端大規(guī)模質(zhì)檢環(huán)節(jié),運(yùn)用全自動校驗(yàn)技術(shù),實(shí)現(xiàn)大規(guī)模訓(xùn)練數(shù)據(jù)集 100% 的質(zhì)檢需求。

目前,海天瑞聲一體化平臺已經(jīng)沉淀數(shù)百個(gè)質(zhì)檢點(diǎn),可滿足所有日常業(yè)務(wù)場景需求,如檢驗(yàn)圖片、視頻文件格式是否正確、物體種類數(shù)量是否達(dá)標(biāo),打點(diǎn)標(biāo)框準(zhǔn)確率是否符合要求等。

其實(shí),人機(jī)協(xié)作下的高效率、高質(zhì)量數(shù)據(jù)標(biāo)注,只是數(shù)據(jù)服務(wù)整體流程中的一部分。數(shù)據(jù)集管理、項(xiàng)目管理、團(tuán)隊(duì)人員管理等與數(shù)據(jù)安全、合規(guī)息息相關(guān),同樣不可忽略。

與一體化數(shù)據(jù)處理平臺相配合,海天瑞聲還建立了全時(shí)日志庫及終端人管理系統(tǒng),實(shí)現(xiàn)平臺內(nèi)操作留痕、透明可追溯和平臺內(nèi)不同角色的嚴(yán)格權(quán)限分級,確保數(shù)據(jù)安全。

針對不同安全等級的訴求,海天瑞聲可以提供不同級別的解決方案??蛻艨梢园褦?shù)據(jù)放在海天的平臺上來做,也可以部署到自己服務(wù)器,甚至還能提供入場標(biāo)注。

隨著國家大舉培養(yǎng)數(shù)據(jù)要素市場、數(shù)據(jù)流通持續(xù)改善,《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》與《個(gè)人信息保護(hù)法》等上位法的陸續(xù)發(fā)布,數(shù)據(jù)安全與隱私保護(hù)也得到社會各界越來越多的關(guān)注。

海天瑞聲也率先通過了 ISO/IEC 27701 認(rèn)證,這意味著,其數(shù)據(jù)生產(chǎn)過程中個(gè)人隱私信息安全管理和保護(hù)能力符合「重要的全球性隱私保護(hù)標(biāo)準(zhǔn)」,也通過了「最嚴(yán)苛資質(zhì)的審核」。

如今,個(gè)人信息從設(shè)計(jì)、采集、處理、質(zhì)檢到交付均已嚴(yán)格管控在平臺范圍內(nèi),并通過標(biāo)準(zhǔn)化的數(shù)據(jù)脫敏、嚴(yán)格的終端人管理系統(tǒng)、隱私程度分級及權(quán)限隔離、全時(shí)自動監(jiān)控等措施全流程保障個(gè)人隱私信息的安全。

長遠(yuǎn)來看,只有在安全、合規(guī)的角度下樹立數(shù)據(jù)服務(wù)標(biāo)桿,才能在行業(yè)里實(shí)現(xiàn)良幣驅(qū)逐劣幣,真正讓人工智能成為新一輪技術(shù)革命的引擎。

五、面對未知:摸石頭過河的底層能力

對數(shù)據(jù)生產(chǎn)效率、數(shù)據(jù)質(zhì)量保證和數(shù)據(jù)隱私安全的嚴(yán)格把控,幫助海天瑞聲在市場競爭中脫穎而出。

除了這些,還有一項(xiàng)異常重要的底層能力—與客戶一起摸著石頭過河、共同探索全新業(yè)務(wù)挑戰(zhàn)的實(shí)力與勇氣。

20 年前,人工智能商業(yè)落地還處在起步階段,真實(shí)場景下的泛化能力有限。

海天瑞聲歷經(jīng)數(shù)千個(gè)項(xiàng)目的打磨,服務(wù)全球 500 余家大型科技公司、頭部 AI 企業(yè)和科研院所,積累了大量行業(yè) Know-how,探索出幫助 AI 項(xiàng)目大幅縮短落地周期、降低成本的技術(shù)與方案能力,這也是其能夠探索 “未知” 領(lǐng)域的底氣所在。

就自動駕駛數(shù)據(jù)標(biāo)注市場來說,當(dāng)前大多數(shù)客戶的痛點(diǎn)之一在于如何實(shí)現(xiàn)駕駛中的數(shù)據(jù)閉環(huán),這些數(shù)據(jù)服務(wù)商的要求已經(jīng)遠(yuǎn)遠(yuǎn)超越了簡單的采集和標(biāo)注能力,需要集技術(shù)、資金、經(jīng)驗(yàn)等綜合實(shí)力于一體的數(shù)據(jù)服務(wù)商與客戶一起摸索、試錯(cuò)。

如同蒸汽時(shí)代的蒸汽機(jī)、電氣時(shí)代的發(fā)電機(jī)、信息時(shí)代的計(jì)算機(jī)和互聯(lián)網(wǎng),人工智能正成為推動人類進(jìn)入智能時(shí)代的決定性力量。

隨著人工智能邁入「數(shù)據(jù) + 知識」雙輪驅(qū)動的新一代,數(shù)據(jù)要素的市場地位被高度認(rèn)同,市場空間廣闊。根據(jù)艾瑞、IDC 等第三方機(jī)構(gòu)對 AI 訓(xùn)練數(shù)據(jù)行業(yè)的研究,中國市場規(guī)模預(yù)計(jì)在 2025 年達(dá)到 100 + 億,全球訓(xùn)練數(shù)據(jù)市場規(guī)模約在 500 億以上。

麥肯錫中國區(qū)數(shù)字化咨詢業(yè)務(wù)近期預(yù)測,未來幾年中國自動駕駛商業(yè)化會比預(yù)期更早來臨。

在邁向商業(yè)化的征途中,海天瑞聲會與企業(yè)共同摸索出加速模型訓(xùn)練、產(chǎn)品落地和迭代更新的最佳路徑,更好地服務(wù)于未來社會。(作者:吳昕)

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )