深蘭科技的征途,AI的賽場與戰(zhàn)場

原標(biāo)題:深蘭科技的征途,AI的賽場與戰(zhàn)場

在頂尖學(xué)術(shù)會議中成功“刷榜”,一直被看做是AI企業(yè)實力的絕對證明。尤其是在AI研究創(chuàng)新涌現(xiàn)、幾大頂會迎來“論文大爆炸”的背景下,學(xué)術(shù)競爭也愈加激烈,想要“出人頭地”,真不是件容易的事。

最近在全球計算機三大頂級會議之一ECCV 2020上一舉拿下8個賽事冠亞季軍大獎的深蘭科技,彰顯實力。

而且,深蘭科技也在Kaggle平臺上舉辦的ECCV挑戰(zhàn)賽Google Landmark Retrieval 2020上斬獲金牌,在計算機視覺模式識別會議CVPR2020中斬獲了12項冠亞季軍,在國際計算機視覺大會ICCV2019競賽中拿下“四冠四亞一季”的成績……各種優(yōu)異成績的井噴,顯然不是偶然。

我們知道,計算機視覺是當(dāng)前人工智能學(xué)術(shù)界非?;钴S的研究領(lǐng)域,而ICCV、CVPR、ECCV這計算機視覺方向的三大頂級會議,更是云集了谷歌、斯坦福、BAT等等科技巨頭,被中國計算機學(xué)會評為最高級別學(xué)術(shù)會議。

在這樣的“學(xué)術(shù)修羅場”能夠拿下挑戰(zhàn)賽的大滿貫、取得多個第一的戰(zhàn)績,深蘭科技的技術(shù)底蘊與含金量不容小覷。

初看結(jié)果,讀者們可能會很詫異,深蘭科技到底做了哪些創(chuàng)新,又對當(dāng)下乃至未來一段時間的AI研究帶來怎樣的影響?

沿著這些問題思考,或許我們能對AI技術(shù)與產(chǎn)業(yè)邏輯,有更深一層的理解與認(rèn)知。

深蘭科技的創(chuàng)新成績單

既然是硬核學(xué)術(shù)會議,自然還是成績說話。我們先來看看深蘭科技在三大頂會拿獎到手軟的各種創(chuàng)新算法,究竟都在做什么。

就以此次ECCV為例,深蘭科技獲得雙冠的GigaVision 2020挑戰(zhàn)賽,是由清華大學(xué)基于其新推出的數(shù)據(jù)集PANDA而組織的。

PANDA是全球首個十億像素級別視頻數(shù)據(jù)集,在如此大規(guī)模的數(shù)據(jù)集上完成圖像多類別目標(biāo)檢測,既要保證算法能夠在目標(biāo)尺度變化、擁擠遮擋的復(fù)雜情況下準(zhǔn)確地識別出行人和車輛這兩種不同的目標(biāo),還要保證足夠高效,在十億像素級別分辨率下快速完成。

顯然,這一任務(wù)的完成,能夠?qū)Υ笠?guī)?,F(xiàn)實場所中的行人檢測、動作識別、異常檢測等帶來技術(shù)上的飛躍,讓人臉識別、無人駕駛、監(jiān)控安防等應(yīng)用結(jié)果更準(zhǔn)、效率更高。

而針對技術(shù)上的難點,深蘭科技DeepBlueAI團隊在檢測賽道將任務(wù)解耦為多個子任務(wù),把難點獨立出來重點解決,并根據(jù)以往檢測經(jīng)驗,通過所積累的模塊和方法,使得結(jié)果有了進一步的提升。最終以領(lǐng)先第二名2.6個百分點的成績強勢獲得冠軍。

在其他類目的挑戰(zhàn)賽中,深蘭科技DeepBlueAI團隊相繼完成了基于部分MSCOCO數(shù)據(jù)集來進行80個類別目標(biāo)檢測的小樣本學(xué)習(xí)任務(wù);在不使用任何預(yù)訓(xùn)練模型從頭開始訓(xùn)練的限制下,在ImageNet的子集上獲得最高的準(zhǔn)確率;運用優(yōu)化數(shù)據(jù)增強方法、特征提取器、后處理等方法,對無人機視角拍攝的圖片,完成車輛、行人等目標(biāo)的定位分類……

上述成績,都只是深蘭科技2020年研究成果的一部分,也是其技術(shù)積淀和底蘊的又一次佐證。

實際上,在ICCV 2019,深蘭科技就曾在VisDrone Challenge (無人機視覺挑戰(zhàn)賽)中,運用Cascade RCNN+DCN+FPN+DoublueHead檢測器,以及IOU Tracker+ KCF+Tracklet vote的跟蹤算法,來解決部分目標(biāo)過小、數(shù)據(jù)分布影響預(yù)訓(xùn)練效果等難題,最終以領(lǐng)先4個多百分點的巨大優(yōu)勢獲得兩項冠軍。

CVPR 2020的NightOwls 檢測挑戰(zhàn)賽,也為參賽者們設(shè)置了不小的難題?,F(xiàn)有的視覺檢測算法不能很好滴解決夜間場景圖片中的行人,這無疑會給無人車夜間行駛的可靠性、監(jiān)控安防的安全性能等都帶來了一定的限制。

所以NightOwls就開展了相應(yīng)的比賽,而深蘭科技也順利在 “單幀行人檢測”和“多幀行人檢測”兩個賽道中拿下了冠軍。夜間行人檢測與白天行人檢測相結(jié)合,能夠打造適用于不同天氣條件、全天候的行人檢測系統(tǒng),讓現(xiàn)實世界的出行安全更有保障。

關(guān)于深蘭科技在數(shù)個AI頂會上的創(chuàng)新表現(xiàn),我們就不在此一一枚舉。可以肯定的是,深蘭科技作為中國AI企業(yè)的代表,在頂會競賽中大放異彩,不斷向全球傳達(dá)和證實著中國AI力量的實力,達(dá)到了世界領(lǐng)先水平。

深蘭科技的學(xué)術(shù)+產(chǎn)業(yè)“雙循環(huán)”模式

大家可能會好奇,在計算機視覺這一競爭激烈的賽道上占據(jù)技術(shù)上的多方位領(lǐng)先,深蘭科技到底做了些什么?

這恐怕就要從深蘭科技的業(yè)務(wù)邏輯說起了。

我們知道,2017年開始的人工智能資本熱潮,帶動了一大批AI企業(yè)的涌現(xiàn),大致可以歸為兩類:

一種是專研算法的技術(shù)型企業(yè)。其核心資產(chǎn)是算法、數(shù)據(jù)等能力,需要引入深度學(xué)習(xí)領(lǐng)域的高級人才,大量投入底層算法研發(fā)與創(chuàng)新,常常需要跟谷歌、微軟、Facebook這樣的科技巨頭“搶人”。盡管投入巨大,但也正是這一類企業(yè)推動了人工智能底層技術(shù)的不斷精進,而一旦達(dá)到規(guī)模效應(yīng),就很容易占據(jù)行業(yè)領(lǐng)軍者的位置。

而另一種則是產(chǎn)業(yè)升級的應(yīng)用型企業(yè)。商業(yè)邏輯也很清晰,就是向算法供應(yīng)商購買技術(shù),通過自己的工程師團隊將其打磨成體驗良好的成熟AI產(chǎn)品,借助自身的服務(wù)能力與銷售渠道將解決方案售賣出去。

而有意思的是,深蘭科技走出了一條獨特的路。

借用2020年十分火爆的一個關(guān)鍵詞“雙循環(huán)”來形容,深蘭科技一邊在各種AI頂會上尋求技術(shù)上的系統(tǒng)性、基礎(chǔ)層面的領(lǐng)先,一邊帶動AI技術(shù)落地應(yīng)用、服務(wù)民生,開辟了一個“基礎(chǔ)技術(shù)+產(chǎn)業(yè)聯(lián)動”的雙循環(huán)模式。

舉個例子,前面提到深蘭科技在CVPR 2020各個挑戰(zhàn)賽中提出的多項檢測與分類算法,就被落地應(yīng)用在了智能熊貓公交車等產(chǎn)品上,讓公交車自主制動和運行,為城市公共交通提供了新的選擇;乘客掃手就能上車,體驗和效率都大大提升;智能機器人還能感應(yīng)駕駛員和安全員的實時狀態(tài),最大程度地保障乘車安全;借助關(guān)鍵點檢測打造“異常行為識別系統(tǒng)”,車廂內(nèi)有人摔倒、偷盜等情況都可以及時告警……

再比如,智慧城市建設(shè)中部署的許多商業(yè)化攝像機,難以在惡劣天氣下保持比較穩(wěn)定的識別準(zhǔn)確率,給城市管理帶來了很多隱患。深蘭科技奪冠的“挑戰(zhàn)賽霧天條件下的(半)監(jiān)督目標(biāo)檢測任務(wù)”,恰好就針對這類問題,讓攝像機在惡劣天氣環(huán)境或光照條件較差的情況下,依然能夠很好地完成任務(wù),讓深蘭科技的客戶或集成其算法的企業(yè)能夠更好地使用AI。

今年春節(jié)期間,面對防疫工作中的測溫剛需,深蘭科技快速上線的AI熱感視覺行為監(jiān)控系統(tǒng)——貓頭鷹,就融合了多種世界冠軍級技術(shù),采用了紅外熱成像技術(shù)和自主研發(fā)的機器視覺算法,深度融合紅外和可見光圖像,人們只要進入被測溫范圍就能實時測出體溫,無需停留,在防疫的同時大大方便了出行。而能如此快速地打造出服務(wù)社會的剛需產(chǎn)品,顯然離不開深蘭科技將長期的技術(shù)積累與產(chǎn)業(yè)需求深度整合的能力。

正是這種底層研發(fā)突破與產(chǎn)業(yè)標(biāo)準(zhǔn)化落地的雙重效應(yīng),讓深蘭科技在學(xué)術(shù)競賽中彰顯實力的同時,也很快將先進算法落地,借由產(chǎn)業(yè)化的規(guī)模效應(yīng)實現(xiàn)商業(yè)價值,再進一步推動AI技術(shù)的進步,進入自身發(fā)展的良性循環(huán)。

行穩(wěn)致遠(yuǎn),未來可期

一邊是技術(shù)創(chuàng)新,一邊是應(yīng)用落地,深蘭科技顯然選擇了一條更難走的道路。大部分人可能會問,有必要嗎?

比如直接售賣算法或者解決方案,深蘭科技始終堅持基礎(chǔ)研究和應(yīng)用開發(fā)雙落地的模式,可能并不討巧,卻成為中國AI形成差異化優(yōu)勢的關(guān)鍵巨助力。

將視角放在全球技術(shù)競賽的大背景下,會發(fā)現(xiàn)中國AI依然需要在基礎(chǔ)研發(fā)上加速追趕。

北京智源人工智能研究院發(fā)布的《人工智能下一個十年》中就提到,在AI全領(lǐng)域,2009-2020年期間全AI領(lǐng)域被45個頂會和頂刊錄取論文數(shù)據(jù)顯示,中國學(xué)者量和論文量都約為美國的1/3,十年間美國AI論文量超出中國4萬多篇。

想要拿下全球頂尖的技術(shù)桂冠,最根本的是要提高自身的創(chuàng)新能力。從這個角度看,像深蘭科技這樣不斷向基礎(chǔ)研究發(fā)起沖鋒的科技企業(yè),正在建構(gòu)起中國AI未來十年的競爭“天頂”。

另一方面,如火如荼的新基建熱潮背后,要解決各行各業(yè)、不同場景下對算法精度、性能的要求,在信息化不足、數(shù)據(jù)缺失等傳統(tǒng)行業(yè)完成智能化改造,更需要領(lǐng)先算法來保駕護航,完成與產(chǎn)業(yè)端的深度整合。

如果說技術(shù)能力是舟,那么對產(chǎn)業(yè)應(yīng)用的重視與探索就是槳,幫助AI更平穩(wěn)地駛向大海。

舟楫相配,得水而行——或許是深蘭科技帶給我們對未來最美好的想象。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-09-07
深蘭科技的征途,AI的賽場與戰(zhàn)場
上述成績,都只是深蘭科技2020年研究成果的一部分,也是其技術(shù)積淀和底蘊的又一次佐證。

長按掃碼 閱讀全文