好“手法”不如好“算法”,AI智能攝影系統(tǒng)讓你秒變大師

極客網(wǎng)·極客觀察10月22日(朱飛) 一人,一車,一無人機(jī),飛馳在最美的318川藏線。無人機(jī)飛上天空,不再是單調(diào)的跟拍,而是全方位記錄“人車合一”的風(fēng)馳電掣、瀟灑漂移。遇到標(biāo)志建筑或民族舞蹈,還會(huì)自動(dòng)規(guī)劃線路拍攝全貌,生成精彩影像片段……這樣的美妙場(chǎng)景,你是否曾在腦中盤算憧憬?

不需要高超的專業(yè)技術(shù)和高昂的時(shí)間成本,一樣可以拍出精彩絕倫的影像作品。這可能是大多數(shù)熱愛攝影、熱愛生活的人的共同夢(mèng)想!

在剛剛落幕的第七屆中國國際“互聯(lián)網(wǎng)+”大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽上,有一群擁有相同夢(mèng)想的大學(xué)生,創(chuàng)新開發(fā)出自動(dòng)攝影方面的“黑科技”——基于昇騰AI基礎(chǔ)軟硬件平臺(tái)搭建的AI智能攝影系統(tǒng)——一舉斬獲大賽產(chǎn)業(yè)命題賽道銀獎(jiǎng),叩開了AI智能攝影的大門。

從硬件開發(fā)到軟件設(shè)計(jì),從智能攝影及感知算法到攝影設(shè)備控制算法,再到系統(tǒng)集成和應(yīng)用落地……基于全棧AI技術(shù),這支來自浙江工業(yè)大學(xué)名為“翼瞰智能”的年輕團(tuán)隊(duì)積極將想法付諸行動(dòng),用AI給無人機(jī)的攝像系統(tǒng)裝上“大腦”,初步展現(xiàn)了AI智能攝影的智慧能力及應(yīng)用天地。

直擊痛點(diǎn),以“算法”代替“手法”

在這個(gè)軟件定義世界的時(shí)代,隨著人工智能呼嘯而來,AI算法正在重新定義各種軟件的運(yùn)作方式。

當(dāng)能夠一定程度解決大眾拍照焦慮的AI攝影在手機(jī)端大受歡迎后,長期研究無人機(jī)和元學(xué)習(xí)相關(guān)領(lǐng)域的翼瞰智能團(tuán)隊(duì)負(fù)責(zé)人俞天緯敏銳地覺察到,無人機(jī)的攝影也可以因AI變得更智能,從而進(jìn)入更多應(yīng)用領(lǐng)域。

實(shí)際上,以無人機(jī)為代表的移動(dòng)拍攝設(shè)備,近年來已在一些領(lǐng)域得到應(yīng)用。但翼瞰智能團(tuán)隊(duì)認(rèn)為,疊加AI智能攝影功能后,這些設(shè)備將在諸如影視鏡頭拍攝、體育賽事直播、環(huán)境污染檢測(cè)、公共安全檢測(cè)等場(chǎng)景具備更廣闊的應(yīng)用天地。

比如在影視和體育賽事拍攝中,很多場(chǎng)景需要長鏡頭跟蹤俯拍、高機(jī)動(dòng)的移動(dòng)拍攝,以及對(duì)單個(gè)或多個(gè)目標(biāo)的跟拍等,這要求無人機(jī)等移動(dòng)拍攝設(shè)備具備跟蹤目標(biāo)運(yùn)動(dòng)狀態(tài)自動(dòng)拍攝的能力,同時(shí)在行進(jìn)路線中要能夠自主避障以保障安全。而在環(huán)境污染檢和公共安全檢測(cè)等場(chǎng)景中,還需具備異常事件/行為的智能識(shí)別和檢測(cè)能力。

顯然,傳統(tǒng)的人工攝影或非智能攝影方式,很難滿足上述要求。一方面,實(shí)現(xiàn)同等效果人工攝影需要花費(fèi)很長的時(shí)間和精力,有時(shí)甚至需要冒生命危險(xiǎn)去拍攝;另一方面,當(dāng)前設(shè)備的自動(dòng)攝影模式往往無法滿足高階要求,手動(dòng)攝影則需要調(diào)整大量參數(shù)和熟練的攝影手法配合,智能化和效率雙低;再者,當(dāng)前市場(chǎng)上的一些智能攝影設(shè)備只預(yù)留了少量接口,可擴(kuò)展性差,無法滿足上面提到的安全檢測(cè)等延伸需求。

如何破題?翼瞰智能團(tuán)隊(duì)的答案是以“算法”代替“手法”,即以基于AI的智能攝影及感知、智能設(shè)備控制等算法,去代替人工手法操控拍攝設(shè)備,達(dá)成拍攝及其他效果。

簡言之,翼瞰智能做法就是用AI去學(xué)習(xí)模仿專業(yè)攝影師的攝影手法,獲取包括其運(yùn)動(dòng)軌跡、空間位置等數(shù)據(jù)信息,形成一個(gè)個(gè)“模板”,使得其他人在其他場(chǎng)景想要達(dá)到同樣效果時(shí),無需人工設(shè)定移動(dòng)相機(jī)的參數(shù)及運(yùn)動(dòng)軌跡,攝像機(jī)就能自主輕松地實(shí)現(xiàn)。

全棧創(chuàng)新,AI智能自主攝影不是夢(mèng)

要開發(fā)這樣的AI算法并將之投入應(yīng)用驗(yàn)證,首當(dāng)其沖的便是要選擇一個(gè)合適的AI算力底座,以及相匹配的AI開發(fā)框架。

俞天緯透露,實(shí)際上在參加本次大賽之前,其團(tuán)隊(duì)已經(jīng)研究無人機(jī)智能攝影、無人機(jī)自動(dòng)控制,以及硬件電路板開發(fā)等方面做了很多研究。此前的模型訓(xùn)練和部署,是基于谷歌的TensorFlow和英偉達(dá)的Jetson TX2開發(fā)板去做的,過程中遇到兩個(gè)突出問題:一是Jetson TX2的算力不是很高,不能完全滿足要求;二來TensorFlow與Jetson TX2分屬兩家,沒有緊密的融合。

借大賽新增產(chǎn)業(yè)命題賽道的契機(jī),團(tuán)隊(duì)決定“另起爐灶”,基于昇騰全場(chǎng)景人工智能平臺(tái)能力,從硬件開發(fā)板的設(shè)計(jì),到軟件算法的開發(fā),再到系統(tǒng)集成及場(chǎng)景驗(yàn)證,“三步走”打造一個(gè)基于全棧AI技術(shù),且有具體落地場(chǎng)景的AI智能攝影系統(tǒng)。

首先,翼瞰智能團(tuán)隊(duì)圍繞Atlas 200 AI加速模塊,結(jié)合以往的研發(fā)積累,自主設(shè)計(jì)了核心SoC電路板。Atlas 200 AI加速模塊可提供22 TOPS INT8算力,澎湃算力可全面滿足無人機(jī)、機(jī)器人、可移動(dòng)相機(jī)等設(shè)備的智能攝影需求。

同時(shí),借助昇騰異構(gòu)計(jì)算架構(gòu)CANN(Compute Architecture for Neural Networks)軟硬件協(xié)同優(yōu)化,充分釋放Atlas 200 AI加速模塊的澎湃算力。利用先進(jìn)的自動(dòng)算子融合、異構(gòu)計(jì)算調(diào)度、智能算子調(diào)優(yōu)技術(shù),讓CANN成為了提升這套智能攝影系統(tǒng)AI計(jì)算效率的關(guān)鍵平臺(tái)。更讓整個(gè)團(tuán)隊(duì)興奮的是,CANN還提供了開放易用的ACL(Ascend Computing Language)編程接口,在滿足高效便捷地二次開發(fā)同時(shí)也可支撐后續(xù)多樣化的需求演進(jìn),這也讓CANN成為支撐人工智能計(jì)算生態(tài)發(fā)展的關(guān)鍵。

其次,基于與昇騰處理器緊密融合的昇思MindSpore AI框架,團(tuán)隊(duì)開發(fā)了系列算法。在智能攝影及感知算法上,得益于軟硬件的深度協(xié)同,團(tuán)隊(duì)在單目深度估計(jì)算法上相比傳統(tǒng)方法提速了5.8倍;設(shè)計(jì)實(shí)現(xiàn)了基于強(qiáng)化學(xué)習(xí)的自主攝影算法,性能領(lǐng)先DJI Active Track攝影模式3倍;在3D AI環(huán)境識(shí)別模型上,也比國際領(lǐng)先的算法精度提升了23%。同時(shí)在移動(dòng)攝影設(shè)備控制算法上,團(tuán)隊(duì)開發(fā)了視覺-慣導(dǎo)融合的目標(biāo)跟蹤技術(shù),基于硬約束的路徑重規(guī)劃技術(shù),以及基于EGO空間的主動(dòng)避障技術(shù),大大減小了的跟蹤誤差,提升了安全路徑規(guī)劃率,提高了自主避障可靠性。

最后,團(tuán)隊(duì)對(duì)上述所有核心技術(shù)進(jìn)行系統(tǒng)集成,形成一個(gè)可裝配應(yīng)用的模塊,并率先將其搭載到無人機(jī)攝影場(chǎng)景中,在智能自主攝影、智能跟蹤及輔助安全方面取得優(yōu)異表現(xiàn)。

據(jù)俞天緯介紹,團(tuán)隊(duì)此前針對(duì)YouTube視頻上的20種基本拍攝動(dòng)作做了AI智能學(xué)習(xí),結(jié)果顯示無論是從人物在視頻當(dāng)中的位置,還是面部朝向,以及整個(gè)鏡頭的移動(dòng)速度、角度等,都給人非常接近的感覺。問卷調(diào)查顯示有89%的人都覺得新片與原片效果很相近。本次基于昇騰AI全棧能力“重塑”項(xiàng)目后,其“還原度”無疑又得到了進(jìn)一步提升。

產(chǎn)教融合,AI點(diǎn)燃創(chuàng)業(yè)創(chuàng)新之火

AI智能攝影,讓人人都能輕松拍出大片,這樣的能力在當(dāng)下這個(gè)短視頻/直播無處不在的時(shí)代,別提有多令人興奮。但最讓筆者感興趣的,還是基于這個(gè)基礎(chǔ)功能之上的行業(yè)深度應(yīng)用,包括上文提到的環(huán)境污染檢測(cè)、公共安全檢測(cè),以及更多的機(jī)器視覺、圖像識(shí)別類AI應(yīng)用等。它們一旦被安上AI的“大腦”和智能攝影的“眼睛”,無疑將迸發(fā)出更大的社會(huì)和經(jīng)濟(jì)價(jià)值。

這其實(shí)正是當(dāng)前AI從單一領(lǐng)域、局部應(yīng)用走向千行百業(yè)、全面應(yīng)用的一個(gè)寫照。作為一種劃時(shí)代的通用目的技術(shù),AI不僅可以使人們以更高的效率處理傳統(tǒng)行業(yè)亟待優(yōu)化的問題,也可以在很多還沒有解決的問題上取得新的突破,是推動(dòng)社會(huì)經(jīng)濟(jì)持續(xù)發(fā)展、構(gòu)筑未來領(lǐng)先競(jìng)爭(zhēng)力的關(guān)鍵,值得產(chǎn)業(yè)各界、千行百業(yè)深度耕耘。

本屆中國國際“互聯(lián)網(wǎng)+”大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽新增產(chǎn)業(yè)命題賽道,面向新工科、新農(nóng)科、新文科、新醫(yī)科對(duì)應(yīng)行業(yè)產(chǎn)業(yè)領(lǐng)域,加強(qiáng)產(chǎn)教融合促進(jìn)教育鏈、人才鏈與產(chǎn)業(yè)鏈、創(chuàng)新鏈的有機(jī)銜接,讓一批對(duì)于社會(huì)發(fā)展有幫助的優(yōu)質(zhì)科技孵化項(xiàng)目從實(shí)驗(yàn)室走向轉(zhuǎn)化應(yīng)用,并啟迪大學(xué)生們?cè)谛聲r(shí)代創(chuàng)新創(chuàng)業(yè)的征途中創(chuàng)出美好未來,可謂意義非凡。

微信圖片_20211022175838.jpg

作為本屆“互聯(lián)網(wǎng)+”大賽的重要合作伙伴,華為深入?yún)⑴c產(chǎn)業(yè)命題賽道,通過對(duì)學(xué)科知識(shí)與行業(yè)實(shí)踐的高度融合,將極高價(jià)值的產(chǎn)業(yè)任務(wù)轉(zhuǎn)化為包含昇騰AI、鯤鵬、華為云、CT、消費(fèi)者云、OpenHarmony等系列前沿領(lǐng)域在內(nèi)的32道創(chuàng)新命題項(xiàng)目,吸引了337所高校的1205支隊(duì)伍近萬名院校學(xué)生參與其中,并以全方位的資源支持和培訓(xùn)指導(dǎo)助力13支華為命題隊(duì)伍進(jìn)入決賽斬獲大獎(jiǎng),可以說正當(dāng)其時(shí)。

作為參賽并獲獎(jiǎng)的隊(duì)伍之一,俞天緯表示翼瞰智能團(tuán)隊(duì)在用昇騰全場(chǎng)景人工智能平臺(tái)開發(fā)部署智能攝影算法時(shí)得到了昇騰社區(qū)人員的大力支持,“基本上我們有什么問題,他們一看到很快就回復(fù)了。沒回復(fù)的也會(huì)給我們留言告訴怎么解決。可以說大部分,99%的問題都可以通過他們的回復(fù)來解決,少走了很多彎路。我們深刻感受到了昇騰AI全棧技術(shù)及生態(tài)的成長壯大?!?/p>

而在這背后,華為與教育部合作的“智能基座”產(chǎn)教融合協(xié)同育人項(xiàng)目已經(jīng)覆蓋包括浙江工業(yè)大學(xué)在內(nèi)的72座高校,昇騰AI、鯤鵬、華為云等前沿技術(shù)知識(shí)已經(jīng)以教材教輔的形式融入到這些高校計(jì)算機(jī)、人工智能等專業(yè)師生的日常教學(xué)和科研中;同時(shí)還通過“鯤鵬、昇騰優(yōu)才&眾智計(jì)劃”支持學(xué)生與產(chǎn)業(yè)接軌,理解產(chǎn)業(yè)的真實(shí)需求,提升綜合創(chuàng)新能力。

“目前團(tuán)隊(duì)已發(fā)表國際高水平學(xué)術(shù)論文30余篇,授權(quán)發(fā)明專利30余項(xiàng),申請(qǐng)受理專利10余項(xiàng),多項(xiàng)成果均達(dá)到國際領(lǐng)先水平。”俞天緯透露,面向未來翼瞰智能還將繼續(xù)基于昇騰AI全棧軟硬件平臺(tái)能力深度優(yōu)化AI智能攝影系統(tǒng),并將智能攝影核心模塊推向更多的移動(dòng)攝像設(shè)備及應(yīng)用場(chǎng)景。

AI創(chuàng)未來,“昇騰”正當(dāng)時(shí)!大賽豐碩成果及其背后產(chǎn)教融合新模式只是一個(gè)縮影,相信隨著人工智能、大數(shù)據(jù)、5G等新一代信息技術(shù)與創(chuàng)新創(chuàng)業(yè)的深度融合,AI的星辰大海將全面開啟!


免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-10-22
好“手法”不如好“算法”,AI智能攝影系統(tǒng)讓你秒變大師
在剛剛落幕的第七屆中國國際“互聯(lián)網(wǎng)+”大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽上,有一群擁有相同夢(mèng)想的大學(xué)生,創(chuàng)新開發(fā)出自動(dòng)攝影方面的“黑科技”——基于昇騰AI基礎(chǔ)軟硬件平臺(tái)搭建的AI智能攝影系統(tǒng)——一舉斬獲大賽產(chǎn)業(yè)命題賽道銀獎(jiǎng),叩開了AI智能攝影的大門。

長按掃碼 閱讀全文