打卡智能中國(五):博士都去哪兒了?

《打卡智能中國》系列更新了幾期,有讀者表示,很愛看這類接地氣的真實故事,也有讀者反映,不是電工,就是文員、農民、治沙人,人工智能不是高精尖學科嗎?那些學歷很高的博士都去哪兒了?

答案是:他們在地里,廠里,礦里呢。

中科院的林博士,我見過他兩次。

第一次是2020年,某AI精英培訓班的開學典禮。當時,林博士對AI的了解,還停留在“深度學習的皮毛”,他調用平臺的機器視覺模型,開發(fā)了一個識別動物的模型,他說:“可以識別的種類還比較少,我來也想看看其他學員都用AI做些什么工作,跟大家多學習。”林博士那次介紹這個AI產品時,還有些沒底氣。

第二次是2022年,在一個普通的會議室采訪間,林博士的言談內容,變得自如和豐富了很多。

“之前的那個生物識別應用,這幾年已經多出了好多個模型,擴展到了哺乳動物、兩棲爬行、昆蟲科一級、蝴蝶種一級的識別,”他說,“我們還用AI做了別的事,一個是野外生物的圖像采集和自動化識別,一個是通過聲紋識別來進行野外動物保護,目前設備已經弄好了。我們還支撐別的企業(yè)去做AI商業(yè)化應用,比如農業(yè)病蟲害的識別”。

兩年時間,林博士從AI新手成長為AI熟手,也從一個坐在電腦前搞研究的學者,多了很多上深林、下農田的經驗。他眼中的AI,倒映著智能中國的上限與縱深。

今天的故事,是科研領域的博士,怎么從零開始用AI、做AI。

研究所里的AI,有什么不一樣?

科研領域的智能化,與工農商等行業(yè)既有相同點,也有不同點。

相同點在于:1.缺人;2.缺數(shù);3.缺場景。

科研領域匯聚了大量高學歷人才,但依然缺少能將AI與細分學科相結合的復合型人才。就拿林博士來說,他本身是信息學專業(yè)的,因為生物研究要用到計算機分析等信息技術,才加入了中科院下屬的動物研究所,對于深度學習、圖像識別、聲紋識別等人工智能技術,他也要從頭學起,迭代自己的知識體系。

此外,研究型機構大多有一定的數(shù)據(jù)積累,但也分領域、分專業(yè)甚至分物種。比如林博士想做的物種識別、鳥類聲紋識別等AI應用,很多珍稀動物,別說語音資料,連野外活動的圖像,數(shù)據(jù)庫里一共都沒幾張,而缺少充足的數(shù)據(jù),AI很難發(fā)揮作用。

還有,科學研究的哪些課題、方向能用到AI,這也是一個需要科學家們發(fā)揮“主觀能動性”去摸索的東西。林博士提到,很多科學研究中已經有很成熟的計算工具了,要用到AI肯定是要從一線科研人員開始推動,這就需要自己有一定的想法,他說:“所以我聽說有這個深度學習人才培訓,就帶著我的課題主動來報名了,希望能順利畢業(yè)?!?/p>

當然,AI+科研也有其特別的地方。

比如,特別沒錢途。

第一次見面,我好奇地問,“當下AI跟生物的碰撞多不多?”林博士笑言:

“AI在醫(yī)學領域應用的很快,但在生物識別方面就沒有那么好,可能跟動物保護這種基礎性研究的商業(yè)價值不大有關系,投入上有一定的滯后性。”

玩笑歸玩笑,AI與科研的結合也特別重要。

林博士的經歷證明,基礎研究領域的AI創(chuàng)新一旦成長起來,可以帶來產學研用的一系列聯(lián)動效應。

2020年,林博士剛剛做出了一款識別動植物的科普類App,集成了計算機視覺技術和他們單位的動植物百科資料,方便一些動物愛好者、野外觀測調查員以及小學生和家長們使用。

中國領土廣闊,專家考察有一定的時間線,比如每五年一次,很可能就會錯失某些物種的觀察機會,導致采樣到的數(shù)據(jù)是有偏差的。而且生物領域的分類學家、人才也處于萎縮狀態(tài),越來越少人愿意從事這樣艱苦的野外工作,所以全靠研究者和野外工作者去采集和分類,是非常不現(xiàn)實的。

通過智能技術的創(chuàng)新應用,聚集起更多數(shù)據(jù)合作伙伴,發(fā)動機構乃至廣大用戶一起參與進來,對于生物保護和研究的開展很有幫助。

而這樣一個純公益的工作,隨后也凝聚起了很多研究機構、公益組織以及企業(yè)/產業(yè)界的關注。

林博士告訴我,開發(fā)完那個App之后,很多類似的國際動物保護機構跟他們建立了很好的聯(lián)系,他們輸出技術,而對方將獲取的生物數(shù)據(jù)資料反饋給他們,讓他們獲得了幾十萬的影像數(shù)據(jù),其中很多都是新增的觀測點位,相當于給國家節(jié)省了好多科研經費。

可持續(xù)的數(shù)據(jù)獲取機制,對于后續(xù)科研任務的開展是非常重要的。

除此之外,他們還吸引到了一些商業(yè)化項目方,前來尋求合作。

比如有企業(yè)知道他們有這個技術,找到他們想開發(fā)一種害蟲識別的系統(tǒng),恰好林博士所在的單位本身也承擔著病蟲害防治工作,有做好糧食安全保障的職能。于是雙方一拍即合,開始搭建病蟲害的數(shù)據(jù)庫,進行識別算法的開發(fā)。

相比跟經濟價值更近的工農商業(yè),科研領域的智能化看起來好像沒那么緊迫,卻有著“創(chuàng)新發(fā)動機”的作用:影響的不是一個人、一家企業(yè),而可能是一個行業(yè)(比如上文提到的農業(yè))、一個群體(比如科普教育)乃至一個國家(比如學科人才建設)。

從象牙塔到農田:一個博士的腳步

此前報道中的電力工人、水廠員工都是AI應用末端環(huán)節(jié)的一份子。

而借助林博士的腳步,我們可以看到,一種AI能力是如何誕生的又如何抵達應用末端。

第一步:從零做數(shù)據(jù)。

接收到企業(yè)提出的識別病蟲害的需求之后,林博士發(fā)現(xiàn),數(shù)據(jù)就是一個很大的挑戰(zhàn)。

從生物學的角度,害蟲也有很多種,一種害蟲的發(fā)育過程中還有很多種形態(tài),從蟲卵、弱蟲、幼蟲、成蟲的發(fā)育狀態(tài)都不同,在圖像分類過程中就屬于不同類別,如果是外行人來做,根本做不明白也沒有一個成型的數(shù)據(jù)庫。

所以林博士和團隊,必須從電腦桌前走到地里,去實地采集不同階段的圖像,確定病蟲害不同發(fā)育階段的形狀特征,為后續(xù)模型的精準識別打下基礎。

第二步:跟農業(yè)專家深入交流。

不同地區(qū)的病蟲害可能并不相同,里面涉及到很多非常專業(yè)的知識點,比如北京郊區(qū)的番茄有哪些常見的病蟲害?發(fā)現(xiàn)害蟲后會對接怎樣的防治措施?提供什么藥物?這都要深入到大棚里,跟當?shù)氐闹脖<乙约伴L期從事一線生產的農民們進行交流,這樣才能保證后期打造的AI系統(tǒng),能夠提供從病蟲害識別到防治指導的全套工作。

第三步:模型開發(fā)與調優(yōu)迭代。

林博士和同事們基本都是信息學專業(yè),并不是深度學習算法工程師出身,而農業(yè)項目的模型迭代又很快,一批圖像采集完了之后,馬上就要迭代一批模型,為了精準識別不同作物,還要開發(fā)不同的模型,這樣模型很多,開發(fā)和迭代工作量很大。

林博士表示,科研工作中可能很看重AI開發(fā)框架的靈活性、可擴展性、先進性等,比如為了發(fā)paper便于同行復現(xiàn),大家更傾向于使用TensorFlow、PyTorch這樣的海外平臺,而真正在開發(fā)產業(yè)用模型時,我們更看重的是平臺的易用性,以及面向應用的工業(yè)化能力是不是很簡單易用,有沒有已經訓練好的性能不錯的模型。

因為底層的技術手段、理論方法,國內外開發(fā)平臺都是一樣的,也都是開源的,沒什么區(qū)別,但容不容易訓練,容不容易部署,能不能工業(yè)性地批量生產(模型),這些問題的答案對產業(yè)智能化很重要。

目前,由林博士及團隊支持的該農業(yè)病蟲害應用已經在北京落地了,這也是北方地區(qū)第一款病蟲害識別的App。

為什么做這個項目?林博士及團隊的出發(fā)點和商業(yè)公司的想法就不太一樣——一方面是企業(yè)/農戶有需求;另一方面是為了幫助新農人。

“現(xiàn)在大量的新型農業(yè)生產者,比如年輕一代,”林博士提到,“他們沒有熟練的生產經驗,也不依賴上一輩傳授的經驗,而是更依賴從互聯(lián)網獲取的信息。這時候我們給他提供一個工具——AI識別,慢慢地他們也會成長為有經驗的生產者?!?/p>

以往《打卡智能中國》的主角,電力工人放飛的無人機,水廠員工日常使用的智慧系統(tǒng),這些AI工具背后就是無數(shù)個林博士。

學員?導師?研究員?開發(fā)者?一個AI人的身份轉換

第一次見到林博士,他還是一個帶著課題等待被評判的“AI新手學員”。

第二次見到他,已經是國內某AI開源社區(qū)的技術專家了。

林博士平時還會承擔一些新手指導、開發(fā)經驗分享等任務,把自己的數(shù)據(jù)和模型開源放到平臺上,讓開發(fā)者和學生用戶有實踐和練手的機會。

培養(yǎng)多一點AI人才,這種“利他”的思維,好像就刻在這位學者的腦子里,不用猶豫和思索,自然而然地就去做了。

AI人才需求量大、缺口大,已經是公認的事實,也成為人工智能產業(yè)進一步繁榮發(fā)展的限制。

AI人才的培養(yǎng)難,一是因為技術新,相較于理數(shù)生化等傳統(tǒng)學科,以及計算機這樣的成熟學科來說,AI本身是一門新興技術,還在不斷更新迭代,沒有完善的人才培養(yǎng)模式和課程體系;二是交叉性強,AI是一門應用型技術,要求跟產業(yè)緊密結合、實踐落地,僅靠學校教育是無法滿足AI復合型人才的培養(yǎng)需求。

十四五規(guī)劃中提出,人工智能行業(yè)要形成產學研用深度融合的技術創(chuàng)新體系,連通企業(yè)、高校、研究院所、政府等創(chuàng)新主體。

在AI生態(tài)里,“產學研用”是分層的,每一層都承擔著各自主要的創(chuàng)新任務,但分層不代表割裂,各層還要緊密聯(lián)動,擰成一個創(chuàng)新鏈條。

“林博士們”就成了那個游走在各層的關鍵角色:

在產業(yè)中,他們是AI創(chuàng)新的開發(fā)者;

在高校人才培養(yǎng)中,他們是那個給學弟、學妹指導的前輩;

在研究中,他們是將AI技術與科學探索相結合的先行者;

在應用環(huán)節(jié),他們會主動去貼近一線使用者,讓AI工具能變得更好用。

“談笑有鴻儒,往來無白丁”這就是今天的AI學人,既有身處象牙塔兼濟天下的理想情懷,又有身先士卒深入產業(yè)的行動能力。

有一個工業(yè)大學的老師曾告訴我,要把AI研究做到工廠里,這和林博士把AI做進農田里,有異曲同工之妙。

這些學者擁抱AI的經歷,讓我深切的感受到:AI既是一個專業(yè),也不是一個專業(yè)。AI將更多專家和學者拉進AI的世界,“產學研用”的閉環(huán)加速轉動,才能持續(xù)打開AI的上限和想象空間。

大鵬之動,非一羽之輕也,多元人才的合力,才能托舉起智能中國。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2023-05-22
打卡智能中國(五):博士都去哪兒了?
《打卡智能中國》系列更新了幾期,有讀者表示,很愛看這類接地氣的真實故事,也有讀者反映,不是電工,就是文員、農民、治沙人,人工智能不...

長按掃碼 閱讀全文