進(jìn)擊的速溶咖啡:當(dāng)中國AI開始玩工業(yè)化

原標(biāo)題:進(jìn)擊的速溶咖啡:當(dāng)中國AI開始玩工業(yè)化

從2017年AI借助圍棋大規(guī)模出圈開始算起,我們經(jīng)歷了這么幾個階段的變化:

第一階段,全社會一起討論AI到底有什么用;

第二階段,相關(guān)產(chǎn)學(xué)政各方一起討論,AI應(yīng)該怎么用;

第三階段,負(fù)責(zé)出錢和收錢的雙方努力討論,AI怎么用才能便宜點?

隨著產(chǎn)業(yè)化的推進(jìn),公眾范圍對AI的探討也隨之收窄。如今,基本看不到營銷號那些關(guān)于AI的驚悚標(biāo)題,也很少有讓業(yè)界驚喜的底層算法突破。也許有人認(rèn)為AI泡沫正在破裂,AI寒冬又將到來。但在大眾狂歡消退之余,卻又能看到商用AI正在中國市場快速興起。到了2021年,大部分云計算和AI供應(yīng)商似乎都無暇繼續(xù)討論AI的應(yīng)用場景和應(yīng)用可行性,而是專注于另一個關(guān)鍵詞:成本。

隨著AI開始變成企業(yè)服務(wù)的一種,部署成本過高開始變成業(yè)界最顯著的問題,而且在中國AI產(chǎn)業(yè)中尤甚。與其他企業(yè)IT技術(shù)不同,AI作為一種靈活多變的軟件形態(tài),需要長期投入和專業(yè)人才。這導(dǎo)致AI在大型科技公司或者平臺型企業(yè)具有非常彈性的投資曲線,可以戰(zhàn)略性投入,從而靈活多變地解決各種問題。但對于傳統(tǒng)企業(yè)、中小型企業(yè)、缺乏信息化基礎(chǔ)的企業(yè)來說,應(yīng)用AI往往能在理論上解決非常重要的問題,卻缺乏直接、可操作且成本可控的執(zhí)行方案。

回到云計算和AI服務(wù)提供商這邊,雖然面向企業(yè)賣AI理論上潛力巨大。但現(xiàn)實是每家客戶都有大量需要定制解決的需求,往往要投入眾多行業(yè)專家、算法架構(gòu)師、軟硬件工程師來解決一些細(xì)小問題。這樣做出來的成果雖然可觀,但其實只具備案例性質(zhì),缺乏推廣可能。

另一方面,疫情導(dǎo)致美國AI行業(yè)創(chuàng)新緩慢,頭部公司算法突破不理想。同時歐美的AI to B市場凈值較高,客戶數(shù)字化能力較強(qiáng)。谷歌云、微軟云的崛起雖然都與AI息息相關(guān),但適配的更多是大規(guī)模、分散式的企業(yè)軟件市場。反而中國市場中的AI目標(biāo)用戶更多是政企、實體經(jīng)濟(jì)企業(yè),需要一對一的AI能力與行業(yè)化的AI解決方案。

這種情況下,把AI技術(shù)推向高度工業(yè)化、標(biāo)準(zhǔn)化,就猛然間變成了中國科技界的獨(dú)立任務(wù)。雖然在2019年谷歌等頭部AI公司已經(jīng)開始推動機(jī)器學(xué)習(xí)簡單化的相關(guān)技術(shù),但其目標(biāo)更多集中在所謂“AI民主化”,而非今天中國云計算與AI廠商面向的大規(guī)模AI部署與工業(yè)級AI場景。

不夸張地說,低成本的AI工業(yè)化,已經(jīng)成為目前中國AI產(chǎn)業(yè)的主線任務(wù),但相關(guān)分析卻并不充沛。本文希望討論一下中國AI工業(yè)化這條賽道的幾種產(chǎn)品邏輯,以及代表案例、商業(yè)模型。由于各家廠商的命名方案與產(chǎn)品標(biāo)準(zhǔn)并不統(tǒng)一,為免誤會這里選擇隱去具體的廠商與技術(shù)名稱。但將相關(guān)技術(shù)邏輯帶入到幾家大廠,不難發(fā)現(xiàn)聚焦程度已經(jīng)不低。

看過東野圭吾《神探伽利略》系列的朋友,可能對主角湯川學(xué)鐘愛速溶咖啡鐘愛印象深刻??此屏畠r、低端的速溶咖啡,其實凝結(jié)了噴霧干燥等20世紀(jì)初人類科學(xué)與工業(yè)能力的精髓。也正是速溶咖啡的出現(xiàn),才讓咖啡大規(guī)模生產(chǎn)、運(yùn)輸、存儲成為可能。

如果說,深度學(xué)習(xí)是人類發(fā)現(xiàn)了咖啡這種飲料;那么中國AI正在努力完成的,就是炮制出一杯進(jìn)擊的速溶咖啡。

真正的咖啡時代,或許更可能開啟于后者。

行業(yè)知識圖譜

對于大部分企業(yè)用戶來說,AI提供的都是機(jī)器視覺、NLP體系下的幾種固定能力?;谶@些能力衍生出企業(yè)的定制化變體復(fù)雜度很高。但有一種AI技術(shù)卻很容易與企業(yè)和行業(yè)的特殊需求進(jìn)行適配,那就是知識圖譜。

知識圖譜的技術(shù)邏輯是將一些知識進(jìn)行人為關(guān)聯(lián),從而在調(diào)用A知識時驅(qū)動B知識,從而達(dá)成近乎“智能”的效果。這并不是多么新穎的技術(shù),甚至早已機(jī)器學(xué)習(xí)誕生前,知識圖譜已經(jīng)在很多領(lǐng)域有了廣泛應(yīng)用。今天在搜索引擎和電商產(chǎn)品中的相關(guān)推薦功能,很大一部分都依靠知識圖譜來完成。

在AI to B的應(yīng)用中,一個巨大問題在于企業(yè)處在特定行業(yè)里。每個行業(yè)不同的知識,或者說經(jīng)驗,決定了應(yīng)用AI的需求不同、成本各異。比如說,安防場景需要的AI識別,就和質(zhì)檢場景大相徑庭。

因此一種新的AI產(chǎn)品服務(wù)模式,是技術(shù)供應(yīng)商上升為行業(yè)信息化服務(wù)商,主動打造符合具體行業(yè)需求的知識圖譜產(chǎn)品。比如工業(yè)知識圖譜里可能包含分揀、質(zhì)檢、產(chǎn)品流程等方方面面,當(dāng)工業(yè)識別解決方案與之結(jié)合,AI就不僅能夠完成單點任務(wù),還可以依據(jù)行業(yè)知識圖譜完成一定程度的復(fù)雜需求,比如知識推理、知識預(yù)測等等。

類似的行業(yè)知識圖譜擁有廣泛的應(yīng)用可能性,無論是在工業(yè)、能源這樣注重“經(jīng)驗”的場景,還是金融、物流這樣看重“數(shù)據(jù)關(guān)系”的領(lǐng)域。另外,行業(yè)知識圖譜也可以幫助AI打入那些通識類算法難以奏效的行業(yè),比如說油氣勘探、生物醫(yī)藥等等。最重要的是,如果云計算廠商提供有效的行業(yè)知識圖譜服務(wù),那么就可以免除一個個訂單去給企業(yè)做知識、經(jīng)驗適配,從而降低人工成本。

但行業(yè)知識圖譜的問題在于,行業(yè)知識是一個非常抽象、難以標(biāo)準(zhǔn)化的版圖。每個行業(yè)有多少知識可以取公約數(shù)也是個問題。因此市面上的類似服務(wù),都大體集中在金融、能源、工業(yè)質(zhì)檢等幾個基礎(chǔ)板塊,難以細(xì)化到更具體、小眾的行業(yè)。并且行業(yè)知識圖譜已經(jīng)極大改變了云計算、AI供應(yīng)商的角色,使其從算法等基礎(chǔ)能力提供商變成了行業(yè)咨詢、行業(yè)數(shù)字化解決方案提供商,這對商業(yè)模式和行業(yè)認(rèn)可也提出了挑戰(zhàn)。

目前,與機(jī)器視覺、NLP等基礎(chǔ)能力適配的行業(yè)知識圖譜,還是中國AI界獨(dú)一份的產(chǎn)業(yè)板塊。它能走到多遠(yuǎn),或許是接下來AI產(chǎn)業(yè)一個非常重要的發(fā)展指示物。

自動機(jī)器學(xué)習(xí)

雖然蘇大強(qiáng)都知道手磨咖啡好喝,但讓每個人都去磨咖啡顯然不現(xiàn)實。速溶咖啡的價值也因此得到了確認(rèn)。

這就像AI雖好,但每家企業(yè)都高價聘用算法架構(gòu)師,花費(fèi)大量時間做數(shù)據(jù)調(diào)優(yōu)、分類、提取也很不現(xiàn)實。為了解決這個問題,谷歌早在2018年就推出了AutoML,也就是自動機(jī)器學(xué)習(xí)的相關(guān)工具。這類工具的基礎(chǔ)邏輯在于,盡量讓普通開發(fā)者,甚至不會寫代碼的AI應(yīng)用者,都能通過按要求上傳圖片的方式生成固定的AI模型。這些模型雖然簡單,但勝在零門檻,低成本。大眾熟知的類似應(yīng)用,可能就是以給明星換臉而出圈的deepfake。當(dāng)這東西被全球集體封殺,或許也側(cè)面證明了自動機(jī)器學(xué)習(xí)的威力。

隨著產(chǎn)業(yè)發(fā)展,自動機(jī)器學(xué)習(xí)也不再僅僅能做簡單的視頻處理。尤其隨著大廠的不斷投入,今天中國AI產(chǎn)業(yè)的自動機(jī)器學(xué)習(xí)平臺與工具,在能力的多元化與工業(yè)化上已經(jīng)遠(yuǎn)遠(yuǎn)超過了谷歌等美國公司。廣義來看,從數(shù)據(jù)處理到數(shù)據(jù)特征提取,再到數(shù)據(jù)調(diào)參和訓(xùn)練,幾乎每一個AI步驟都可以在今天找到一些辦法來進(jìn)行自動或半自動簡化。而國內(nèi)幾大相關(guān)廠商也推出了自動機(jī)器學(xué)習(xí)平臺的升級版,以此來提升復(fù)雜模型的開發(fā)效率,或者幫助進(jìn)行行業(yè)化的AI落地。

在產(chǎn)業(yè)端,自動機(jī)器學(xué)習(xí)的最突出價值在于可以快速滲透那些缺乏AI,甚至缺乏信息化基礎(chǔ),同時也無法進(jìn)行定制化服務(wù)的微型領(lǐng)域。比如說農(nóng)業(yè)、醫(yī)療,甚至校園場景。即使缺乏AI能力甚至編程能力的個人開發(fā)者,也可以依靠自動機(jī)器學(xué)習(xí)平臺很快完成一個簡單AI模型的開發(fā),并且在手機(jī)、攝像頭等設(shè)備上完成部署。比如在一個案例中,農(nóng)村扶貧干部可以依靠類似平臺快速開發(fā)一個識別房屋、果樹、農(nóng)作物的軟件,從而加強(qiáng)扶貧工作標(biāo)準(zhǔn)化以及提升工作效率。

當(dāng)然了,自動機(jī)器學(xué)習(xí)類軟件既然瞄準(zhǔn)的是低門檻,那么問題也隨之產(chǎn)生。這類平臺的自動化能力,導(dǎo)致其往往難以處理復(fù)雜數(shù)據(jù)或者完成算法創(chuàng)新。而一旦給平臺加強(qiáng)更多技術(shù)能力,又容易變得更為專業(yè)復(fù)雜,不適配缺少技術(shù)能力的企業(yè)和開發(fā)者。其中的平衡點很難拿捏。

無論如何,近兩年我們在看到越來越多的工業(yè)級AI項目開始基于自動機(jī)器學(xué)習(xí)平臺來搭建,AI開發(fā)的時間成本與人力成本也在極速下降。

這些真正面向解放生產(chǎn)力的升級,構(gòu)成了中國AI的最佳風(fēng)景。

大規(guī)模預(yù)訓(xùn)練模型

說到工業(yè)級AI,那么就不得不提AI應(yīng)用的另兩個核心問題:數(shù)據(jù)量和訓(xùn)練算力。

在工業(yè)、能源、金融、醫(yī)療這些行業(yè)中應(yīng)用的AI,需求特征是參數(shù)精度高、訓(xùn)練數(shù)據(jù)需求量大。但問題也來了,一家傳統(tǒng)企業(yè)去哪搞那么多數(shù)據(jù),又哪來的算力進(jìn)行長時間、需要復(fù)雜調(diào)參優(yōu)化的模型訓(xùn)練呢?

面對這個問題,業(yè)界也有個辦法。就是平臺提供預(yù)訓(xùn)練模式,然而企業(yè)買回去進(jìn)行二次加工,從而生成自己想要的AI能力。這個邏輯很容易理解,有點像買熟食回家再二次烹飪一下。家里人還是會夸你手藝好,誰又在乎前面98%的步驟都是在餐廳完成的呢?

在AI領(lǐng)域,這個用半成品再加工的邏輯被叫做遷移學(xué)習(xí)。其在大數(shù)據(jù)集訓(xùn)練的預(yù)訓(xùn)練模型上再完成小數(shù)據(jù)的遷移,最終在企業(yè)用戶時間、人力成本的基礎(chǔ)上,保證了模型的精度和使用效果。

大規(guī)模預(yù)訓(xùn)練模型的邏輯很早就被提出,但近兩年在中國AI產(chǎn)業(yè)中開始不斷得到重視,形成了解決AI工業(yè)化的核心思路之一。一般來說,云計算企業(yè)會提供NLP、機(jī)器視覺等主要品類的AI預(yù)訓(xùn)練模型,或者重要行業(yè)、重要工作場景中的預(yù)訓(xùn)練模型,供企業(yè)下載部署。一方面以此帶動企業(yè)用云量,另一方面還可以衍生出更多的智能化解決方案服務(wù)。

預(yù)訓(xùn)練模型這個領(lǐng)域的競爭主要集中在兩個方向,一是有效數(shù)據(jù)的參數(shù)規(guī)模和收斂精度,以此來決定模型在通用賽道上的能力指數(shù);二是預(yù)訓(xùn)練模型的行業(yè)細(xì)分度,以此來決定與行業(yè)、任務(wù)場景的適配廣度。

最典型的預(yù)訓(xùn)練模型應(yīng)用場景,應(yīng)該是工業(yè)巡檢、質(zhì)檢等領(lǐng)域。這些領(lǐng)域的絕大部分?jǐn)?shù)據(jù)精度要求都是一樣的,就是識別能力的精準(zhǔn)度。這個可以在云計算廠商進(jìn)行大數(shù)據(jù)預(yù)訓(xùn)練。而廠商到底是要識別劃痕還是識別污垢,就可以回到廠里進(jìn)行遷移訓(xùn)練來搞定。

最后說說問題,預(yù)訓(xùn)練模型目前還更多屬于云計算廠商提供的附加產(chǎn)品,不像基礎(chǔ)AI算法一樣有穩(wěn)定的市場空間。究竟其前景如何還有待檢驗。另外預(yù)訓(xùn)練模型雖然比較受企業(yè)用戶的歡迎,但商業(yè)模式還有待探索,給供應(yīng)商帶來的實際價值不太清晰。

結(jié)束語

當(dāng)中國AI走到2021,工業(yè)級、產(chǎn)業(yè)級成為了三句不離口的關(guān)鍵詞。但真正具備工業(yè)化特征的AI,其實就像齒輪、軸承、鋼筋一樣,是標(biāo)準(zhǔn)化、規(guī)?;?、低成本的產(chǎn)物,而不是某種美好的智能魔法。

中國AI開始大面積擁抱工業(yè)化、流程化、標(biāo)準(zhǔn)化,也許將構(gòu)成一個交叉點。這條賽道上的AI,不那么受資本關(guān)注,理論上更接近企業(yè)IT而非傳統(tǒng)意義上的AI生態(tài),至少一點也不極客,不夠酷炫。

但這條路很重要,或者可以說是全球AI產(chǎn)業(yè)的一個拐點。尤其重要的是,中國AI的前景,不能一直被美國AI的上限所制約。行業(yè)知識圖譜、自動機(jī)器學(xué)習(xí)這些東西其實都發(fā)源于美國,但在應(yīng)用化、平臺化和標(biāo)準(zhǔn)化上,美國AI并沒有中國業(yè)界來的干脆有力度。

至少在今天看來,沉默前行的AI工業(yè)化是一條孤獨(dú)的路。

前方一無所有,也因此給人安慰。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-05-05
進(jìn)擊的速溶咖啡:當(dāng)中國AI開始玩工業(yè)化
但有一種AI技術(shù)卻很容易與企業(yè)和行業(yè)的特殊需求進(jìn)行適配,那就是知識圖譜。這并不是多么新穎的技術(shù),甚至早已機(jī)器學(xué)習(xí)誕生前,知識圖譜已經(jīng)在很多領(lǐng)域有了廣泛應(yīng)用。

長按掃碼 閱讀全文