機器視覺公司,在玩一局玩不起的游戲

有個著名咨詢公司曾經(jīng)預測過:未來只有兩種公司,有人工智能的和不賺錢的。

它可能沒想到,還有第三種——不賺錢的AI公司。

去年我們報道過“正在消失的機器視覺公司”,昔日的“AI四小龍”( 商湯、曠視、云從、依圖),在商業(yè)化盈利上各有各的不順。不過,隨著GPT系列產(chǎn)品又掀起一股“大煉模型”的熱潮,這些AI公司又支棱起來了。

商湯科技此前曾披露,下一步的發(fā)展戰(zhàn)略是通用人工智能(AGI),繼續(xù)推進“大裝置+大模型”,并發(fā)布了1800億參數(shù)的中文語言大模型 “商量”。

曠視科技也表態(tài),會堅定投入生成式大模型的研發(fā),保持核心技術能力長期領先。

云從科技公開的定增預案中,為云從“行業(yè)精靈”大模型研發(fā)項目,募集資金不超過36.35億元。

依圖科技沒有公開消息,但在此前的融資中曾因AI大模型和國產(chǎn)芯片等被看好。

無論是上一輪,以BERT、GPT-3為代表的“預訓練+精調(diào)”大模型,還是此刻正紅火的,以ChatGPT、GPT-4、文心一言等為代表的“預訓練+精調(diào)+提示+RLHF(人類反饋)”的大語言模型,已經(jīng)成為各大頭部科技公司“秀肌肉”、相互競爭的重要工具。

谷歌、百度等大廠跑著入場,各路大模型“神仙斗法”。這場狂歡派對,成了機器視覺公司不得不玩、又玩不起的游戲。

尷尬的“長衫”

最近,CV公司參與到大模型這局游戲中,出現(xiàn)了這樣的畫風:語氣一會兒大,一會兒慫。

在公開信息中,都表示自己會加大投入,去解決基礎技術、基礎問題。云從的管理者說要“投一二十億解決算力問題”“我們是技術公司,研發(fā)投入不會低”;商湯的有關人士稱,要做“統(tǒng)一化標準化的大模型”“加速構建通用人工智能的核心能力”;曠視也對標OpenAI,要“做影響物理世界的 AI 技術創(chuàng)新”。

談到大模型技術和產(chǎn)品本身,底氣又不足了。

這個說“基礎大模型要有長期布局,NLP難點很多,短期內(nèi)與境外領先企業(yè)會存在較大差距”,那個說“中國AI公司有商業(yè)化的壓力,不能像OpenAI那樣不計代價的創(chuàng)新”。

“預期管理”算是被你們玩明白了。

年輕人流行說自己是“脫不下長衫的孔乙己”,CV公司對于大模型這種不尷不尬的處境,其實也和“孔乙己”有相似之處。

CV公司在底層技術、基礎設施、人才、資金、生態(tài)等領域的積累,不如頭部科技企業(yè)優(yōu)勢顯著。所以,自然也不可能真的跟谷歌、OpenAI、BATH(百度、阿里、騰訊、華為)正面打擂臺,燒錢去做通用的基礎大模型(foundation model)。

新一輪大語言模型,完整技術棧、工程實現(xiàn)能力、算力成本、數(shù)據(jù)積累等都有極高的門檻,AI公司自研大語言模型的難度前所未有。 OpenAI 在2022年就花掉了5.44億美元,收入只有3600萬美元,這是國內(nèi)CV公司不具備的家底兒。

當然,外界也不應該過度放大CV公司的責任,非要將巨頭才能承擔的創(chuàng)新壓力放在CV公司身上。

但是,CV公司又有著“AI-native原生企業(yè)”的光環(huán),也確實積累了很多技術儲備, 所以也不能直接躺平,像ISV集成商、軟件公司一樣依附大廠,歡欣鼓舞地等著集成或調(diào)用API就好。

昔日的“AI四小龍”還是要撐起“技術自立”的架子,努力融入這波煉大模型的熱潮里,于是,又將模型數(shù)量和參數(shù)規(guī)模的比拼,拉升到了新的競爭水平。

比如云從有NLP、視覺領域的預訓練模型,商湯在“AI大裝置SenseCore”的基礎上,構建的日日新大模型體系就包含了通用視覺模型、中文語言模型、圖片生成模型……其中,僅“商量”大模型的參數(shù)規(guī)模,就和GPT-3差不多。

今天大家都感慨,孔乙己脫下長衫不容易,換個角度,“大模型”這件長衫,CV公司是不是有必要穿上呢?

玩不起的游戲

從2018年的預訓練大模型到2023年的大語言模型,大模型走過了一個從萌芽到繁榮的小周期,種類、功能也豐富起來,我們已經(jīng)見過很多AI企業(yè)、高校和科研機構、行業(yè)公司所打造的各種各樣的大模型。

問題來了:

第一,大模型的“智能涌現(xiàn)”,需要在超大規(guī)模的數(shù)據(jù)和充分的訓練才能出現(xiàn),只有不計投入的基礎模型能做到。

很多面向行業(yè)的預訓練大模型,由于數(shù)據(jù)和訓練不足,無法達到“智能涌現(xiàn)”的臨界點,這也是為什么此前預訓練大模型那么多,卻只有ChatGPT的到來,才證實了“通用人工智能”的可行性。

在基礎模型的魯棒性、泛化性極大提升的今天,一味盲目地“訓大模型”,結果就是“大小班同上”,基礎大模型和行業(yè)大模型一起,消耗本就不充沛的算力,進一步推高計算成本,讓AI企業(yè)背上更重的負擔。

第二,大模型的商業(yè)化路徑,標準化API是比較基礎的一種,而基礎模型API有虹吸效應。

簡單來說,通過API接入AI能力,技術是決定性因素,基礎模型的能力強、受眾廣泛,很容易通過API經(jīng)濟完成商業(yè)化,而行業(yè)大模型面對的領域較窄,很難通過“規(guī)模效應”來攤薄研發(fā)成本。

隨著一個又一個大模型被推向市場,大家恍然發(fā)現(xiàn):原來我們并不缺大模型,缺的是商業(yè)化路徑。

目前,大模型的商業(yè)化還比較有限,C端通用產(chǎn)品貼成本定價,B端盈利前景不明朗,根據(jù) A16Z 對美國 LLM 創(chuàng)業(yè)調(diào)研,純模型廠商只能拿走0-10%的價值,并且要長期對標OpenAI的定價策略,會面臨很大的商業(yè)化壓力。

通用基礎模型和行業(yè)大模型一起面向市場和客戶,結果就是,在商業(yè)價值分配上產(chǎn)生博弈。AI巨頭“神仙斗法”,打造出的通用基礎大模型會吸引產(chǎn)業(yè)和用戶的最多關注。

而大量行業(yè)大模型,要么在訓完后無人問津,浪費了前期投入;要么無法滿足產(chǎn)業(yè)需求,商業(yè)化前景受限;或者跟通用基礎大模型的能力有沖突,導致商業(yè)化達不到預期。

同為AI創(chuàng)業(yè)型公司的出門問問創(chuàng)始人李志飛,就在一次采訪中直言:“不是所有人都要去做通用大模型,貿(mào)然進入,難度很大,商業(yè)競爭很激烈,想不清商業(yè)模式到最后會很痛苦?!?/p>

所以,大煉模型,可能是CV公司目前玩不起的一局游戲。

輕裝上陣的路

你可能會問,現(xiàn)在大模型這么火,不訓大模型怎么能吃到這波紅利,在新一輪AI熱潮里建立優(yōu)勢呢?

CV公司要輕裝上陣,可能要嘗試這樣幾條路,去探索大模型熱潮中的機會:

1.跟基礎大模型平臺建立更緊密地聯(lián)系。

自己開發(fā)大模型難度太大,訓練成本、存算成本過高,社區(qū)生態(tài)支持也不夠充足。可以站在巨人的肩膀上,接入基礎模型的能力打造小模型,與基礎模型的商業(yè)模式形成差異。

此前CV公司盈利難的一個挑戰(zhàn)是:機器視覺要進入腰尾市場,存在著海量的碎片化需求,客戶體量比較小、數(shù)量多,項目規(guī)模不大,這對CV公司的開發(fā)效率提出了很高的要求。

通用的成熟型算法,無法滿足細分需求,但全靠算法工程師來定制開發(fā)不現(xiàn)實,也不夠經(jīng)濟劃算?;A大模型,將算法開發(fā)推進到工業(yè)化階段,減少了編程工作量,提高了開發(fā)效率,定制化算法的性價比提高,也就更容易為企業(yè)所接受。

對于CV公司來說,算法進入工業(yè)化大生產(chǎn)階段,將碎片化需求全面覆蓋、規(guī)模化復用,整體營收能力自然也就上來了。

2.深入到具體行業(yè)中去,構筑能產(chǎn)生差異化的應用產(chǎn)品。

基礎模型要走向產(chǎn)業(yè),必須進一步精調(diào),CV公司就有相應的優(yōu)勢。

很多高度專業(yè)化或復雜的工作,比如金融、建筑設計、編程、辦公、客服等,需要精準的垂類知識;一些特定領域,比如醫(yī)療、司法,非結構化數(shù)據(jù)比較稀缺。沒有足夠的語料來“投喂”,基礎模型在這些場景就會欠缺一些“常識”,比如GPT-4就寫不好中文詩。

據(jù)說,GPT-3.5的訓練數(shù)據(jù)集全部為私有數(shù)據(jù)集,其中關鍵的SFT訓練集,有89.3%的數(shù)據(jù)是定制的。

CV公司大多有自己聚焦的垂直領域,比如依圖的智能醫(yī)療,曠視的物聯(lián)網(wǎng),云從的智慧園區(qū),商湯的智慧城市、智慧出行等,可以結合在相關領域沉淀的差異化數(shù)據(jù)集,利用精調(diào)或prompt的方式,打造出更加精確、可靠的小模型,更容易部署,為AI應用加速AI的快速落地。

3.建立更具韌性的生態(tài)合作護城河。

CV公司在大模型技術上的積累,就會變成AI 2.0時代的底牌,也可以作為與AI巨頭、算力提供商的生態(tài)合作籌碼。

比如這一輪大模型,對提示學習、人類反饋的強化學習RLHF等提出了很高的要求,讓模型在人類的引導下,發(fā)現(xiàn)知識的使用方式,理解人類的偏好,這在國內(nèi)都屬于很新的領域,提示師、專業(yè)標注師很少。有媒體報道,OpenAI的標注員,本科學歷52.6%,碩士學歷36.8%,這就不能全部靠眾包模式來進行數(shù)據(jù)標注,必須擁有自己的垂直領域的標注團隊。

比如醫(yī)療領域,醫(yī)學圖像還沒有建立起自然圖像那么大級別的數(shù)據(jù)庫,而對醫(yī)學圖像的標注是很難的,不像自然圖像標注,普通人一看就知道是什么,醫(yī)學圖像的數(shù)據(jù)標注涉及到器官、癌變等專業(yè)知識,就需要針對性地積累。

這樣的高水平技術人員,恰恰是CV公司這種AI-native原生企業(yè)的重要資源,可以與產(chǎn)業(yè)鏈上下游開展更緊密地合作,從而保障產(chǎn)品和服務的競爭力和可持續(xù)性,吸引客戶更多地將數(shù)據(jù)放入自己的產(chǎn)品中,形成馬太效應。

大模型開辟了一條蘊藏著極大價值和可能性的新路,被寄托了太多期待和野心。要有大模型能力,不代表要自己訓大模型。

重復建設的熱潮終會褪去,屆時,大模型商業(yè)化的考驗才剛剛開始。

對于CV公司來說,脫下“大模型”的長衫,是為了留住商業(yè)化的“底褲”。集體弄潮只是只是一時熱鬧,保存實力才能在AI江湖中走得更遠。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2023-04-15
機器視覺公司,在玩一局玩不起的游戲
有個著名咨詢公司曾經(jīng)預測過:未來只有兩種公司,有人工智能的和不賺錢的。 它可能沒想到,還有第三種——不賺錢的AI公司。 去年我們報道...

長按掃碼 閱讀全文