大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽?聽李開復講。
1年時間、從0到1打造一家大模型創(chuàng)業(yè)企業(yè),其中:旗艦大模型Yi-Large能力躋身全球第一梯隊、海外toC產品營收過億元、開源Yi-1.5系列模型、面向國內外發(fā)布多款模型 API 接口、對標ChatGPT5的大模型正在開發(fā)……
這是在零一萬物成立一周年時,李開復披露的成績單。
零一萬物旗艦大模型Yi-Large排名
目前零一萬物已經構建起“開源閉源雙軌策略”,大模型生成出來,交給 2C做產品,交給API平臺推動生態(tài)的業(yè)態(tài)。
“我們狂奔了一年,在模型方面趕上美國最頂尖的大模型,以后還要繼續(xù)努力?!?/p>
李開復稱:“但是面對未來,不能只是拼命狂奔,要開始思考怎么進入長跑模式?!?/p>
大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽?
作為國內最早的VC創(chuàng)投基金創(chuàng)始人之一,李開復曾被譽為年輕人的創(chuàng)業(yè)導師,對成功孵化創(chuàng)業(yè)有著深入洞察。
現在,李開復把他和團隊的經驗總結出“方法論”,并在零一萬物一周年時分享出來了。
選對路:「AGI」 vs 「PMF」 vs 「TC-PMF」
“國內的初創(chuàng)公司,相對硅谷公司的差異,我們能夠仰望星空,但也能腳踏實地。”
李開復稱,目前大模型創(chuàng)業(yè)有2條路有很多討論,有一批人瘋狂地追AGI(Artificial General Intelligence,通用人工智能),認為AGI一旦發(fā)生世界都改變了,另外一批人會說模型做得越大越難用,還不如趕快找到PMF(適合市場需求的應用)。
/注:PMF(Product Market Fit),指“產品市場匹配度”。硅谷著名風險投資家、網景公司創(chuàng)始人馬克·安德森(Marc Andreessen)最早提出了這個概念,指出了產品市場匹配度的重要性,你所提供的產品正好滿足市場的需求,令客戶滿意,這是創(chuàng)業(yè)成功的第一步。/
對此,李開復認為:“這兩批人說得都對,但都不完整”。
AGI是夢想,但是你用夢想去指點一個公司的執(zhí)行,而你又沒有財力去做超級大力出奇跡的事情,那其實就是徒勞無功的。
零一萬物是務實的AGI信仰者,不會用純大力出奇跡的唯一思維,追求能不能用一百億美金、一千億美金去訓練出最好的大模型。Open AI有資格嘗試這條道路,但這不是我們走的道路。我們是務實,我們一定要用最少的芯片,最低的成本訓練出我們能訓練最好的模型。
李開復也強調,不覺得有任何一種技術可以在長期的時間里只靠技術領跑所有的競爭,一定是最終產品的勝出要靠非技術的優(yōu)勢達到口碑的傳播。
“今天我們不能忘記PMF的重要性,做所有的產品都應該基于PMF,不是胡亂去燒錢,但有了PMF這個理論是不夠的”,李開復表示:“我們提出除了PMF之外AI2.0時代還要考慮TC-PMF,T代表Technology(技術),C代表Cost(成本)?!?/p>
之所以要加上“T”和“C”,李開復認為,考慮Technology,是因為大模型仍然按照Scaling laws(尺度定律)在快速進化,要不斷預測未來技術會怎么走,而不是基于今天的技術來決定能做什么。
/注:大模型的Scaling Law是OpenAI在2020年提出的概念,即模型的最終性能主要與計算量,模型參數量和數據大小三者相關,而與模型的具體結構(層數/深度/寬度)基本無關。/
考慮Cost,是因為現在大模型推理成本過高,很多用戶規(guī)模大的應用還不能全面嵌入AI。例如,今天如果開發(fā)一個社交應用,每次跟人聊天統統都要調用API幫你畫各種東西,最后這個API的成本會讓創(chuàng)業(yè)企業(yè)破產。因此要努力將大模型推理成本降下來。
李開復表示,整個行業(yè)應該用更務實的方法,一方面做一個務實的AGI的信仰者,另一方面要務實地把模型尺寸壓縮下來,把推理成本降低下來,零一萬物在做的是能不能加速比別人的成本更降一步。
“考慮到做一個偉大的大模型公司,不只是底層,同樣重要的還有應用,怎么找到復雜的TC-PMF,怎么把這一批完全不同的人聚在一起協作,這是我們在硅谷公司一般沒有看到,這是我們獨特的方法,也是中國獨角獸的機會?!崩铋_復強調。
闡述上述方法論后,李開復還攜一眾團隊大拿,分享了零一萬物的實際操作經驗。
零一萬物的4大發(fā)展原則
1、全球布局:模型、產品都面對全球,平行跟跑
一年前開始時,美國全方位領先,我們要謙卑地跟人家學習,人家有好的已經被教育的市場里,看在這個市場里怎么達到TC-PMF。
去年9月開始,零一萬物便聚焦生產力、社交賽道于海外應用展開探索,已有 4 款產品陸續(xù)上線。目前零一萬物海外生產力應用總用戶接近千萬,海外產品采用會員訂閱制,營收今年預期過億人民幣。
李開復強調了成功的經驗:“我們平行的在跟跑”。
零一萬物創(chuàng)業(yè)的前三個月招了一批優(yōu)秀的產品負責人,先去最先進的國外市場,用當時最先進的模型GPT-4調優(yōu)當時所有的PMF,調到了國外的PMF。與此同時,幾個月間零一萬物國內的模型也訓練出來了,在國內會把整個應用后端切換到自己的模型上?!霸趪鴥饶軌驇椭覀兇蛟旄玫哪P秃陀脩趔w驗”。
5月初,零一萬物在國內推出“萬知”的,這款產品就是在零一萬物團隊在海外已經驗證成功達到PMF的產品再推回中國的例子。
現在還在2B方面探索和世界500強達到深度的合作,我們看到美國的一些公司做了行業(yè)的金融大模型,但并不是特別地滿意,我們認為我們可以和世界500強達成獨特的合作,讓它深度合作參與達到雙贏。
2、?;步ǎ?/strong>特別重要,目的是省算力、省成本
“我們今天面臨一個現實,就是美國大廠的GPU數量,是中國任何公司、尤其是初創(chuàng)公司的十倍以上。在這個前提之下,我們要怎樣才能確保能緊追世界領先的公司,哪怕追上了它現在的產品,它還會有下一個產品的發(fā)布。”
“既然不能用10萬張GPU來訓練,我們就會尋找別的方式,依然能做出非常好的效果?!?/p>
用有限的資源來打造一個能緊追對手的方法論。在GPU算力稀缺的情況下,只能竭盡全力的提高計算效率。要特別重視 AI Infra。
AI Infra(AI Infrastructure 人工智能基礎架構技術),它涵蓋了人工智能開發(fā)和部署所需的各種底層技術設施。這些設施包括處理器、操作系統、存儲系統、網絡基礎設施、云計算平臺等,它們共同構成了大模型訓練和部署的硬技術基礎。AI Infra可以被視為連接算力和應用的中間層基礎設施。
零一萬物的模型團隊和Infra架構團隊會在一起工作,“這個特別重要”,李開復強調。這也就是“?;步ā薄?/p>
據介紹,零一萬物的大模型和Infra團隊有1比1規(guī)模。
零一萬物模型訓練負責人黃文灝補充道,算法和Infra要一體優(yōu)化,算法人員會往Infra下面看很多,Infra人員會往算法上看很多,我們最后直接并成一個團隊,這樣我們可以用 One Team 的工作方式來推進。
黃文灝強調,要關注計算效率,它是算法和Infra做聯合優(yōu)化的問題,算法人員應該看到很底層的Infra,怎么提高GPU使用率和GPU之間通信的問題,而不是像過去用別人現有的庫調優(yōu)網絡結構,這里面的范式有很大不一樣。零一萬物所有算法人員都可以寫到底層的CUDA算子(注:CUDA是NVIDIA在2006年推出的運算平臺),通信算子,這些都是必備的能力。
李開復曾經表示,“做過大模型 Infra 的人比做算法的人才更稀缺”。超強的Infra能力是大模型研發(fā)的核心護城河之一。現在,李開復稱,重視Infra給零一萬物帶來絕對的大模型訓練成本優(yōu)勢。
3、模應一體:不是只做酷炫的 demo,對用戶有價值,這才是價值
所謂模應一體,即模型和應用一體。
如何做到模應一體?
“零一萬物有比較多的應用在做,包括生產力、社交、娛樂,我們希望所有的應用都基于一個通用的模型。這個預訓練模型作為一個基礎可以服務所有的應用?!秉S文灝介紹。
“我們打破壁壘,算法團隊和應用團隊是一體化。一方面以應用為目標的產品經理要不斷去了解基礎,哪些是模型能做的,哪些是模型不能做的,一定要了解產品的邊界在哪里。另一方面技術人員也要去了解產品的需求到底是什么,找到一個實際的應用和模型能夠快速一體化迭代的方案。”
零一萬物生產力產品負責人曹大鵬介紹,萬知和零一萬物海外的產品,都是在“模應一體”的組織下打造出來。海外產品的ROI(投資回報率)達到1以上。
為什么要“模應一體”,曹大鵬認為,本身模型在不斷提升,模型提升之后,在原來模型基礎上做的應用是不是沒有價值了?這要求產品跟模型要深度預判技術趨勢,在模型最開始階段或者定義的時候,就把應用思考融入進去。
另外,曹大鵬也分享了零一萬物從0到1打造一個應用產品的關注點,”我們實踐下來,在0到0.1早期的時候,最核心的產品方法論就是TC-PMF。0到0.1最重要的是怎么讓產品能夠讓用戶使用。0到1我們最關注產品長期留存,包括能不能產生用戶自傳播的口碑。從1到100的過程需要規(guī)?;鲩L能力,怎么把ROI做到1以上?!?/p>
4、AI-First應用:找到”普惠點“,才能爆發(fā)
李開復認為,現在對于所有大模型公司的考驗,在復雜的TC-PMF環(huán)境之下,怎樣同時開發(fā)產品、了解用戶和市場,又考慮到技術的發(fā)展速度和模型的合理推進,還要考慮推理成本的必然下降……怎么結合起來在它發(fā)生的那一點,我們可以稱之為“普惠點”,開發(fā)出最好的AI-First應用。
“只有達到普惠,模型成本不會成為做一個海量體量產品的障礙,這樣的popular app才有可能發(fā)生”,曹大鵬進一步舉例道:“抖音真正變成一個Super app是在蘋果手機推出幾年之后,抖音產生Super app的時間點,第一個是4G普及,第二個是安卓千元機的普及,一下子把短視頻的市場擴大100倍?!?/p>
零一萬物一直在努力降低模型使用成本。零一萬物API開放平臺的負責人藍雨川介紹,Yi-Large API現在定價是20元人民幣,對應100萬token數量。這個數字大概是GPT-4定價的不到1/3。
李開復稱:“人類的需求是固定的,需要工作、娛樂、溝通、社交、電商、購買,這些需求什么時候才能有AI-Frist應用出來?這個真實帶來的價值就是誰會打造一個AI抖音,AI微信,AI淘寶,我們希望我們有可能作為這樣一個點燃者。如果我們不能做到,希望一個很好的開發(fā)者,能用我們的API做到?!保ü啵?/p>
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )