2024中國(guó)生成式AI大會(huì)上海站圓滿收官,第二日AI Infra峰會(huì)演講精華一文看盡

圖片1.jpg

為期兩天的2024中國(guó)生成式AI大會(huì)(上海站)12月6日?qǐng)A滿收官。兩天內(nèi),51位產(chǎn)學(xué)研投嘉賓代表密集輸出干貨爆棚,大會(huì)報(bào)名咨詢?nèi)藬?shù)超4000人,超過(guò)1200位觀眾到場(chǎng)參會(huì)。其中,在主會(huì)場(chǎng)進(jìn)行的大模型峰會(huì)、AI Infra峰會(huì)的線上觀看人次更是超過(guò)104萬(wàn)。

圖片2.jpg

現(xiàn)場(chǎng)參會(huì)觀眾們的熱情十分高漲,主會(huì)場(chǎng)、分會(huì)場(chǎng)座無(wú)虛席,展覽區(qū)附近的產(chǎn)業(yè)交流也十分活躍,15家企業(yè)的諸多新產(chǎn)品新技術(shù)都引起了廣泛關(guān)注和討論。

圖片3.jpg

▲大會(huì)展區(qū)

此次大會(huì)以“智能躍進(jìn) 創(chuàng)造無(wú)限”為主題,51位產(chǎn)學(xué)研投嘉賓代表基于前瞻性視角解構(gòu)和把脈生成式AI的技術(shù)產(chǎn)品創(chuàng)新、商業(yè)落地解法、未來(lái)趨勢(shì)走向與前沿研究焦點(diǎn)。

今天主會(huì)場(chǎng)進(jìn)行的AI Infra峰會(huì)上,上海交通大學(xué)副教授、無(wú)問芯穹聯(lián)合創(chuàng)始人兼首席科學(xué)家戴國(guó)浩認(rèn)為,業(yè)界更應(yīng)該關(guān)注單位算力如何實(shí)現(xiàn)更高效的token吞吐,大模型實(shí)際可用算力不僅取決于芯片理論算力,還可通過(guò)軟硬協(xié)同優(yōu)化提高算力利用效率,通過(guò)多元異構(gòu)適配放大整體算力規(guī)模。

北電數(shù)智智算云負(fù)責(zé)人郭文,GMI Cloud亞太區(qū)總裁King.Cui,阿里云智算集群產(chǎn)品解決方案負(fù)責(zé)人叢培巖,中昊芯英芯片軟件棧負(fù)責(zé)人朱國(guó)梁,光羽芯辰創(chuàng)始人兼董事長(zhǎng)周強(qiáng)分別對(duì)全棧AI工廠、AI企業(yè)出海如何補(bǔ)齊算力短板、高性能智算集群、國(guó)產(chǎn)TPU芯片“No CUDA”軟件棧、通向個(gè)人大模型之路幾個(gè)主題進(jìn)行了分享。

楓清科技創(chuàng)始人兼CEO高雪峰,聲網(wǎng)生成式AI產(chǎn)品負(fù)責(zé)人毛玉杰,騰訊云向量數(shù)據(jù)庫(kù)技術(shù)負(fù)責(zé)人謝宇,Jina AI聯(lián)合創(chuàng)始人兼首席技術(shù)官王楠,Zilliz合伙人、研發(fā)VP欒小凡,英飛流創(chuàng)始人兼CEO張穎峰,Alluxio首席架構(gòu)師傅正佳分別針對(duì)“從數(shù)據(jù)到知識(shí):AI重塑百行千業(yè)的基石”、“生成式AI驅(qū)動(dòng)實(shí)時(shí)互動(dòng)的技術(shù)變革與體驗(yàn)革新”、“TencentVDB向量數(shù)據(jù)庫(kù)”、“RAG范式下AI Infra的機(jī)遇和挑戰(zhàn)”、“RAG雖強(qiáng),但向量數(shù)據(jù)庫(kù)絕非萬(wàn)靈藥”、“新一代企業(yè)級(jí)多模態(tài)RAG引擎”、“高性能AI數(shù)據(jù)底座”帶來(lái)了精彩演講。

下午場(chǎng)的圓桌討論聚焦“大模型行至深水區(qū),AI Infra的新變化與新機(jī)會(huì)”,由德聯(lián)資本執(zhí)行董事劉景媛主持,Alluxio首席架構(gòu)師傅正佳,Zilliz合伙人、研發(fā)VP欒小凡,英飛流創(chuàng)始人兼CEO張穎峰三位嘉賓給出了自己的真知灼見。

大會(huì)首日,17位嘉賓暢談大語(yǔ)言模型、多模態(tài)大模型、具身智能、AI原生應(yīng)用、音樂生成、3D AIGC、AI智能體的行業(yè)應(yīng)用、垂類行業(yè)大模型等前沿議題。

除了大會(huì)首日主會(huì)場(chǎng)進(jìn)行的大模型峰會(huì),以及12月6日主會(huì)場(chǎng)的AI Infra峰會(huì),大會(huì)分會(huì)場(chǎng)也在這兩天分別組織了端側(cè)生成式AI技術(shù)研討會(huì)、AI視頻生成技術(shù)研討會(huì)與具身智能技術(shù)研討會(huì),17位青年學(xué)者和技術(shù)專家?guī)?lái)了報(bào)告分享,后續(xù)將會(huì)上架這三場(chǎng)收費(fèi)制研討會(huì)的回放。

01.從智算集群到原生加速技術(shù)棧 聚焦產(chǎn)業(yè)落地痛點(diǎn)突破大模型算力瓶頸

AI的發(fā)展帶來(lái)了巨大的數(shù)據(jù)、算力以及能源挑戰(zhàn),作為支撐大模型運(yùn)行以及生成式AI應(yīng)用開發(fā)的關(guān)鍵,AI Infra也走到了臺(tái)前,發(fā)展勢(shì)頭強(qiáng)勁。如何打造優(yōu)質(zhì)的智算中心,如何實(shí)現(xiàn)AI從芯片到應(yīng)用端全產(chǎn)業(yè)鏈的高效協(xié)同?多位嘉賓給出了自己的深入見解。

1、上海交通大學(xué)副教授、無(wú)問芯穹聯(lián)合創(chuàng)始人兼首席科學(xué)家戴國(guó)浩

圖片4.jpg

Scaling Law之下,數(shù)據(jù)成為制約AI繼續(xù)發(fā)展的因素之一。以GPT-o1為代表的推理模型可以突破數(shù)據(jù)瓶頸,但計(jì)算范式的轉(zhuǎn)變使算力需求呈指數(shù)級(jí)增長(zhǎng),可能導(dǎo)致硬件系統(tǒng)能耗開銷供不應(yīng)求,對(duì)行業(yè)的可持續(xù)發(fā)展構(gòu)成挑戰(zhàn)。

對(duì)此,戴國(guó)浩教授指出,當(dāng)下業(yè)界更應(yīng)該關(guān)注單位算力如何實(shí)現(xiàn)更高效的token吞吐,讓大模型的實(shí)際可用算力不僅取決于芯片理論算力,還可通過(guò)軟硬協(xié)同優(yōu)化提高算力利用效率,并通過(guò)多元異構(gòu)適配放大整體算力規(guī)模。他分享了其研究團(tuán)隊(duì)在軟硬協(xié)同、多元異構(gòu)與端側(cè)智能方面的研究進(jìn)展與落地成果,這些成果能助力行業(yè)提升面向大模型場(chǎng)景的token吞吐效率。

2、北電數(shù)智郭文:以AI工廠填補(bǔ)國(guó)產(chǎn)算力供給側(cè)與需求側(cè)的產(chǎn)業(yè)鏈斷層

圖片5.jpg

“產(chǎn)業(yè)要發(fā)展,創(chuàng)新不能只是停留在技術(shù)層面,更要從流程、系統(tǒng)和組織進(jìn)行全面的創(chuàng)新?!北彪姅?shù)智智算云負(fù)責(zé)人郭文分享了從算力、算法、數(shù)據(jù)與生態(tài)方面全面構(gòu)建人工智能時(shí)代AI生產(chǎn)線的實(shí)踐思考。

郭文稱,當(dāng)下國(guó)產(chǎn)芯片落地人工智能產(chǎn)業(yè)的最大問題是,算力供給側(cè)與需求側(cè)之間存在產(chǎn)業(yè)鏈斷層。為此,北電數(shù)智推出首個(gè)“國(guó)產(chǎn)算力PoC平臺(tái)”,以北京數(shù)字經(jīng)濟(jì)算力中心為載體打造具備全棧能力的AI工廠,全線適配與拉通場(chǎng)景、模型到芯片層面,推動(dòng)智算中心從成本中心轉(zhuǎn)化為推動(dòng)地區(qū)發(fā)展新質(zhì)生產(chǎn)力中心。

3、GMI Clould King.Cui:高穩(wěn)定GPU集群成AI企業(yè)全球化布局關(guān)鍵

圖片6.jpg

中國(guó)AI出海加速,算力作為其中的核心生產(chǎn)資料正發(fā)揮重要作用。高穩(wěn)定性的GPU集群能降本增效,幫助企業(yè)在AI全球化浪潮中取勝。

GMI Cloud亞太區(qū)總裁King.Cui提到,為確保GPU集群的高穩(wěn)定性,他們使用了具備主動(dòng)檢測(cè)功能的自研云集群引擎,實(shí)現(xiàn)計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源的高效調(diào)配。

GMI Cloud是NVIDIA Top10 NCP,交付前會(huì)進(jìn)行嚴(yán)格的驗(yàn)證流程。GMI Cloud與IDC協(xié)作,提供備件和維修,擁有更短的交付時(shí)間,確保停機(jī)時(shí)間最小化。

4、阿里云叢培巖:靈駿智算集群不僅要實(shí)現(xiàn)穩(wěn)定性和極致性能,更要在不同維度支持規(guī)模的極致擴(kuò)展

圖片7.jpg

阿里云智算集群產(chǎn)品解決方案負(fù)責(zé)人叢培巖預(yù)測(cè),未來(lái)模型性能還會(huì)隨參數(shù),數(shù)據(jù)集和算力的增長(zhǎng)繼續(xù)提升,Scaling Law仍有增長(zhǎng)空間,AI智算集群的設(shè)計(jì)范式轉(zhuǎn)向要以GPU為核心。

阿里云推出支持超大規(guī)模分布式訓(xùn)練的靈駿智算集群,可達(dá)到10萬(wàn)卡擴(kuò)展規(guī)模,千卡規(guī)模線性加速比達(dá)到96%;阿里云自研磐久服務(wù)器采用CPU和GPU分離,實(shí)現(xiàn)單機(jī)提升至16顆GPU;網(wǎng)絡(luò)架構(gòu)HPN7.0最大規(guī)模可連接10萬(wàn)顆GPU。

智算集群穩(wěn)定性至關(guān)重要,阿里云3千卡規(guī)模智算集群,在一個(gè)月內(nèi)穩(wěn)定訓(xùn)練時(shí)長(zhǎng)占比達(dá)99%。

5、光羽芯辰周強(qiáng):解決“大模型不懂你”問題,個(gè)人大模型迎來(lái)機(jī)遇

圖片8.jpg

作為與通用大模型、行業(yè)大模型、企業(yè)大模型并行發(fā)展的一大分支,個(gè)人大模型也進(jìn)入了快速發(fā)展期。光羽芯辰創(chuàng)始人兼董事長(zhǎng)周強(qiáng)稱,個(gè)人大模型解決的是“大模型不懂你”的問題,隨著手機(jī)、PC、可穿戴、XR等端側(cè)設(shè)備廠商All in AI,個(gè)人大模型之路將越走越寬。

他提到,個(gè)人大模型也稱為端側(cè)大模型,期待解決端側(cè)智能體在性能、功耗和成本方面的痛點(diǎn),讓真正的AI手機(jī)走進(jìn)生活。端側(cè)AI具備及時(shí)性、可靠性、成本低、隱私保護(hù)和定制化五大優(yōu)勢(shì)。目前,構(gòu)建端側(cè)大模型的核心是解決存儲(chǔ)帶寬和容量雙重問題。

6、中昊芯英朱國(guó)梁:國(guó)產(chǎn)TPU芯片“No CUDA”軟件棧的構(gòu)建實(shí)踐

圖片9.jpg

中昊芯英芯片軟件棧負(fù)責(zé)人朱國(guó)梁介紹了他們?cè)跒閲?guó)產(chǎn)TPU芯片構(gòu)建“No CUDA”軟件棧的實(shí)踐經(jīng)驗(yàn)。

中昊芯英剎那芯片采用VLIW指令集架構(gòu),面對(duì)龐大的CUDA生態(tài),他們逐一解決了庫(kù)、并行計(jì)算與編程方面的問題,全自研用戶態(tài)和內(nèi)核態(tài)驅(qū)動(dòng),實(shí)現(xiàn)了芯片的高效管理。

為做好生態(tài)兼容,中昊芯英底層軟件棧兼容PyTorch以及所有主流訓(xùn)推框架,目前,中昊芯英可提供定制的端到端的云智算解決方案,并支持國(guó)產(chǎn)操作系統(tǒng)。

02.從企業(yè)智能體、向量數(shù)據(jù)庫(kù)到RAG AI Infra基礎(chǔ)軟件涌現(xiàn)諸多新挑戰(zhàn)

下午場(chǎng),多位嘉賓進(jìn)一步分享了AI Infra領(lǐng)域關(guān)于智能體開發(fā)管理平臺(tái)、實(shí)時(shí)語(yǔ)音、向量數(shù)據(jù)庫(kù)、向量模型、RAG技術(shù)、數(shù)據(jù)編排等方面的行業(yè)觀察和深入見解。諸多新平臺(tái)、新產(chǎn)品、新技術(shù)走向前臺(tái),賦能產(chǎn)業(yè)。

1、楓清科技高雪峰:從數(shù)據(jù)到知識(shí),跨越生成式AI與決策智能間的鴻溝

圖片10.jpg

楓清科技創(chuàng)始人兼CEO高雪峰談道,要將生成式AI真正應(yīng)用到企業(yè)決策場(chǎng)景中,彌合其與決策智能之間鴻溝的技術(shù)突破點(diǎn),就是在推理框架側(cè)融合符號(hào)邏輯推理。

企業(yè)智能化落地需要面臨數(shù)據(jù)孤島、數(shù)據(jù)整合、知識(shí)校驗(yàn)、數(shù)據(jù)實(shí)時(shí)效等技術(shù)挑戰(zhàn)。楓清科技可以為企業(yè)提供知識(shí)引擎與大模型雙輪驅(qū)動(dòng)的新一代智能體平臺(tái),通過(guò)構(gòu)建全鏈路優(yōu)化體系,幫助企業(yè)提升數(shù)據(jù)質(zhì)量,將企業(yè)本地?cái)?shù)據(jù)知識(shí)化,并融合大模型沉淀的泛化能力,在知識(shí)網(wǎng)絡(luò)之上進(jìn)行符號(hào)邏輯推理,實(shí)現(xiàn)可解釋的智能,進(jìn)而使AI在多個(gè)場(chǎng)景下能夠?qū)崿F(xiàn)精準(zhǔn)、透明的決策支持,推動(dòng)企業(yè)智能化轉(zhuǎn)型的順利實(shí)施。

2、聲網(wǎng)毛玉杰:生成式AI+實(shí)時(shí)互動(dòng),讓人機(jī)交互變成真正的心靈交互

圖片11.jpg

聲網(wǎng)生成式AI產(chǎn)品負(fù)責(zé)人毛玉杰講述了生成式AI出現(xiàn)后實(shí)時(shí)互動(dòng)(RTE,Real-Time Engagement)技術(shù)和體驗(yàn)的變遷。

毛玉杰介紹,2014年至今十年,RTE從服務(wù)質(zhì)量走向體驗(yàn)質(zhì)量;2025年開始,在生成式AI發(fā)展的背景下,RTE向AI RTE變革,開始注重跨模態(tài)體驗(yàn)質(zhì)量,做多模態(tài)交互、跨模態(tài)轉(zhuǎn)換,為人和模型而設(shè)計(jì),給大模型廠商提供眼睛、耳朵和聲音能力。

毛玉杰說(shuō),目前人機(jī)對(duì)話已經(jīng)達(dá)到“聽得懂”的狀態(tài),期待下一步實(shí)現(xiàn)“聽得心”——讓人機(jī)交互變成真正的心靈交互。

3、騰訊云謝宇:向量數(shù)據(jù)庫(kù)助力企業(yè)挖掘更大數(shù)據(jù)價(jià)值

圖片12.jpg

AI時(shí)代,向量數(shù)據(jù)庫(kù)(VDB)脫穎而出,成為連接結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的樞紐。然而,當(dāng)VDB被運(yùn)用于RAG場(chǎng)景時(shí),多款開源RAG架構(gòu)出現(xiàn)了召回率低的問題。

騰訊云向量數(shù)據(jù)庫(kù)技術(shù)負(fù)責(zé)人謝宇介紹,為解決上述挑戰(zhàn),騰訊首先提升了復(fù)雜文檔的識(shí)別效果,并對(duì)數(shù)據(jù)處理、Embedding、檢索、總結(jié)等其他環(huán)節(jié)進(jìn)行優(yōu)化,最終實(shí)現(xiàn)了90%以上的召回率。

騰訊自研向量檢索引擎OLAMA已上線5年,日均處理8500億次檢索請(qǐng)求。未來(lái),他們還將在性能、成本、業(yè)務(wù)效果、容災(zāi)率等方面發(fā)力,持續(xù)提升產(chǎn)品表現(xiàn)。

4、Jina AI王楠:長(zhǎng)文本大模型、RAG長(zhǎng)期共存,長(zhǎng)窗口向量模型面臨兩大挑戰(zhàn)

圖片13.jpg

大模型存在幻覺、無(wú)法保證私有數(shù)據(jù)安全、推理成本高三大問題,Jina AI聯(lián)合創(chuàng)始人兼首席技術(shù)官王楠認(rèn)為,RAG正是通過(guò)縮小大模型生成范圍,保證檢索準(zhǔn)確性、實(shí)現(xiàn)結(jié)果可溯源,所以長(zhǎng)本文大模型不會(huì)取代RAG,二者將長(zhǎng)期共存。

短窗口會(huì)導(dǎo)致上下文背景信息丟失,因此RAG需要長(zhǎng)窗口向量模型支持。但長(zhǎng)窗口向量模型面臨兩大挑戰(zhàn),一是推理成本和內(nèi)存消耗會(huì)隨窗口長(zhǎng)度呈平方線性增長(zhǎng),共享GPU是解決思路之一;二是長(zhǎng)窗口使模型無(wú)法完整表示細(xì)顆粒度語(yǔ)義,解法是增加向量維度和多向量表示。

5、Zilliz欒小凡:向量數(shù)據(jù)庫(kù)落地面臨成本及擴(kuò)展性挑戰(zhàn),RAG轉(zhuǎn)為Graph RAG

圖片14.jpg

Zilliz合伙人、研發(fā)VP欒小凡分享了向量數(shù)據(jù)庫(kù)目前面臨的挑戰(zhàn)以及相應(yīng)解決方案。

欒小凡稱,2025年新生成的數(shù)據(jù)中,將會(huì)有80%以上是非結(jié)構(gòu)化數(shù)據(jù)。在這一數(shù)據(jù)壓力下,向量數(shù)據(jù)庫(kù)的落地面臨著成本以及擴(kuò)展性等方面的種種挑戰(zhàn)。而目前的RAG存在搜索質(zhì)量難、處理長(zhǎng)尾查詢能力差、結(jié)果難以解釋和控制、向量存儲(chǔ)成本高等問題。

據(jù)此,欒小凡及其團(tuán)隊(duì)提出了兩個(gè)解決思路:一是混合查詢,在單個(gè)系統(tǒng)內(nèi)支持密集嵌入、稀疏嵌入和詞匯搜索;二是Graph RAG,將知識(shí)圖譜和向量檢索結(jié)合起來(lái)。

6、英飛流張穎峰:多模態(tài)RAG新范式

圖片15.jpg

英飛流創(chuàng)始人兼CEO張穎峰認(rèn)為,RAG作為L(zhǎng)LM時(shí)代的數(shù)據(jù)庫(kù),目前面臨著三大挑戰(zhàn)——多模態(tài)文檔處理、檢索、語(yǔ)義鴻溝。

針對(duì)第一個(gè)問題,英飛流訓(xùn)練了深度文檔理解模型,能對(duì)復(fù)雜文檔中的多模態(tài)內(nèi)容進(jìn)行分類處理。而在檢索這一RAG“最后一公里”的問題上,英飛流使用三路召回方案,并增加張量索引進(jìn)行重排序,這一方案在多模態(tài)RAG上展現(xiàn)出明顯優(yōu)勢(shì)。

最后,針對(duì)檢索過(guò)程中的語(yǔ)義鴻溝,英飛流使用GraphRAG抽取知識(shí)圖譜,并與原數(shù)據(jù)進(jìn)行聯(lián)合檢索,提升檢索質(zhì)量。

7、Alluxio傅正佳:零改造、無(wú)侵入策略,打造高性能AI數(shù)據(jù)底座

圖片16.jpg

Alluxio首席架構(gòu)師傅正佳談到了提升大規(guī)模模型訓(xùn)練效率的兩大挑戰(zhàn):一是數(shù)據(jù)規(guī)模不斷增長(zhǎng)、類型更多元化,因此處理數(shù)據(jù)需要提升算力有效利用率;二是當(dāng)數(shù)據(jù)喂到訓(xùn)練平臺(tái)上,數(shù)據(jù)IO訪問瓶頸會(huì)導(dǎo)致算力處于低利用率狀態(tài)。

這一背景下,Alluxio提供了統(tǒng)一的數(shù)據(jù)視圖、豐富協(xié)議轉(zhuǎn)化、高性能數(shù)據(jù)訪問,以打造整體數(shù)據(jù)服務(wù)。其方案通過(guò)零改造、無(wú)侵入策略,可以使算法工程師仍按原有方式工作,無(wú)需改變已有腳本,并且客戶已經(jīng)有的大量存量數(shù)據(jù)不需要進(jìn)行私有化協(xié)議改造。

03.AI 2.0時(shí)代,大模型行至深水區(qū) AI Infra迎來(lái)變革

在圓桌論壇環(huán)節(jié),幾位嘉賓分享了對(duì)于“大模型行至深水區(qū),AI Infra的新變化與新機(jī)會(huì)”這一主題的行業(yè)洞察,以及各自公司的產(chǎn)品和技術(shù)是如何解決AI應(yīng)用中的核心痛點(diǎn)的。

圖片17.jpg

作為主持人的德聯(lián)資本執(zhí)行董事劉景媛提到,兩年前,ChatGPT生成式AI推到臺(tái)前,迎來(lái)AI 2.0時(shí)代,Scaling Law和數(shù)據(jù)量的大規(guī)模增長(zhǎng)給AI Infra帶來(lái)了非常大的增量機(jī)會(huì)。兩年后的今天大模型行至深水區(qū),AI Infra在幫助大模型及相關(guān)產(chǎn)品的落地的過(guò)程中,產(chǎn)品邊界和功能需求逐漸明晰。

圖片18.jpg

▲劉景媛

對(duì)于Infra這類研發(fā)周期長(zhǎng)、工程復(fù)雜程度高的軟件產(chǎn)品,開源社區(qū)或許可以貢獻(xiàn)一些能量,使產(chǎn)品迭代及技術(shù)選型更貼合實(shí)際需求,同時(shí)提升項(xiàng)目本身的關(guān)注度和影響力。

另外,“go global”也幾乎成為Infra軟件的必選項(xiàng),一方面有商業(yè)的考量,另外中國(guó)工程師的勤奮和工程攻堅(jiān)能力全球有目共睹。值得關(guān)注的是,在資源有限的情況下也要做好取舍(無(wú)論是功能方面還是業(yè)務(wù)模式方面)。

Zilliz作為向量數(shù)據(jù)庫(kù)企業(yè),其產(chǎn)品可以處理大體量非結(jié)構(gòu)化數(shù)據(jù),挖掘數(shù)據(jù)價(jià)值。對(duì)AI 2.0時(shí)代的需求變化,Zilliz合伙人、研發(fā)VP欒小凡認(rèn)為,AI技術(shù)在去年被高估、今年被低估,往后看AI落地還需要等一個(gè)機(jī)會(huì),這也是整個(gè)范式的發(fā)展機(jī)會(huì)。

談到開源,欒小凡感慨道,Zilliz目前正處于最具挑戰(zhàn)的階段,一方面要讓產(chǎn)品滿足客戶需求,另一方面要讓產(chǎn)品變現(xiàn)。

圖片19.jpg

▲欒小凡

當(dāng)下,AI Infra公司出海已經(jīng)成為必答題。欒小凡認(rèn)為出海的前提條件就是產(chǎn)品要有先發(fā)優(yōu)勢(shì),在擴(kuò)展性、功能等方面碾壓競(jìng)品。產(chǎn)品定制方面,欒小凡的觀點(diǎn)是Zilliz幾乎不做定制。原因在于其所處的賽道已經(jīng)足夠大,沒有必要執(zhí)著于將自己打造成大而全的平臺(tái)。

AI時(shí)代,數(shù)據(jù)量的暴增對(duì)存儲(chǔ)提出巨大挑戰(zhàn)。Alluxio首席架構(gòu)師傅正佳介紹,他們通過(guò)分布式數(shù)據(jù)編排軟件系統(tǒng),高效連接存儲(chǔ)與計(jì)算。Alluxio很早就注意到存算分離的趨勢(shì),并在數(shù)據(jù)遠(yuǎn)程訪問環(huán)節(jié)重點(diǎn)發(fā)力,回應(yīng)了AI存儲(chǔ)挑戰(zhàn)。

Alluxio的存儲(chǔ)系統(tǒng)兼具開閉源版本,傅正佳認(rèn)為開源幫助他們保持了與技術(shù)前沿的同步,也打出了知名度,但他們也面臨著商業(yè)化和部分開源用戶貢獻(xiàn)程度低的問題。Alluxio目前正積極出海,傅正佳分享,海內(nèi)外團(tuán)隊(duì)的優(yōu)勢(shì)互補(bǔ)與產(chǎn)品的本地化是其中的關(guān)鍵。

圖片20.jpg

▲傅正佳

英飛流創(chuàng)始人兼CEO張穎峰稱,RAG用起來(lái)很容易,但做好非常困難。公司能做成RAG的核心在于,把做系統(tǒng)的人和做AI的人融合在了一起去做產(chǎn)品。

談及開源,張穎峰說(shuō),開源是商業(yè)化的一種策略,而不是為了開源而開源;為了出海必須開源,但創(chuàng)業(yè)第一天就要想明白產(chǎn)品企業(yè)版和開發(fā)者版之間的區(qū)別。

圖片21.jpg

▲張穎峰

目前英飛流的Infra產(chǎn)品還沒有進(jìn)入商業(yè)化階段,結(jié)合過(guò)往創(chuàng)業(yè)經(jīng)歷,張穎峰稱,商業(yè)化過(guò)程中,創(chuàng)始人必須對(duì)每個(gè)產(chǎn)品的特性和定制化的邊界有非常清晰的認(rèn)識(shí)。

04.結(jié)語(yǔ):生成式AI產(chǎn)業(yè)化落地加速 上中下游全產(chǎn)業(yè)鏈呼喚合作共贏

過(guò)去一年,生成式AI的發(fā)展度過(guò)了波瀾壯闊的一年,整個(gè)產(chǎn)業(yè)鏈成為全球創(chuàng)新、投資和應(yīng)用最活躍的領(lǐng)域之一,每位參與者都在與時(shí)間賽跑。

Sora掀起視頻生成熱潮,多模態(tài)世界模型的研究熱度漸起。更具革命性的推理模型o1悄然出世,基座大語(yǔ)言模型不再持續(xù)狂飆,不僅價(jià)格戰(zhàn)、營(yíng)銷戰(zhàn)硝煙燃起,融資熱度降溫,Scaling Law是否撞墻更是在年底引發(fā)熱議。

行業(yè)賦能持續(xù)進(jìn)行,包括智能體在內(nèi)的應(yīng)用層的興起仍然備受期待。同時(shí),大模型向邊端下沉的趨勢(shì)日趨明顯,AI手機(jī)、AI PC等AI硬件紛紛站上風(fēng)口。不止AI硬件,大模型驅(qū)動(dòng)下的具身智能更是熱度空前,人形機(jī)器人正開啟星辰大海。

作為智能產(chǎn)業(yè)的長(zhǎng)期觀察者,我們期待見證并記錄中國(guó)生成式AI浪潮之變,并將持續(xù)邀請(qǐng)這股浪潮中的生力軍們,分享他們最新的技術(shù)進(jìn)展與商業(yè)化探索。

隨著為期兩天的2024中國(guó)生成式AI大會(huì)(上海站)圓滿收官。2025年線下大會(huì)也將正式啟動(dòng),除了1月14日的全球自動(dòng)駕駛峰會(huì),圍繞AI芯片、生成式AI等領(lǐng)域的線下大會(huì)也已規(guī)劃上了,敬請(qǐng)期待。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-12-10
2024中國(guó)生成式AI大會(huì)上海站圓滿收官,第二日AI Infra峰會(huì)演講精華一文看盡
大模型迎拐點(diǎn)時(shí)刻,AI Infra賽道開卷,AI落地全面加速!

長(zhǎng)按掃碼 閱讀全文