配圖來自Canva可畫
在被譽為“科技企業(yè)營銷圣經”的《跨越鴻溝》一書中,杰弗里·摩爾寫道:“高科技產品面世過程中,最危險、最關鍵的一點,就是由少數(shù)有遠見者所主宰的早期市場,向實用主義者占支配地位的主流市場過渡?!贝丝?,狂飆突進已半年有余的國內生成式人工智能(AIGC)市場,正面臨著這個關鍵的過渡。
截至8月底,首批8家AI大模型企業(yè)通過備案。與上半年“甚囂塵上”的行業(yè)境況不同,具備實力且具備滿腔“產業(yè)抱負”的實力型玩家,總是姍姍來遲,但卻總是能夠一鳴驚人,為產業(yè)的大規(guī)模應用創(chuàng)造機會。目前來看,隨著未來不斷有新的企業(yè)通過備案,“大模型+”的應用拐點正在到來。
“大模型+”應用拐點加速到來
8月份剛剛過去,9月初百度就迫不及待地對外公布了文心一言大模型開源。與此同時,“姍姍來遲”的騰訊混元大模型,一亮相便“秀”起了“肌肉”,科大訊飛與華為合作發(fā)布“星火一體機”,進一步把大模型端側應用擺在了臺面上。一波接一波的行業(yè)浪潮席卷而來,正推動整個“大模型+”應用時代加速到來。
首先,大模型從C端應用逐漸轉向B端應用領域,以“實用”為導向的大模型日漸成為行業(yè)趨勢。自從去年12月ChatGPT,在短短一個月之內實現(xiàn)月活破億之后,圍繞整個C端市場的AI大模型玩家如百度等,就開始大規(guī)模地涌入該領域,一時之間C端大模型應用迎來了外界的一致關注。但進入下半年以后,市面上越來越多的“面向B端”的應用開始出現(xiàn),更加“實用”的行業(yè)大模型也在成群結隊地出現(xiàn),大大加速了生成式AI產業(yè)化的進程。比如,京東發(fā)布了言犀大模型、京醫(yī)千詢大模型,攜程發(fā)布了攜程問道大模型,網易有道發(fā)布了基于教育的子曰大模型,用友發(fā)布了用友GPT大模型等等。
相比通用大模型廠商而言,垂直大模型廠商在相關行業(yè)深耕已久,因而在尋找產業(yè)機會方面往往走得更加深入。以網易有道、京東兩家為例,網易有道在教育領域深耕已久,它在長期深耕行業(yè)的過程中,不僅積累了龐大的用戶和教育行業(yè)數(shù)據(jù),還積累了相對應的高質量數(shù)據(jù),這使其在做教育大模型過程中,擁有更多比較優(yōu)勢。無獨有偶,京東在零售、大健康領域廣有布局,這使其在構建產業(yè)大模型和京醫(yī)大模型方面,擁有堅實根基;而攜程則在文旅行業(yè)深耕已久,積累了廣泛的文旅產業(yè)鏈數(shù)據(jù)和資源。
顯然,相比通用大模型廠商而言,圍繞垂直領域的行業(yè)大模型,不僅可以依靠專業(yè)數(shù)據(jù)讓大模型更加“實用”,還可以在特定領域發(fā)揮獨特作用,幫助行業(yè)盡快完成數(shù)字化轉型。
其次,具備通用能力的大型云服務企業(yè),正在加速與各路行業(yè)大模型企業(yè)展開合作,新的大模型生產機制正在成型。目前業(yè)內包括百度、騰訊、阿里、華為等主要云廠商,都紛紛依托自身的技術優(yōu)勢、團隊優(yōu)勢和資金支持,在通用大模型領域實現(xiàn)搶跑。除此之外,各主要廠商還聯(lián)合行業(yè)頭部企業(yè),推出行業(yè)大模型解決方案。
比如,騰訊云聯(lián)合行業(yè)頭部企業(yè),已為文旅、政務、金融等10余個行業(yè),提供了50多個大模型行業(yè)解決方案。華為旗下盤古大模型,更是可以提供5個基礎大模型+N個行業(yè)大模型+X個場景模型的三層解耦架構,目前已經應用到了鐵路、礦山、能源、氣象、政務等諸多領域。阿里云更是對外開放了“通義千問”的全部能力,幫助企業(yè)結合自身的行業(yè)知識和應用場景,訓練自己的企業(yè)大模型;加上目前已經開源的文心一言,由大的云平臺提供包括云服務、算力、通用大模型工具支持等基礎設施,各行業(yè)頭部企業(yè)提供專業(yè)經驗和數(shù)據(jù)訓練的大模型生產機制已經基本成型。
志在必得的騰訊
對于大模型的發(fā)展,騰訊高層顯然很早之前就已經定下了調子,但其推出的時間卻在一眾巨頭中最晚。在上半年如火如荼的大模型混戰(zhàn)中,騰訊的大模型在業(yè)內一直是“只聞其聲、不見其名”的存在。但從9月其正式面世之后的外界反應來看,此前“默默無聞”的騰訊大模型,更多是在“厚積薄發(fā)”。
9月7日騰訊正式對外發(fā)布了騰訊混元大模型,據(jù)了解該模型擁有超千億參數(shù)規(guī)模,預訓練語料超過2萬億Tokens,并已接入騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔等50多個騰訊業(yè)務。而且在國家公布的首批大模型廠商中,騰訊混元大模型赫然在列。同時,騰訊混元大模型還宣布對外開放,千行百業(yè)的人都可以通過API調用混元,或者將其作為產業(yè)底座,為不同產業(yè)場景構建大模型應用,不難看出騰訊對大模型的“志在必得”。
首先,騰訊構建了“更強”的“探真”技術方法,這使其具備更強的信息可信度,極大增強了大模型自身的實用性。基于全網的數(shù)據(jù)檢索和生成,是大模型的核心能力之一。值得一提的是,無論是基于GPT-3.5還是國內其他大模型,源于錯誤信息帶來的錯誤答案,依然不可避免。但騰訊混元大模型卻基于自身的技術能力,保證正確答案的輸出。
與業(yè)界消除“幻覺”的通用做法不同,混元大模型并沒有為大模型增加搜索或者知識圖譜等外掛,而是從源頭上解決問題。具體來說,混元大模型從第一行代碼開始,就采用了預訓練階段優(yōu)化目標函數(shù)的“探真”技術方法。據(jù)業(yè)內專業(yè)人士介紹,該方法與常見的開源大模型相比,能有效降低幻覺30%到50%。
除了“探真”能力優(yōu)秀之外,騰訊混元的另一大超強能力在于其支持超長文本輸出。盡管目前多模態(tài)正在成為主流大模型演進方向,但在文本輸出方面,包括GPT-3.5和GPT-4在內的大模型,都很難支持1000字以上的文本輸出,但騰訊混元通過位置編碼優(yōu)化提高了超長文的處理效果和性能,已經具備輸出4000多字的完整答案的能力。
其次,騰訊構建了從軟到硬的全流程基礎設施,這讓騰訊具備了更強的“全局優(yōu)化”能力。從自研的星星海服務器,到新一代HCC高性能計算集群,再到自研的星脈高速網絡,騰訊已經為自己打造了一整套面向AIGC的高性能智算網絡。據(jù)騰訊內部負責人介紹,目前騰訊云已經可支持超過10萬張卡并行計算的大規(guī)模訓練集群,萬億參數(shù)大模型可以在四天之內完成。
目前,騰訊云已經建立起了圍繞大模型的全套能力,包括高性能算力集群、云原生數(shù)據(jù)湖倉和向量數(shù)據(jù)庫等數(shù)據(jù)處理引擎,以及模型安全、支持模型訓練和精調的工具鏈等,企業(yè)和開發(fā)者都可以根據(jù)自己的需求,靈活選擇產品,降低大模型的訓練成本。
不甘落后的科大訊飛
除了騰訊大模型之外,在大模型上已經先行一步的科大訊飛也是不甘落后,不僅積極參與通用大模型的建設,還持續(xù)發(fā)力行業(yè)大模型的建設。目前科大訊飛的大模型已經具備7大能力,分別為:文本生成、語言理解、知識問答、邏輯推理、數(shù)學和多模態(tài)能力,并且這種能力還在不斷提升。而基于大模型開發(fā)所需的巨大投入量,科大訊飛也做了多方面的準備。
一方面,科大訊飛積極展開與業(yè)內巨頭的合作,強化星火大模型的技術實力。早在今年8月中旬,科大訊飛就與華為共同發(fā)布星火一體機,讓所有企業(yè)都可以在國產自主創(chuàng)新平臺上私有化部署大模型。一來,星火一體機基于星火認知大模型,針對污語料和幻覺問題,形成了“立體化”的內容安全機制。二來,星火一體機基于昇騰AI硬件、昇思AI開源框架,提供業(yè)界領先的大模型訓練、推理能力,為大模型全流程創(chuàng)新提供堅實的自主創(chuàng)新算力底座。
具體來說,訊飛星火認知大模型基于訓練推理一體化設計,實現(xiàn)大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業(yè)落地應用和迭代;與此同時,以昇騰AI為核心,軟硬件協(xié)同優(yōu)化,構建算力集中、協(xié)同優(yōu)化、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓練集群,這些都可以強化星火大模型的自身實力。
另一方面,科大訊飛積極推動與自身業(yè)務場景的整合,加速大模型的場景落地。除了不斷強化自己核心能力之外,科大訊飛還結合自身的業(yè)務場景,推動大模型在辦公、政務、電力、教育、醫(yī)療、工業(yè)、司法、金融等行業(yè)的場景落地。星火一體機內已涵蓋辦公、代碼、運維、客服、營銷、采購等10多個場景包,支持對話開發(fā)、任務編排、插件執(zhí)行、知識接入、提示工程等5種定制優(yōu)化模式,并將持續(xù)拓展更多專業(yè)場景和模式優(yōu)化,為客戶快速定制企業(yè)專屬大模型。
總的來看,科大訊飛在大模型上,外部合作和內部場景落地相結合的方式,很好地保證了其大模型產業(yè)化的加速落地。
大模型大洗牌正在加速到來
在眾多頭部巨頭和行業(yè)巨頭的共同努力之下,“百模大戰(zhàn)”甚至“千模大戰(zhàn)”的局面正在加速形成。而在這種的形勢之下,圍繞大模型的“行業(yè)大洗牌”或將提前到來。
首先,產品能力的比拼已經初見分曉。據(jù)知名廠商IDC依據(jù)算法模型、通用能力、創(chuàng)新能力、平臺能力和安全可解釋等五方面的要求,評估出了目前市面上在大模型方面綜合評分最高的三家廠商,分別是百度、阿里巴巴、科大訊飛。不過由于這個數(shù)據(jù)排出的時間較早,未考慮到騰訊和華為的產品能力,所謂真實的綜合技術實力方面,排名靠前的依舊會是BATH這些行業(yè)巨頭。
但各家的能力并不相同,也各有側重。具體來說,百度的能力在于其具有“芯片—框架—模型—應用”四層技術棧完整布局的獨特優(yōu)勢:芯片層—昆侖芯、框架層—飛漿、模型層—文心大模型,以及各種AI的落地應用。阿里的能力也相近,其強大之處在于圍繞云搭建起了一整個的大模型基礎設施;華為的能力在于強大的基礎技術能力,以及廣泛的終端生態(tài)應用和B端應用能力。在BATH之外,其他大模型廠商依然排在第二梯隊、第三梯隊,產品層面的分化已經出現(xiàn)。
其次,是大模型生態(tài)服務能力的比拼已然拉開序幕。以阿里為例,阿里不僅推出了通義千問大模型,還推出了魔搭大模型社區(qū),還有眾多的生態(tài)合作伙伴;百度在這方面也不遑多讓,不僅有基于大模型的技術能力,還有廣泛的生態(tài)伙伴,推理能力和速度伴隨著大模型的版本更新,也在日新月異;作為同級別大廠,華為、騰訊等廠商自然也具備類似能力。不難預見,未來各路廠商圍繞預訓練、邏輯推理等相關方面的技術服務,將成為行業(yè)競爭的常態(tài)。
當然,無論是產品維度還是服務能力,最終都要落地到產業(yè)實踐上。從行業(yè)覆蓋來看,從文心大模型出發(fā),百度已經在能源、汽車、政務、交通、金融等重點領域布局11個行業(yè)大模型,將大模型融入到垂直領域,真正做到產業(yè)實踐和商業(yè)落地。阿里、騰訊、華為等也覆蓋電商零售、物流、社交、礦業(yè)等諸多行業(yè),產業(yè)化落地也在快速提升。
而隨著各大平臺的大模型,在產品、生態(tài)服務和產業(yè)實踐上的全面展開,大模型的大洗牌正在加速到來。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美國無人機禁令升級?當?shù)乜茖W家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實力
- 自動駕駛第一股的轉型迷途:圖森未來賭上了AIGC
- 明星熱劇、品牌種草、平臺資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機看它就夠了!
- 游戲體驗天花板,一加 Ace 5 系列售價 2299 元起
- 16個月沒工資不敢離職,這些打工人“自費上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問界M9,中國豪華車的龍門一躍
- 科技云報道:人工智能時代“三大件”:生成式AI、數(shù)據(jù)、云服務
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。