來源:《財經》雜志
算力是數(shù)字經濟的底座,一個國家適度超前布局算力基礎設施建設,有重要意義。
第三方市場調研機構IDC在《2021-2022全球計算力指數(shù)評估報告》中分析了包括美國、中國等15個重點國家的算力指數(shù)(根據多項指標測算的算力綜合指數(shù))得出的結論是:算力指數(shù)平均每提高1點,國家的數(shù)字經濟和GDP將分別增長3.5‰和1.8‰。
每一代網絡基礎設施都會催生新一代產業(yè)。不同算力基礎設施上,也會誕生不同的軟件。3G、4G網絡讓移動互聯(lián)網誕生。在傳統(tǒng)的CPU算力上誕生了云。以GPU為代表的AI算力,則催生了ChatGPT和AI大模型。
2022年12月,微軟投資的AI創(chuàng)業(yè)公司OpenAI推出了聊天機器人ChatGPT。ChatGPT本質是OpenAI自主研發(fā)的GPT-3.5語言大模型,該大模型包含近1800億個參數(shù)。2023年3月15日,OpenAI將該大模型迭代至GPT-4.0。GPT-3.5只是單模態(tài)大模型,只能回復文本。但GPT-4.0是多模態(tài)大模型,能同時實現(xiàn)圖像、文本輸入。GPT-4.0的回復準確度、語義理解力大幅提升。
今年2月,阿里、百度等中國企業(yè)宣布將研發(fā)類ChatGPT產品,或將投入生成式AI的研發(fā)。3月16日,百度發(fā)布了對標ChatGPT的大語言模型“文心一言”。不過,目前中國企業(yè)對外發(fā)布的大模型普遍是單模態(tài)的,且普遍面臨GPU算力不足的挑戰(zhàn)。
《財經》在3月初與三位技術背景出身的專家進行了一場對話。他們經歷了中國產業(yè)技術發(fā)展的不同階段,擁有不同領域的專業(yè)視角。這場對話的主題是,“中國離算力自由有多遠”。我們在這場對話中探討了三大問題:
智能算力是什么,為何興起?智能算力會帶來哪些產業(yè)變革?中國要如何科學規(guī)劃算力產業(yè)?
對話人簡介:
新華三集團副總裁、計算存儲產品線總裁 徐潤安(新華三是國內重要的數(shù)字化解決方案提供商。新華三提供計算、存儲、網絡、5G、安全、終端等數(shù)字化基礎設施,客戶覆蓋百行百業(yè))
百度杰出系統(tǒng)架構師王雁鵬(百度智能云業(yè)務2022年營收177億元,正在成為集團的第二增長曲線。3月16日,百度發(fā)布了對標ChatGPT的大語言模型“文心一言”)
獨立分析師,數(shù)字化行業(yè)專家寧宇
主持人:《財經》雜志副主編謝麗容
以下是對話實錄精華版:
智能算力是什么,為何興起?
《財經》謝麗容:ChatGPT的風靡讓大家關注智能算力,就像多年前谷歌的AlphaGo戰(zhàn)勝圍棋世界冠軍時,讓普通人認識了人工智能,算力是什么?尤其智能算力是什么?它是一種什么樣的資源?
寧宇:算力是通過對信息數(shù)據進行處理,實現(xiàn)目標結果輸出的計算能力。算力會和算法、存儲一起構成我們數(shù)字社會的基礎。
徐潤安:大眾意義上理解的通用算力是CPU(中央處理器)。無論個人使用的電腦、手機,企業(yè)使用的服務器都最關心CPU主頻性能。這是衡量算力的一個重要指標。但數(shù)字化正在讓算力需求發(fā)生變化。CPU作為通用算力,已經無法完全滿足新需求。異構算力,比如GPU(圖形處理器)、DPU(深度學習處理器)、NPU(神經網絡處理器)通常被用來處理AI計算的需求。所以通常也被稱為智能算力。
王雁鵬:智能算力和通用算力采用了不同的計算方法。以CPU為代表的通用算力,善于執(zhí)行邏輯指令進行高效率的計算。GPU為代表的智能算力,善于處理大量無邏輯關系數(shù)據的并行計算。
AI訓練和推理通常不涉及復雜控制指令,卻又依賴大量數(shù)據的并行運算。GPU/DPU/NPU這些專用處理器因此誕生。在過去的計算體系結構中,CPU要處理所有工作?,F(xiàn)在的計算體系結構形成了不同的分工。GPU/DPU/NPU會針對不同的場景去做深度的優(yōu)化定制。
《財經》謝麗容:ChatGPT這類AI應用正在讓智能算力需求爆發(fā)。2022年中國服務器出貨量約380萬臺,AI服務器出貨量超25萬臺,在大盤中占比約6.5%。哪些行業(yè)、哪些領域對智能算力有強需求?
徐潤安:典型的使用場景包括互聯(lián)網的搜索和推薦、零售電商業(yè)務數(shù)據分析;政府的智慧城市及治理,比如新華三已經為杭州濱江、呼和浩特等60余個地市通過城市大腦進行公共事務的輔助決策;自動駕駛的仿真訓練,需要大量真實道路數(shù)據進行模擬學習。
王雁鵬:百度在AI領域投入很久,云業(yè)務標簽是“智能云”。我們提出了一個理念,叫AI Native(AI原生)。也就是說,千行百業(yè)都可以使用AI算力和模型訓練。例如,金融機構反欺詐、鋼鐵工廠AI質檢、能源企業(yè)的線路檢修都采用了百度類似深度應用。這個趨勢未來會給各行業(yè)帶來翻天覆地的變化。不過,這需要一段時間。
《財經》謝麗容:這么多領域都要用到智能算力,那么資源相對充沛的通用算力是不能用,還是效率跟不上?從客戶需求來看,智能算力占比已經超過甚至替代通用算力了?
徐潤安:這是計算效率的問題。最常見的CPU算力是x86服務器芯片。x86芯片單核性能強、通用性好,但是AI場景通常需要多核、高并發(fā)、高帶寬的芯片。綜合考慮成本、效率,GPU/DPU/NPU這些專用處理器通常會處理得更好。
現(xiàn)代計算機是遵循馮·諾依曼架構設計的,這套架構已經延續(xù)70多年??梢源_定的是,CPU作為中央處理器的地位在短期內不會改變。只是在數(shù)據挖掘等場景下,CPU的職能被其他專用芯片分擔了。CPU、GPU及其他AI芯片,這三種蛋糕的比例會有變化。不過未來會誕生新的計算機架構。
現(xiàn)在有一種理念叫做“多元算力”。過去10年大家通常只談x86計算架構。但計算芯片和計算進程都在多元化,這是必然的趨勢。
王雁鵬:簡單理解的話,CPU像是大腦,它需要完成復雜的邏輯。GPU/DPU/NPU這些專用芯片就像四肢。它們不需要腦子太發(fā)達,只需要四肢足夠強壯,去解決需要解決的工作。
《財經》謝麗容:把CPU/GPU/DPU/NPU這些算力資源組合在一起,什么樣的組合才是效率最高的?專用芯片是不是需要足夠大的規(guī)模,成本才會下降?
寧宇:通常情況下,特殊需求一定要足夠大的規(guī)模,才能支撐起專用芯片。專用芯片,需要規(guī)?;\作,才能更經濟。多元算力持續(xù)增長,專用需求規(guī)?;瘮U張。這才會讓專用芯片的研發(fā)、生產、制造需求也不斷擴大。另一種場景是,傳統(tǒng)芯片無法完成新的工作。因此,哪怕成本更高,也需要用專用芯片去解決,企業(yè)自然而然也會去使用專用芯片。
徐潤安:是否使用專用芯片其實是種商業(yè)考量。所有活動都要考慮投入產出比,追根溯源還是效率問題。專門為一個算法或一個場景研發(fā)專用芯片,前提是可以產生足夠的效益,最終能覆蓋研發(fā)和制造成本。過去幾十年,x86架構芯片的生產成本降到了很低,因此CPU無法被替代。但是大模型和其他業(yè)務場景的出現(xiàn),專用芯片的綜合計算效率更高,使得其他廠商有機會研發(fā)生產專用芯片。
《財經》謝麗容:專用芯片需要面臨成本、效率這個矛盾。ChatGPT背后的AI大模型和生成式AI是不是也需要面臨類似的矛盾?如何解決這些問題?
王雁鵬:阻礙上一代AI技術大規(guī)模落地的瓶頸有三個。一是企業(yè)需要針對不同業(yè)務場景,定制不同的算法,研發(fā)成本很高。二是,AI的后面是人工,企業(yè)需要耗費大量人工去標注數(shù)據,人力有限且成本高昂。三是,語音、圖像、自然語言分別有不同的研究框架,三者無法融合。
大模型代表了新一代AI技術,帶來了里程碑式的變化,解決了三個核心問題。一是,一個通用的算法就可以應對過去數(shù)十種場景,落地空間變得更大。二是,數(shù)據無需人工標注,大量數(shù)據可以得到自動訓練,而且模型結構是統(tǒng)一的。三是,語音、圖像、自然語言可以實現(xiàn)多模態(tài)融合,三者互相關聯(lián)。AI的思考方式會更符合人類認知方式。上述三個變化,更通用的模型、大規(guī)模數(shù)據訓練、多模態(tài)融合,會帶來AI技術的井噴和AI應用的爆發(fā)。
寧宇:過去AI模型往往用于專業(yè)領域、專業(yè)場景。大模型讓AI能夠成為通用工具平臺,應對足夠多的場景。上層AI應用使用規(guī)模變大,會激發(fā)AI算力的需求,進而會使得下層硬件可以衍生出專用AI場景的芯片、服務器。這是一個從專業(yè)到通用再到專業(yè)的產業(yè)循環(huán)。
徐潤安:AI從水平場景影響到了應用、硬件一個個不同的層次,這使得業(yè)務既解耦又打通。比如,底層的智能算力可以提供專用芯片,進一步降低上層AI應用的成本。
智能算力會帶來哪些產業(yè)變革?
《財經》謝麗容:AI技術這輪演變和創(chuàng)新會帶來大量新的機會,其中誰會受益?是不是會有一批優(yōu)秀的創(chuàng)業(yè)公司誕生?未來會形成怎樣的產業(yè)生態(tài)?
徐潤安:生成式AI爆發(fā)會帶來巨大的算力消耗,那么第一輪機會是ICT企業(yè)的。頭部企業(yè)投入大模型研發(fā),對新華三這種ICT企業(yè)來說就是機會。我們有更多機會服務好這些頭部客戶,為他們建設基礎設施。
第二輪機會是頭部大公司的。頭部廠商開發(fā)出大模型之后,可以利用平臺對外賦能。對外服務的過程,也是這些大公司受益的過程。
第三輪機會是各類創(chuàng)業(yè)公司的。大公司研發(fā)出大模型后,會形成平臺生態(tài)。大量公司在平臺上,針對千行百業(yè)研發(fā)上層AI應用。黃教主(英偉達CEO黃仁勛)說,ChatGPT相當于iPhone。iPhone帶來了移動互聯(lián)網的爆發(fā),大模型也是類似的。這個過程中會有起有伏,有人成功有人失敗,但一定會有最終的受益者。
王雁鵬:在AI領域,百度有芯片、框架、大模型和應用的全面積累。
我認為未來可能會形成三層生態(tài)?;A層是提供基礎大模型服務的企業(yè),只有大公司才有能力。因為這需要長期投入,如資金、人力和技術積淀。第二層主要是各領域的公司。一些公司有較強的行業(yè)研究能力,可以基于大模型做各領域的專業(yè)應用。第三層是開發(fā)者。他們只需要放開手腳,把應用做好。開發(fā)者一定是更繁榮和開放的生態(tài)。
寧宇:大模型可能會讓AI產業(yè)出現(xiàn)類似移動互聯(lián)網誕生前后的產業(yè)變革。早年通信設備商為電信運營商提供硬件,中國移動、中國聯(lián)通、中國電信鋪設3G、4G高速通信網絡?;A設施建設完成后,移動互聯(lián)網群雄并起。微信、淘寶、支付寶這些APP都因此誕生。
AI產業(yè)在中國發(fā)展很快,現(xiàn)在新華三這類企業(yè)為大廠提供硬件,助力建設算力中心,大廠建成大模型,大模型上會雨后春筍般孵化出AI應用。AI產業(yè)鏈會重構,大中小企業(yè)都可以找到自己的定位。所以,黃教主才會說,ChatGPT出現(xiàn)不亞于iPhone誕生給產業(yè)帶來的沖擊。
要如何科學規(guī)劃算力產業(yè)?
《財經》謝麗容:ChatGPT出現(xiàn)后,國內部分企業(yè)正在開始追趕。但也有人質疑,我們的算力、算法、數(shù)據實力能不能支撐中國做好類似的應用?
王雁鵬:在AI領域,中國和美國是絕對領先的。當前中國算力的確受到了一定制約。但從長線來看,一定可以突破,我對此有信心。接下來的挑戰(zhàn)是,數(shù)據是不是夠多??陀^現(xiàn)狀是,中文數(shù)據豐富度小于英文,但模型的邏輯推理能力可以彌補這個短板。
寧宇:算力、算法、數(shù)據,這些要素其實中國都有。我們未來的問題是監(jiān)管這類非技術因素。訓練內容如何監(jiān)管、應用場景如何適配、社會如何跟進技術發(fā)展,這都是挑戰(zhàn)。
《財經》謝麗容:ChatGPT這類生成式AI應用和大模型正在涌現(xiàn)。面向未來,中國應該如何科學地規(guī)劃自己的算力產業(yè)?
王雁鵬:我們希望,算力的供給能像水電一樣簡單。以CPU為代表的通用算力有標準的軟件、接口,在云上已接近水電。但是GPU/DPU/NPU這些異構算力,軟件復雜度越來越高。它的使用并不像CPU那樣簡單。這意味著我們需要芯片、框架、模型、應用都一體化整合發(fā)展。這樣才能把智能算力也變成CPU算力一樣標準化的水電資源。
徐潤安:我們需要摒棄過去幾十年看待算力的視角。過去是攤大餅似的買設備,堆砌算力,這種發(fā)展模式太粗放了。一方面我們需要應對多元算力的發(fā)展趨勢,讓算力得到更高效使用。另一方面,算力對電力消耗很大,所以這也催生了東數(shù)西算這樣的政策規(guī)劃。
此外,中國一直在提“算力網絡”概念,思考如何把國內的數(shù)據中心跨區(qū)域連接在一起。這是個系統(tǒng)工程。如果算力網絡建成,算力、存儲、網絡都可以統(tǒng)一調度,那么它會成為數(shù)字化變革的核心。新華三在去年推出了H3C UniServer G6新一代AI服務器,為此還搭配了智能管理中樞,這就像是算力操作系統(tǒng)?,F(xiàn)在的異構算力太多了,我們希望彌補這些鴻溝,讓企業(yè)能更簡單、高效地使用AI算力。
寧宇:算力作為資源需要整體分配。對企業(yè)來說,需要不斷降低算力成本。對國家來說,需要對產業(yè)鏈的不同角色進行重新定位。東數(shù)西算與碳中和等其他國家戰(zhàn)略是相互匹配的。就像中國建設高鐵、4G/5G網絡一樣,算力基礎設施建設也要有規(guī)劃。既要讓成本足夠經濟,又要讓地區(qū)平衡發(fā)展,還要協(xié)調算力基建、AI應用的供需節(jié)奏。
把分散的服務器、數(shù)據中心簡單匯總計算出中國總體算力,這種統(tǒng)計方式便于操作。但我個人并不完全贊同拿浮點運算總數(shù)去衡量一個國家的算力能力。政策方提“算力網絡”、“云網融合”概念,是因為算力相連成網絡之后才有意義。這就像局域網不成體系,互聯(lián)網才能創(chuàng)造產業(yè)價值。
《財經》謝麗容:以電信行業(yè)為例,中國普通人的的通信自由,不為流量資費發(fā)愁的日子似乎是從4G開始的。對中國來說,什么是算力自由?算力自由是什么狀態(tài)?
王雁鵬:我理解的算力自由是,算力要支撐算法的發(fā)展,不要限制人類的想象力。從歷史發(fā)展來看,大型機/小型機被x86架構芯片取代,原因是大型機/小型機太昂貴,無法建成互聯(lián)網和云計算?;ヂ?lián)網讓廉價的x86架構芯片最終一統(tǒng)天下。Google在2003年-2006年發(fā)表的三篇論文又為云計算奠定理論基礎——用廉價的通用計算設備(x86架構,Linux系統(tǒng))搭建低成本的計算集群。每個時代都可以重構不同的計算模式。這需要百度、新華三等企業(yè)在不同領域跨產業(yè)層的努力。
寧宇:第一是便宜,第二是易用。每一代通信技術迭代的周期是10年左右。電信運營商在這個周期內,一方面要保證經營能夠覆蓋基站的建設、維護成本,另一方面要讓用戶增長和網絡規(guī)模同步發(fā)展。在這兩個平衡的前提下提速降費,實現(xiàn)通信自由。未來如果有算力運營商,或者說是今天的云計算廠商,國家需要有宏觀政策指導產業(yè)演進。讓資源供給、市場需求以及運營商的收入能夠實現(xiàn)良好的匹配。
徐潤安:算力自由不是簡單的攤大餅,核心是供需平衡。和通信產業(yè)不同的是,通信技術10年一次迭代,但算力是3年-5年一次,因為服務器的平均使用周期大約是4年。這會導致算力運營商的成本是偏高的。算力設備采購后,3年內必須充分發(fā)揮作用。如果算經濟賬,這會帶來很大的挑戰(zhàn)。
關于算力的技術演進,這需要端到端的優(yōu)化,產業(yè)鏈從上到下打破這壁壘。新華三和這類云計算廠商、三大電信運營商都需要探討這些需求。我們不能只生產、提供設備,我們需要對未來做出預測,進行適當?shù)耐度?,提前做技術布局。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )