科技云報(bào)道原創(chuàng)。
在過去近一年的時(shí)間里,AI大模型從最初的框架構(gòu)建,逐步走到落地階段。
然而,隨著AI大模型深入到千行百業(yè)中,市場(chǎng)開始意識(shí)到通用大模型雖然功能強(qiáng)大,但似乎并不能完全滿足不同企業(yè)的個(gè)性化需求。
大模型技術(shù)的安全性、解釋性、易用性等綜合指標(biāo)正在成為此輪AI競(jìng)賽的關(guān)鍵,部分企業(yè)不再執(zhí)著于大模型的開發(fā),而把目光向普惠式AI、生成式AI+多云、大模型的私有化部署等多種商業(yè)模式。
AI與云計(jì)算迎來大融合時(shí)代
從誕生起,云計(jì)算一直被認(rèn)為是未來的發(fā)展方向、互聯(lián)網(wǎng)企業(yè)們的“第二增長曲線”。
但是,受互聯(lián)網(wǎng)增長紅利見頂以及政策監(jiān)管趨嚴(yán)的影響。從2021年開始,原本處在高速增長階段的云服務(wù)商們紛紛陷入了增速放緩的階段。從高峰時(shí)的超過50%的增速,一路跌至2022年的20%,甚至更低。
全球產(chǎn)業(yè)需求的消退,導(dǎo)致云計(jì)算行業(yè)增速失調(diào)。根據(jù)研究機(jī)構(gòu)TrendForce今年2月的預(yù)警,Meta、微軟、谷歌、亞馬遜這四家云廠商的服務(wù)器采購量可能從年增6.9%放緩至4.4%。
不過,拐點(diǎn)很快到來。在ChatGPT出現(xiàn)后,即使行業(yè)需求放緩,國內(nèi)外云服務(wù)商們也在積極將業(yè)務(wù)重心轉(zhuǎn)移至AI領(lǐng)域。
可見云服務(wù)商們逐漸從上半場(chǎng)的“求速度”轉(zhuǎn)變?yōu)槁涞赜诋a(chǎn)業(yè)深處,去尋求更高的價(jià)值增量。
隨著第一波上云的完成,企業(yè)正在進(jìn)入深度用云階段。AI與云的結(jié)合不僅能夠進(jìn)一步降低企業(yè)上云的門檻,還能為企業(yè)實(shí)現(xiàn)業(yè)務(wù)深度的智能化。
根據(jù)Gartner《2022年人工智能技術(shù)成熟度曲線》報(bào)告,盡早采用復(fù)合型人工智能(AI)、決策智能等AI技術(shù)將給企業(yè)機(jī)構(gòu)帶來明顯的競(jìng)爭(zhēng)優(yōu)勢(shì),緩解AI模型脆弱性引發(fā)的問題,有助于捕捉業(yè)務(wù)背景信息,推動(dòng)價(jià)值實(shí)現(xiàn)。
今年4月中旬,阿里云智能首席商業(yè)官蔡英華對(duì)外表示,算力的飛速發(fā)展使數(shù)字化成為確定,使智能化成為可能。
未來阿里云將以云計(jì)算為基石,以AI為引擎,參與到從數(shù)字化邁向智能化的劃時(shí)代變革中。
AI走向普惠的一大步
英偉達(dá)第二財(cái)季的業(yè)績(jī)驚艷眾人,其背后是生成式AI革命中,行業(yè)對(duì)高性能算力的迫切需求,然而現(xiàn)在,昂貴的算力成本下,AI大模型似乎仍是個(gè)“富人游戲”。
面對(duì)GPU價(jià)格的暴漲與未來可能到來的“算力荒”,大公司砸錢囤卡,尚可悠然步入AI競(jìng)技場(chǎng),而中小企業(yè)沒有“鈔能力”,在發(fā)展AI模型、應(yīng)用過程中,更容易受算力制約。
拿什么來拯救AI算力資源極度不均衡的現(xiàn)狀?如何讓更多創(chuàng)業(yè)者參與到大模型的市場(chǎng)競(jìng)爭(zhēng)中?
作為全球GPU龍頭供應(yīng)商、此輪AI熱潮最大的受益者,英偉達(dá)給出了破局之道——算力租賃。
今年3月,英偉達(dá)正式推出算力租賃服務(wù)方案“DGX云”,該方案由英偉達(dá)與微軟云、谷歌云、甲骨文等全球top10的云服務(wù)商共同打造,企業(yè)通過一個(gè)瀏覽器就可以按月租用英偉達(dá)DGX AI超級(jí)計(jì)算機(jī),不需要采購與擁有服務(wù)器設(shè)備。
事實(shí)上,英偉達(dá)DGX云并非AIGC產(chǎn)業(yè)首例,但由于DGX AI超級(jí)計(jì)算機(jī)的杰出性能,DGX云將AIGC云算力產(chǎn)業(yè)推向了更高的起點(diǎn),該服務(wù)推出標(biāo)志著AI云算力進(jìn)入新階段。云算力采用“化整為零”的方式賦能產(chǎn)業(yè)鏈各方,具備可持續(xù)性。
算力租賃,即對(duì)算力進(jìn)行出租,是一種通過云計(jì)算服務(wù)提供商租用計(jì)算資源的模式。算力生產(chǎn)商與云平臺(tái)的合作由來已久,用戶可以通過阿里云、騰訊云等平臺(tái)租用英偉達(dá)的顯卡與AI處理器。
對(duì)于英偉達(dá)與云服務(wù)商來說,算力租賃是實(shí)現(xiàn)雙贏的策略。
全球第七大云服務(wù)商甲骨文是最先響應(yīng)英偉達(dá)DGX云計(jì)劃的大廠,該公司于2022年10月將英偉達(dá)加速計(jì)算堆棧工具(包括GPU 、系統(tǒng)、軟件)遷移到其IaaS業(yè)務(wù)的旗艦產(chǎn)品——云服務(wù)平臺(tái)OCI(Oracle Cloud infrastructure)上。
從最新的季報(bào)數(shù)據(jù)來看,這對(duì)甲骨文的業(yè)績(jī)有非常顯著的拉動(dòng)作用。
2023年第四財(cái)季(自然年3月1日-5月31日),其云業(yè)務(wù)(IaaS+SaaS)營收達(dá)44億美元,同比增加54%;其中,IaaS業(yè)務(wù)營收14億美元,同比大增76%,云廠商中單季度云業(yè)務(wù)增收增速第一。
于英偉達(dá)而言,這亦是一筆回本周期短且毛利率可觀的生意。
以A100(80G)租賃服務(wù)為例,A100(80G)顯卡單價(jià)成本取10萬元,現(xiàn)假設(shè)每張卡都得到充分租用,則按照2023年8月19日國內(nèi)云算力平臺(tái)租用A100(80G)服務(wù)器的均價(jià)15.1元/小時(shí),考慮到各大平臺(tái)競(jìng)爭(zhēng)客戶,經(jīng)常性推出優(yōu)惠活動(dòng),則假設(shè)平均實(shí)際租金為7.6元/小時(shí),投入10億元資金的實(shí)際回本周期為1.5-2年,按照平臺(tái)最低定價(jià)計(jì)算,毛利率至少為46.3%。
目前,英偉達(dá)正積極拓展“朋友圈”,與領(lǐng)先的云服務(wù)商聯(lián)合托管DGX云基礎(chǔ)設(shè)施,甲骨文之外,微軟Azure也已開始托管DGX云,這項(xiàng)服務(wù)還將在不久之后擴(kuò)展到谷歌云。
基于算力租賃,用戶只要按需付費(fèi),不用承擔(dān)硬件設(shè)備的采購、維護(hù)、升級(jí)等費(fèi)用,也不用擔(dān)心設(shè)備閑置或者過時(shí)造成浪費(fèi);用戶可隨時(shí)隨地通過云端訪問所需的算力資源,快速開始訓(xùn)練和應(yīng)用;用戶可根據(jù)需求選擇不同算力平臺(tái)和機(jī)型,也可以不受地域或者時(shí)間的限制模型、工具等資源,進(jìn)行更多的嘗試和探索。
當(dāng)多云遇到生成式AI
為了向大模型客戶提供高穩(wěn)定性和高性價(jià)比的AI基礎(chǔ)設(shè)施,生成式AI+多云的模式成為科技廠商們新的角力點(diǎn)。云被看作是AI的承載,而AI也是云的核心抓手,開展大模型所需要的算法、算力和數(shù)據(jù)等能力,以及覆蓋IaaS、PaaS、MaaS的解決方案。
近期,VMware 推出Intelligent Assist、Private AI架構(gòu)方案。在此之前,阿里云提出了“Model as a service”的概念,亞馬遜云科技推出了包括Amazon Bedrock和Amazon Titan模型等生成式AI新工具。
VMware CEO Raghu表示:“生成式AI與多云可謂珠聯(lián)璧合??蛻舻臄?shù)據(jù)無處不在,遍布其數(shù)據(jù)中心、邊緣、云等多處。
我們將與NVIDIA一同助力企業(yè)放心地在數(shù)據(jù)附近運(yùn)行生成式AI工作負(fù)載,并解決其在企業(yè)數(shù)據(jù)隱私、安全和控制方面的問題。”
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“我們能夠訓(xùn)練AI模型,微調(diào)AI模型,為了跨多個(gè)GPU部署AI模型和大語言模型,特別是大語言模型,一臺(tái)計(jì)算機(jī)運(yùn)行不了,必須將其分配到多機(jī)多卡上,并對(duì)其進(jìn)行推理、生成token,實(shí)現(xiàn)交互,其速度可媲美人類日常交互。”
同時(shí)他表示,通過與VMware擴(kuò)大合作,我們將能夠?yàn)榻鹑诜?wù)、醫(yī)療、制造等領(lǐng)域的成千上萬家客戶提供其所需的全棧式軟件和計(jì)算,使其能夠使用基于自身數(shù)據(jù)定制的應(yīng)用,充分挖掘生成式AI的潛力。
Private AI由一套集成式AI工具組成,能夠使企業(yè)自定義模型并運(yùn)行各種生成式AI應(yīng)用,如智能聊天機(jī)器人、助手、搜索和摘要等。
該平臺(tái)將作為全集成式解決方案,采用NVIDIA提供的生成式AI軟件和加速計(jì)算,基于VMware Cloud Foundation構(gòu)建,并針對(duì)AI進(jìn)行了優(yōu)化。
VMware AI Labs副總裁Chris Wolf表示:“最開始,AI是由一部分?jǐn)?shù)據(jù)科學(xué)家為方便其他的數(shù)據(jù)科學(xué)家而構(gòu)建和設(shè)計(jì)的。
隨著全新VMware Private AI產(chǎn)品的推出,VMware正在讓計(jì)算和AI模型的選擇更加貼近數(shù)據(jù),從而使未來的AI服務(wù)于企業(yè)中的每一個(gè)人?!?/p>
AI能拉動(dòng)云服務(wù)增長嗎?
行業(yè)研究機(jī)構(gòu)IDC日前發(fā)布的2022年全球云計(jì)算追蹤數(shù)據(jù)顯示,全球云計(jì)算IaaS市場(chǎng)規(guī)模增長至1154.96億美元,同比去年上漲26.2%。
全球前三名云廠商依次為亞馬遜、微軟、阿里云,所占份額分別為48.9%、14.4%、6.2%,谷歌和IBM緊隨其后,所占份額分別為5.6%和2.9%。華為云、中國電信、騰訊云、中國移動(dòng)和百度云位列六至十名。
與2021年相比,阿里云市場(chǎng)份額在減少,而亞馬遜和谷歌所占市場(chǎng)份額在增加。
移動(dòng)互聯(lián)網(wǎng)發(fā)展見頂之后,全球云服務(wù)商收入增長都在放緩,AWS增速從40%下降到12%,微軟Azure增速從31%下降到15%,但顯然阿里云面臨的挑戰(zhàn)更大一些,增速已降至不足10%,上個(gè)季度首次出現(xiàn)負(fù)增長。
反觀緊隨其后的谷歌云仍保持近30%的增長,極有可能取代阿里云占據(jù)全球云廠商第三的位置。
2023年第二季度,阿里云的收入同比增長了4%。財(cái)報(bào)顯示,阿里云本季度收入增長主要受到存儲(chǔ)、網(wǎng)絡(luò)和AI計(jì)算相關(guān)產(chǎn)品驅(qū)動(dòng),部分被CDN需求正?;窒龇?/p>
從客戶分布維度,收入增長主要受到金融服務(wù)、教育、電力和汽車行業(yè)驅(qū)動(dòng),部分被主動(dòng)縮減項(xiàng)目式收入的舉措所抵消。
AI熱潮帶來的算力和模型服務(wù)需求,正在推動(dòng)云計(jì)算巨頭重回增長,那么這種增長能否長期持續(xù)?
IDC統(tǒng)計(jì)了全球主要云計(jì)算廠商的收入拆分,阿里云、AWS的收入結(jié)構(gòu)基本接近, 均主要以IaaS業(yè)務(wù)為主,輔以一部分PaaS業(yè)務(wù),而微軟Azure的PaaS和SaaS的收入占比超過60%。
實(shí)際上,云計(jì)算產(chǎn)業(yè)鏈中,從底層的IaaS,到中間層的PaaS,再到上層的SaaS,越往上產(chǎn)品差異化越大,毛利率越高。
微軟Azure正是將自身的Windows、Office、SQL Server等軟件與云服務(wù)打通,獲得了更高的毛利率。
IDC在7月6日發(fā)布的《全球公共云服務(wù)半年度跟蹤報(bào)告》顯示:2022年全球公共云服務(wù)市場(chǎng)收入總計(jì)為5458億美元,其中,SaaS(軟件即服務(wù))是公共云服務(wù)收入的最主要來源,占2022年總收入的45%以上。
面對(duì)全球市場(chǎng)以及國內(nèi)市場(chǎng)激烈的IaaS競(jìng)爭(zhēng),阿里云發(fā)力PaaS和MaaS,微軟Aure是可以參考比較的對(duì)象。
作為OpenAI的投資方,微軟顯然更受益于生成式AI的發(fā)展。今年初,微軟宣布Azure OpenAI服務(wù)在全球Azure平臺(tái)發(fā)布,該服務(wù)旨在為開發(fā)人員提供對(duì)大型語言模型的便捷訪問,這些模型可以跨其他Azure產(chǎn)品無縫集成,以協(xié)助企業(yè)開發(fā)和部署對(duì)話式AI服務(wù)和解決方案。
此外,微軟在其全球合作伙伴大會(huì)上宣布了Microsoft 365 Copilot定價(jià)、推出Bing Chat Enterprise AI聊天機(jī)器人、和Meta聯(lián)合宣布將Llama 2開源大模型引入Azure云和Windows。
微軟2023年第四財(cái)季電話會(huì)議上,微軟首席財(cái)務(wù)官Amy Hood則表示,盡管目前對(duì)Azure AI服務(wù)的需求強(qiáng)勁,但目前AI服務(wù)對(duì)Azure的收入貢獻(xiàn)僅有約1個(gè)百分點(diǎn),隨著微軟加速投資云基礎(chǔ)設(shè)施,AI對(duì)微軟收入帶來的影響將集中在2024財(cái)年的下半年。
張勇在財(cái)報(bào)會(huì)議上也說:“人工智能AI革命是一個(gè)增量機(jī)會(huì),各行各業(yè),所有公司他們都會(huì)希望利用人工智能來提升他們的服務(wù)。
但是這個(gè)是離不開要利用大量高性能的算力,不僅是用于現(xiàn)階段模型的訓(xùn)練,還要用于支撐以后他們提供各種的服務(wù)。因此我們認(rèn)為這是非常重要的、長期的一個(gè)帶動(dòng)增長的引擎?!?/p>
企業(yè)數(shù)字化、產(chǎn)業(yè)智能化是一條漫長的路,但云計(jì)算大廠們則通過不斷的技術(shù)革新、開放賦能,正助力更多企業(yè)大步快跑進(jìn)產(chǎn)業(yè)智能化的升級(jí)浪潮中,大大縮短了這一升級(jí)路徑所需時(shí)間。
在人工智能技術(shù)融入萬物,技術(shù)、需求與產(chǎn)業(yè)進(jìn)化永不停歇、奔涌向前的現(xiàn)實(shí)下,未來的技術(shù)框架又會(huì)進(jìn)步到何種程度,讓我們拭目以待。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美國無人機(jī)禁令升級(jí)?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來賭上了AIGC
- 明星熱劇、品牌種草、平臺(tái)資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機(jī)看它就夠了!
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 16個(gè)月沒工資不敢離職,這些打工人“自費(fèi)上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問界M9,中國豪華車的龍門一躍
- 科技云報(bào)道:人工智能時(shí)代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。