原來(lái) 亞馬遜云科技的GenAI科技樹(shù)是這么點(diǎn)的

12月15日消息,自去年末ChatGPT橫空出世后,這一年來(lái),全球各大科技公司都在加快旗下GenAI技術(shù)研發(fā)和應(yīng)用能力。

微軟聯(lián)合OpenAI的能力推出各種copilot服務(wù),谷歌就在上周推出了號(hào)稱(chēng)“迄今為止最強(qiáng)大、最通用的多模態(tài)模型”Gemini;亞馬遜一方面斥資40億美元投資了Anthropic,另一方面在剛剛過(guò)去的亞馬遜云科技re:Invent上一共發(fā)布了200多項(xiàng)新服務(wù)和功能、超過(guò)350項(xiàng)持續(xù)的更新,其中就包括不少GenAI相關(guān)的服務(wù)。

通過(guò)2023亞馬遜云科技re:Invent,可以明顯看出亞馬遜的GenAI科技樹(shù)發(fā)展脈絡(luò)已經(jīng)非常明晰。

三層架構(gòu)為基

如亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建所說(shuō),在理解亞馬遜云科技的GenAI技術(shù)發(fā)展時(shí),要先了解到亞馬遜云科技GenAI技術(shù)所要服務(wù)的目標(biāo)對(duì)象,這一首要目標(biāo)群體就是亞馬遜云科技現(xiàn)有的數(shù)百萬(wàn)客戶(hù)。亞馬遜云科技的GenAI服務(wù)和功能期望能幫助客戶(hù)更好的應(yīng)用GenAI能力。

因此,亞馬遜云科技將端到端應(yīng)用生成式AI做了三層架構(gòu)的規(guī)劃,由下至上在底層提供用于訓(xùn)練基礎(chǔ)模型和在生產(chǎn)中運(yùn)行這些模型的基礎(chǔ)設(shè)施;中間層提供調(diào)用和訪問(wèn)基礎(chǔ)模型的最便捷的工具,讓沒(méi)有AI經(jīng)驗(yàn)的構(gòu)建者,直接獲得應(yīng)用生成式人工智能所需的所有工具,來(lái)構(gòu)建自己的應(yīng)用;頂層是利用基礎(chǔ)模型構(gòu)建的開(kāi)箱即用的應(yīng)用程序,讓沒(méi)有技術(shù)基礎(chǔ)的業(yè)務(wù)用戶(hù),也能在具體場(chǎng)景中直接使用生成式AI。

底層 從芯片層的優(yōu)化開(kāi)始

在底層,亞馬遜云科技提供用于基礎(chǔ)模型訓(xùn)練和推理的基礎(chǔ)設(shè)施。其中,就包括芯片層面的創(chuàng)新。

一方面,2023亞馬遜云科技re:Invent,新發(fā)布自研Amazon Trainium2處理器,用于生成式 AI 和機(jī)器學(xué)習(xí)訓(xùn)練的專(zhuān)用芯片,針對(duì)訓(xùn)練具有數(shù)千億至數(shù)萬(wàn)億參數(shù)的基礎(chǔ)模型進(jìn)行優(yōu)化,相較 Amazon Trainium 4 倍性能提升,65 exaflops的按需超級(jí)計(jì)算性能。

另一方面,亞馬遜云科技和英偉達(dá)共同宣布了幾項(xiàng)最新合作,亞馬遜云科技將提供首款搭載NVIDIA Grace Hopper超級(jí)芯片和亞馬遜云科技UltraClusters技術(shù)的云AI超級(jí)計(jì)算機(jī);亞馬遜云科技將提供首款搭載NVIDIA Grace Hopper超級(jí)芯片和亞馬遜云科技UltraClusters技術(shù)的云AI超級(jí)計(jì)算機(jī)

中間層 三個(gè)遞進(jìn)層面的工具服務(wù)更新

在中間工具層,亞馬遜云科技提供調(diào)用大語(yǔ)言模型和基礎(chǔ)模型進(jìn)行構(gòu)建的工具。這些工具又分為3個(gè)層面,一是可供選擇的大模型、二是可以用來(lái)定制模型的工具、三是模型集成工具。

亞馬遜云科技于今年4月發(fā)布的Amazon Bedrock是一項(xiàng)全面托管的服務(wù),通過(guò)它,企業(yè)用戶(hù)可以通過(guò)API等方式輕松訪問(wèn)包括亞馬遜云科技自研的Titan(Amazon Titan)系列模型和AI21 Labs、Anthropic、Cohere、Meta、Stability AI等眾多主流第三方大模型。

在2023亞馬遜云科技re:Invent,Amazon Bedrock進(jìn)一步拓展了可被調(diào)用的模型類(lèi)型,包括新增支持Anthropic Claude 2.1和Meta LLama 2 70B兩款業(yè)內(nèi)領(lǐng)先大模型;同時(shí),亞馬遜云科技自有的Titan模型推出了,Amazon Titan Text Embeddings模型,能將文本轉(zhuǎn)換為向量;Amazon Titan Text Lite 一種更小巧、更具成本效益的模型,支持聊天機(jī)器人問(wèn)答或文本摘要等用例;Amazon Titan Text Express 模型參數(shù)量更大,可用于更廣泛的任務(wù),如開(kāi)放式文本生成和對(duì)話(huà)聊天;Amazon Titan Multimodal Embeddings多模態(tài)嵌入模型,能夠創(chuàng)建更豐富的多模態(tài)搜索和推薦體驗(yàn);Amazon Titan Image Generator圖像生成模型預(yù)覽版,現(xiàn)已推出預(yù)覽版,使客戶(hù)能夠使用自然語(yǔ)言提示生成高質(zhì)量、逼真的圖像或增強(qiáng)現(xiàn)有圖像。

亞馬遜云科技認(rèn)為,企業(yè)創(chuàng)造真正價(jià)值的生成式人工智能應(yīng)用程序的關(guān)鍵就是能夠用企業(yè)自己的書(shū)據(jù)進(jìn)行定制,用數(shù)據(jù)進(jìn)行定制才能構(gòu)建企業(yè)的差異化壁壘。

因而,在提供更多模型選擇的基礎(chǔ)上,亞馬遜云科技又提供了模型定制服務(wù)工具。

2023亞馬遜云科技re:Invent上,新發(fā)布了Amazon Bedrock持續(xù)預(yù)訓(xùn)練功能,支持對(duì) Amazon Titan Text Lite 與 Express持續(xù)預(yù)訓(xùn)練。據(jù)介紹,持續(xù)預(yù)訓(xùn)練是在Amazon Bedrock 中一種自定義模型的方法是。這是一種使用大量未標(biāo)記數(shù)據(jù)(如內(nèi)部報(bào)告、財(cái)務(wù)計(jì)劃或研究成果的原始文本)來(lái)提高基礎(chǔ)模型對(duì)特定領(lǐng)域的知識(shí)和推理能力的技術(shù),這種方式是適合想要擁有“領(lǐng)域大模型”,或者說(shuō)將領(lǐng)域知識(shí)以及技能嵌入大模型能力的場(chǎng)景。

一同新發(fā)布的還有Amazon Bedrock微調(diào)功能,微調(diào)是另外一項(xiàng)重要模型定制技術(shù),經(jīng)常被用來(lái)控制模型去理解特定的輸入格式(比如固定問(wèn)問(wèn)題的問(wèn)法),輸出以及理解回答問(wèn)題的角色。然后,Amazon Bedrock 會(huì)復(fù)制一個(gè)客戶(hù)專(zhuān)屬的基礎(chǔ)模型,并結(jié)合客戶(hù)準(zhǔn)備的S3上的數(shù)據(jù),進(jìn)行微調(diào),并生成一個(gè)新的定制模型。目前,Amazon Bedrock微調(diào)功能支持的模型包括Cohere Command、Meta Llama 2和Amazon Titan,并將很快支持Anthropic Claude 2。

還新發(fā)布Amazon Bedrock具有知識(shí)庫(kù)的檢索增強(qiáng)生成功能。RAG檢索增強(qiáng)可能是現(xiàn)在最常見(jiàn)的用企業(yè)數(shù)據(jù)定制的方式。知識(shí)庫(kù)功能可將模型安全地連接到公司內(nèi)部數(shù)據(jù)源,并通過(guò)RAG檢索增強(qiáng)生成的方式為聊天機(jī)器人或問(wèn)答系統(tǒng)等應(yīng)用提供更準(zhǔn)確的回答。

有了模型和定制能力,還需要和應(yīng)用集成才能服務(wù)于業(yè)務(wù)。

2023亞馬遜云科技re:Invent上,亞馬遜云科技還新發(fā)布了模型集成服務(wù)Amazon Bedrock 代理功能。它可以使生成式AI應(yīng)用跨公司系統(tǒng)和數(shù)據(jù)源執(zhí)行多步驟任務(wù)。通過(guò)代理功能,客戶(hù)在進(jìn)行訪問(wèn)權(quán)限等簡(jiǎn)單設(shè)置后即可用自然語(yǔ)言編寫(xiě)要求,隨后代理即可自動(dòng)分析請(qǐng)求并將其分解為邏輯序列,以及采取相應(yīng)的行動(dòng)。

頂層應(yīng)用層 生成式AI助手Amazon Q+初成規(guī)模

在亞馬遜云科技端到端應(yīng)用生成式AI的最上層,就是應(yīng)用層為客戶(hù)直接提供利用基礎(chǔ)模型構(gòu)建的應(yīng)用程序。

2023亞馬遜云科技re:Invent上,亞馬遜云科技發(fā)布生成式AI服務(wù)Amazon Q。

Amazon Q是亞馬遜云科技的專(zhuān)家,由亞馬遜云科技17年來(lái)積累的知識(shí)和經(jīng)驗(yàn)訓(xùn)練而成,可以在多種界面回答客戶(hù)提出的各種亞馬遜云科技相關(guān)的專(zhuān)業(yè)問(wèn)題。Amazon Q可以在Amazon CodeWhisperer中回答開(kāi)發(fā)人員的各種代碼相關(guān)的問(wèn)題并附上可一鍵實(shí)施的代碼,并提供代碼轉(zhuǎn)換功能可以將應(yīng)用維護(hù)和升級(jí)時(shí)的代碼轉(zhuǎn)換所需時(shí)間從幾天縮短至幾分鐘。

Amazon Q也是企業(yè)業(yè)務(wù)的專(zhuān)家,它擁有40多個(gè)兼容流行數(shù)據(jù)源的內(nèi)置連接器,并支持自定義連接器,企業(yè)可以輕松將其連接至其業(yè)務(wù)數(shù)據(jù)和系統(tǒng)中。Amazon Q可使用身份驗(yàn)證系統(tǒng)來(lái)確認(rèn)用戶(hù)職能和訪問(wèn)權(quán)限,并支持指定話(huà)題屏蔽或關(guān)鍵詞過(guò)濾等管理控制功能。

Amazon Q也是商業(yè)智能專(zhuān)家,Amazon Q支持將其引入多種服務(wù)和應(yīng)用中以提供基于生成式AI的幫助。 將Amazon Q引入BI應(yīng)用Amazon QuickSight中,它能夠在幾秒鐘內(nèi)響應(yīng)用戶(hù)要求,創(chuàng)建精準(zhǔn)且美觀的月度業(yè)務(wù)變化的相關(guān)描述。

Amazon Q也是聯(lián)絡(luò)中心專(zhuān)家。將Amazon Q引入云聯(lián)絡(luò)中心應(yīng)用Amazon Connect中,它能夠根據(jù)實(shí)時(shí)對(duì)話(huà)檢測(cè)客戶(hù)問(wèn)題,并能夠自動(dòng)回復(fù)、給出建議以及提供相關(guān)資料。

從Amazon Q的能力來(lái)看,亞馬遜云科技將自身本來(lái)就有的服務(wù)和能力,加持生成式AI技術(shù)后通過(guò)Amazon Q來(lái)賦能給企業(yè)客戶(hù),這也就意味著未來(lái)Amazon Q或許有更多的能力,Amazon Q+各行各業(yè)能力的模式已經(jīng)初現(xiàn)。

至此,以三層架構(gòu)為骨架的亞馬遜GenAI科技樹(shù)發(fā)展優(yōu)化脈絡(luò)已然躍然紙上。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-12-15
原來(lái) 亞馬遜云科技的GenAI科技樹(shù)是這么點(diǎn)的
12月15日消息,自去年末ChatGPT橫空出世后,這一年來(lái),全球各大科技公司都在加快旗下GenAI技術(shù)研發(fā)和應(yīng)用能力。微軟聯(lián)合OpenAI的能力推出各種copilot服務(wù),谷歌就在上周推出了號(hào)稱(chēng)“迄今為止最強(qiáng)大、最通用的

長(zhǎng)按掃碼 閱讀全文