谷歌宣布其人工智能平臺的一個關(guān)鍵組成部分——人工智能預(yù)測服務(wù)已正式全面啟動。該服務(wù)支持托管在主流的機器學(xué)習(xí)框架,包括TensorFlow、XGBoost和Scikit-Learn中。
AI Prediction服務(wù)充當(dāng)機器學(xué)習(xí)管道的最后階段。它在云中托管經(jīng)過訓(xùn)練的機器學(xué)習(xí)模型,以推斷新數(shù)據(jù)的目標(biāo)值。部署在AI預(yù)測服務(wù)中的經(jīng)過訓(xùn)練的模型作為REST端點公開,可以從任何支持HTTP的標(biāo)準(zhǔn)客戶端調(diào)用這些端點。
AI平臺預(yù)測服務(wù)基于Google Kubernetes Engine(GKE)后端,旨在通過新的硬件選項(如Google計算引擎機器類型和NVIDIA GPU)提高可靠性和靈活性。
雖然該服務(wù)基于googlekubernetes引擎,但AI預(yù)測服務(wù)隱藏了集群的供應(yīng)、管理和擴展的復(fù)雜性。數(shù)據(jù)科學(xué)家和工程師可以專注于業(yè)務(wù)問題,而不是管理基礎(chǔ)設(shè)施。
在一般可用性下,AI預(yù)測服務(wù)支持高內(nèi)存和高cpu機器類型上的XGBoost和Scikit學(xué)習(xí)模型。在后臺,服務(wù)根據(jù)流量和請求自動擴展和收縮基礎(chǔ)設(shè)施。
該服務(wù)與Google云控制臺和Stackdriver緊密集成,以跟蹤和可視化資源指標(biāo)。與模型的GPU、CPU、RAM和網(wǎng)絡(luò)利用率相關(guān)的性能指標(biāo)可以深入了解性能特征。
客戶可以選擇通過AI Prediction服務(wù)在特定區(qū)域部署機器學(xué)習(xí)模型。Google在三個區(qū)域(us-central1、euro-west4和asia-east1)中引入了新的端點,并通過區(qū)域隔離來提高可靠性。部署在區(qū)域端點上的模型位于指定區(qū)域內(nèi),為客戶提供數(shù)據(jù)局部性和所有權(quán)。
通過增加對VPC控件的支持,客戶可以定義安全范圍并部署僅可訪問該范圍內(nèi)或另一個橋接范圍內(nèi)的資源和服務(wù)的在線預(yù)測模型。由于預(yù)測服務(wù)端點是VPC專用的,因此數(shù)據(jù)保留在專用網(wǎng)絡(luò)內(nèi),而不必遍歷公共互聯(lián)網(wǎng)。
通過AI Prediction服務(wù)部署和公開的模型支持在線和批處理推理。在線預(yù)測經(jīng)過優(yōu)化,可最大程度地減少服務(wù)預(yù)測的延遲,而批處理預(yù)測,則可以優(yōu)化處理作業(yè)中的大量實例。與立即發(fā)送結(jié)果的在線預(yù)測不同,批處理預(yù)測將推理輸出寫入存儲在Google Cloud Storage存儲桶中的文件中。
谷歌一直在大力投資人工智能平臺即服務(wù)(PaaS)產(chǎn)品。它整合和擴充了包括cloudml引擎在內(nèi)的各種服務(wù)。通過與GKE和Kubeflow的緊密集成,該服務(wù)已經(jīng)發(fā)展成為一個支持?jǐn)?shù)據(jù)準(zhǔn)備、轉(zhuǎn)換、培訓(xùn)、模型管理、部署和推理的端到端平臺。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )