明略科技機器學習平臺的功能亮點與落地實踐

近日,由國內專業(yè)咨詢機構百林哲匠心打造的軟件行業(yè)技術領域頂級盛會——2020 CSDI Summit中國軟件研發(fā)管理行業(yè)技術峰會,成功舉辦。本屆大會,以“上云+轉型,探索未來:產(chǎn)業(yè)智能,部署技術新邊界”為主題,吸引了來自微軟、Google、阿里、華為等國內外知名科技企業(yè)的行業(yè)領袖和一線研發(fā)技術專家,共同探討大數(shù)據(jù)和AI技術浪潮下的軟件研發(fā)趨勢,明略科技高級總監(jiān)劉喆受邀分享機器學習平臺的建設與落地實踐。

據(jù)悉,明略科技的機器學習平臺,基于內部數(shù)據(jù)科學家的需求而孵化,經(jīng)過小版本不斷迭代升級,逐漸完善整個平臺的搭建,最終實現(xiàn)不同部門的數(shù)據(jù)科學家用統(tǒng)一的平臺進行模型的開發(fā)、發(fā)布、使用和分享。同時,成功整合了內部的計算、存儲資源,互通共享。目前,明略科技機器學習平臺正服務于金融、汽車、美妝、快消等多個領域的標桿性客戶。

從內部客戶到外部客戶,離不開對用戶的需求洞察。劉喆指出,數(shù)據(jù)科學家和模型使用者,對機器學習平臺訴求不同。就數(shù)據(jù)科學家而言,專注做算法產(chǎn)出模型是核心需求,開發(fā)環(huán)境準備以及數(shù)據(jù)接入、模型上線等工程化工作盡量平臺自動化完成。而模型使用者,需要的是模型量多,多版本易切換,模型評分和推薦機制,有API服務,性能高,訪問速度快。

基于此,明略科技的機器學習平臺,把寫代碼作為系統(tǒng)的核心,兼容notebook方式,增強了各種定制化的功能,支持R語言、Python、Spark,甚至Spark集群。預先準備了多種開發(fā)環(huán)境,包括Torch、TensorFlow,GPU、CPU、分布式、Spark,開箱即用。針對數(shù)據(jù)清洗,數(shù)據(jù)對齊和數(shù)據(jù)標準化工作,提供了多種工具??蓪崿F(xiàn)一鍵上線,生成SDK或者API形式。考慮到不同的行業(yè)存在不同的場景,平臺還能發(fā)布Docker image,Yaml文件,把整體開發(fā)環(huán)境打包使用。自動化方面,平臺專門提供調度系統(tǒng)HummingBird,可以每一步在notebook自己寫,也可以調用外部組件,進行組合。

此外,平臺提供模型生命周期的統(tǒng)一管理,確保模型服務的標準化,以及模型的穩(wěn)定、高效、高可用性。具體而言,通過Model Market,統(tǒng)一管理各個渠道的模型匯總。不同部門的每個模型有多個不同版本,會告訴用戶每個版本有哪些功能提升,并按標簽分類,依據(jù)模型調用次數(shù)進行排名,并且用戶和系統(tǒng)均可對模型進行評分。同時,通過自主研發(fā)的Model Serving,提供標準化模型服務,包括SDK、API形式。例如,一個100兆的模型,輸入100多個維度,時延不超過5毫秒,以此為基準線,實現(xiàn)多實力、高可用,無斷點。

在具體的實踐中,國內某大型銀行應用明略科技機器學習平臺進行用戶升等和信用卡的AI推薦。通過運用Notebook、Model Serving、統(tǒng)一存儲、模型訓練和特征分組等功能,甄別什么樣的用戶愿意升級成什么等級的卡別,判斷什么樣的用戶更有意向調整信用額度,不會逾期,以及給用戶每筆消費做短信提醒的貼尾推薦等,實現(xiàn)AI能力對業(yè)務的賦能和價值挖掘。

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )