2022愛分析 · DataOps廠商全景報告 | 愛分析報告

報告編委

李喆

愛分析合伙人&首席分析師

廖耘加

愛分析分析師

目錄

1.研究范圍定義

2. 市場洞察

3. 廠商全景地圖

4. 市場分析與廠商評估

5. 入選廠商列表1.研究范圍定義

研究范圍

在后疫情時代,以數(shù)據(jù)分析為代表的數(shù)據(jù)消費場景日益豐富,數(shù)據(jù)驅(qū)動業(yè)務增長成為市場共識,數(shù)據(jù)開發(fā)管理越來越受到企業(yè)決策者重視。

當前,各類管理信息系統(tǒng)、協(xié)同辦公系統(tǒng)的應用,物聯(lián)網(wǎng)和邊緣設備的普及,都讓企業(yè)端數(shù)據(jù)采集和分析的場景變得越來越多,數(shù)據(jù)驅(qū)動的場景從當前集中在前端的營銷、銷售環(huán)節(jié),正在向后端供應鏈的全場景延伸,從與消費互聯(lián)網(wǎng)緊密相關的零售電商向金融、教育、醫(yī)療、工業(yè)等全行業(yè)覆蓋,數(shù)據(jù)消費場景的豐富和分析需求的快速增長導致數(shù)據(jù)應用開發(fā)需求迅速增加。

金融、零售等行業(yè)頭部企業(yè)紛紛成立獨立的數(shù)據(jù)管理部門,在數(shù)據(jù)開發(fā)與管理方面的投入明顯增加。建設銀行、民生銀行、興業(yè)銀行等金融機構通過新建數(shù)據(jù)管理部門來實施大數(shù)據(jù)戰(zhàn)略,快速釋放數(shù)據(jù)生產(chǎn)力,實現(xiàn)數(shù)據(jù)資產(chǎn)的集中管理,聚集數(shù)據(jù)人才,深度挖掘與共享數(shù)據(jù)資源,從而利用數(shù)據(jù)驅(qū)動全方位支持業(yè)務發(fā)展。

盡管對數(shù)據(jù)的需求和投入不斷增大,但在實際管理和應用時企業(yè)仍面臨諸多挑戰(zhàn):

企業(yè)內(nèi)部數(shù)據(jù)管理的協(xié)作成本越來越高。一方面,數(shù)據(jù)分析工具多元化導致數(shù)據(jù)用戶角色更復雜,企業(yè)內(nèi)現(xiàn)在設置了如數(shù)據(jù)工程師、數(shù)據(jù)管理員、報表開發(fā)人員、運維工程師等多個職位,反而容易造成職責邊界交叉模糊,協(xié)作困難。另一方面,IT部門、數(shù)據(jù)部門和業(yè)務部門之間難以建立起緊密的融合關系,數(shù)據(jù)部門相對弱勢,難以推動業(yè)務部門主動用數(shù),整體數(shù)據(jù)應用效率較低。

單個環(huán)節(jié)的自動化無法解決全局問題。盡管企業(yè)在數(shù)據(jù)開發(fā)、數(shù)據(jù)治理等單個環(huán)節(jié)采購了相關的工具或平臺,實現(xiàn)了局部的自動化,然而僅僅能解決表面問題,無法真正解決全局需求。難以建立覆蓋所有業(yè)務的規(guī)范統(tǒng)一、集成互聯(lián)的數(shù)據(jù)基礎,從根本上消除數(shù)據(jù)孤島,實現(xiàn)企業(yè)級數(shù)據(jù)集成整合、全面共享應用,提升企業(yè)大數(shù)據(jù)能力。

數(shù)據(jù)應用開發(fā)需求增長與數(shù)據(jù)用戶角色的復雜致使企業(yè)數(shù)據(jù)開發(fā)、數(shù)據(jù)運維工作量以及數(shù)據(jù)應用交付協(xié)調(diào)難度大大增加。因此,企業(yè)需要一套全新解決方案,真正實現(xiàn)數(shù)據(jù)驅(qū)動業(yè)務增長。DataOps以其能服務于業(yè)務部門、大數(shù)據(jù)部門,提供敏態(tài)數(shù)據(jù)開發(fā)支持,優(yōu)化數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)消費者協(xié)作效率,成為解決以上問題的最佳方案。

在此背景下,為企業(yè)引入DataOps過程中提供全面的規(guī)劃、建設和產(chǎn)品選型參考,愛分析調(diào)研并撰寫了《2022年愛分析DataOps廠商全景報告》。

DataOps市場定義

圖 1:數(shù)據(jù)全生命周期

數(shù)據(jù)全生命周期包括三個階段:首先,由業(yè)務部門在業(yè)務運行過程中產(chǎn)生原始數(shù)據(jù);其次,大數(shù)據(jù)部門(IT部門)對原始數(shù)據(jù)進行數(shù)據(jù)加工;最后,加工后的數(shù)據(jù)再次回到業(yè)務部門完成數(shù)據(jù)消費。因此,在數(shù)據(jù)全生命周期中核心環(huán)節(jié)基本上由大數(shù)據(jù)部門(IT部門)完成。

大數(shù)據(jù)部門(IT部門)職責包括兩方面:1)數(shù)據(jù)資產(chǎn)統(tǒng)一管理;2)支持業(yè)務部門的敏穩(wěn)雙態(tài)數(shù)據(jù)消費需求。

DataOps核心是面向于大數(shù)據(jù)部門的第二項職責,既滿足業(yè)務部門穩(wěn)態(tài)的數(shù)據(jù)消費需求,如數(shù)據(jù)報表、數(shù)據(jù)可視化、自助式分析等;也要滿足業(yè)務部門敏態(tài)的數(shù)據(jù)消費需求,如機器學習建模、智能推薦等,敏態(tài)需求迭代速度更快,其中涉及到很多探索式需求。

DataOps市場定義:服務于業(yè)務部門(業(yè)務部門ITBP)和大數(shù)據(jù)部門,滿足敏穩(wěn)雙態(tài)數(shù)據(jù)消費需求,提升數(shù)據(jù)加工環(huán)節(jié)效率的咨詢、工具和服務。

圖 2:DataOps市場全景地圖

基于數(shù)據(jù)全生命周期三大階段,進一步將數(shù)據(jù)加工環(huán)節(jié)拆分為數(shù)據(jù)采集(數(shù)據(jù)同步)、數(shù)據(jù)開發(fā)、數(shù)據(jù)服務(數(shù)據(jù)虛擬化)和數(shù)據(jù)質(zhì)量提升;將數(shù)據(jù)消費環(huán)節(jié)拆分為數(shù)據(jù)分析和數(shù)據(jù)應用。并根據(jù)每一階段存在的業(yè)務需求,映射出對應的細分市場。

本次報告,愛分析認為DataOps全景圖主要覆蓋數(shù)據(jù)加工環(huán)節(jié),具體來說,與數(shù)據(jù)采集、數(shù)據(jù)同步對應的是“敏捷數(shù)據(jù)管道”市場;與數(shù)據(jù)開發(fā)對應的是“一站式數(shù)據(jù)開發(fā)管理平臺”市場;與數(shù)據(jù)服務對應的是“數(shù)據(jù)服務平臺”市場、“智能數(shù)據(jù)資產(chǎn)目錄”市場和“指標中臺”市場;與數(shù)據(jù)質(zhì)量提升對應的是“數(shù)據(jù)可觀測性平臺”市場和“數(shù)據(jù)治理”市場。

愛分析認為,甲方企業(yè)真正要實現(xiàn)DataOps,必須具備完整的數(shù)據(jù)能力,建設一整套面向業(yè)務需求的數(shù)據(jù)開發(fā)管理機制,僅僅具備單點能力是遠遠不夠的。因此,上述對DataOps市場劃分,主要是考慮到市場發(fā)展現(xiàn)狀、甲方企業(yè)建設進展和廠商能力,并不意味著具備單點能力就可以實現(xiàn)DataOps。

愛分析綜合考慮市場關注度、甲方需求和實際落地進展等因素,選取以下3個特定市場進行重點分析,分別是“一站式數(shù)據(jù)開發(fā)管理平臺”、“敏捷數(shù)據(jù)管道”和“智能數(shù)據(jù)資產(chǎn)目錄”。

本報告面向金融、制造、汽車、消費品零售、能源等行業(yè)的大數(shù)據(jù)部門負責人、IT部門負責人和業(yè)務部門(業(yè)務部門ITBP),通過對各特定市場的需求定義和代表廠商能力解讀,為企業(yè)數(shù)字化轉(zhuǎn)型規(guī)劃與廠商選型提供參考。

廠商入選標準

本次入選報告的廠商需同時符合以下條件:

廠商的產(chǎn)品服務滿足各市場分析的廠商能力要求;

廠商具備一定數(shù)量以上的付費客戶(參考第4章各市場分析部分);

廠商在特定市場的營業(yè)收入達到指標要求(參考第4章各市場分析部分)。 2. 市場洞察

1.DataOps市場規(guī)模超180億元

愛分析推算,2022年中國DataOps市場規(guī)模為185.1億元人民幣,同比增速為13.0%??紤]到大部分DataOps項目甲方還是大型企業(yè),立項和交付受疫情影響很大,2022年增速較2021年明顯放緩,但預計2023年會40%以上的增速,市場進入快速發(fā)展階段。

圖 3:中國DataOps市場規(guī)模預測

DataOps市場由軟件產(chǎn)品和服務組成,現(xiàn)階段整個市場并未形成統(tǒng)一標準和規(guī)范,絕大多數(shù)DataOps項目都是基于甲方企業(yè)自身需求進行落地,因此,軟件產(chǎn)品占比30%左右,大量項目還是以服務為主。大部分DataOps項目是廠商提供核心產(chǎn)品組件,基于實際甲方需求,形成DataOps解決方案。

DataOps市場甲方以金融、制造、能源、消費品與零售等行業(yè)為主,主要是以集團型甲方企業(yè)和行業(yè)頭部甲方企業(yè)為主,但兩者對DataOps的需求略有不同。集團型甲方企業(yè)在實際開展數(shù)據(jù)管理工作時,已經(jīng)深刻意識到數(shù)據(jù)管理與數(shù)據(jù)服務的挑戰(zhàn),正在尋求新的數(shù)據(jù)管理解決方案。行業(yè)頭部甲方企業(yè)在數(shù)字化轉(zhuǎn)型、數(shù)據(jù)能力建設處于行業(yè)前列,數(shù)據(jù)部門自身有很強烈的創(chuàng)新和探索意愿,愿意嘗試更多新的技術方案。

2.DataOps是實現(xiàn)數(shù)據(jù)驅(qū)動業(yè)務的關鍵基礎設施

DataOps概念一經(jīng)出現(xiàn),就會不斷跟數(shù)據(jù)中臺進行比較。愛分析認為,數(shù)據(jù)中臺承載了企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型的長遠愿景,DataOps解決了數(shù)據(jù)驅(qū)動業(yè)務的實際問題。

2019年至今,數(shù)據(jù)中臺一直備受詬病,建設預期與實際結果之間的巨大落差是大量數(shù)據(jù)中臺項目失敗的重要原因之一。很多數(shù)據(jù)中臺項目需求來自企業(yè)決策者,并非技術部門或數(shù)據(jù)部門,數(shù)據(jù)中臺往往承載了企業(yè)決策者實現(xiàn)數(shù)字化轉(zhuǎn)型的美好預期,不過數(shù)字化轉(zhuǎn)型并非一蹴而就,企業(yè)在數(shù)字化轉(zhuǎn)型中遇到的挑戰(zhàn)也不可能完全依靠技術平臺來解決。

數(shù)據(jù)中臺建設雖然出現(xiàn)很多負面新聞,但持續(xù)數(shù)年的數(shù)據(jù)中臺建設對整個數(shù)據(jù)智能市場發(fā)展還是起到了重要推動作用。第一,數(shù)據(jù)中臺在實際企業(yè)業(yè)務開展中還是發(fā)揮了價值,數(shù)據(jù)驅(qū)動業(yè)務、數(shù)據(jù)驅(qū)動決策的理念深入人心,越來越多的企業(yè)決策者和業(yè)務人員重視數(shù)據(jù)的價值,將數(shù)據(jù)分析作為一項重要工具。第二, “數(shù)據(jù)統(tǒng)一管理與共享服務”等理念被大量企業(yè)的技術部門和數(shù)據(jù)部門所接受,越來越多的企業(yè)用這套理念來建設自身的數(shù)據(jù)開發(fā)與管理能力。

DataOps的需求多數(shù)來自于技術部門或數(shù)據(jù)部門負責人,解決的是企業(yè)開展數(shù)據(jù)開發(fā)管理工作的挑戰(zhàn)。當越來越多的業(yè)務部門關注數(shù)據(jù),基于數(shù)據(jù)分析來實現(xiàn)業(yè)務增長,對企業(yè)的技術部門或數(shù)據(jù)部門而言,最大的挑戰(zhàn)是如何基于有限資源,最大化地滿足多個業(yè)務部門的數(shù)據(jù)消費需求。

一味地增加人力和預算,并不能從根本上解決這一問題。以某頭部互聯(lián)網(wǎng)公司為例,其數(shù)據(jù)開發(fā)管理團隊一度增加到千人規(guī)模,但依然無法滿足各個業(yè)務部門提出的數(shù)據(jù)需求。技術部門的挑戰(zhàn)一定要通過新的數(shù)據(jù)開發(fā)管理服務標準、流程和協(xié)作機制來解決,才能滿足企業(yè)日益增長的數(shù)據(jù)消費需求。

愛分析認為,實現(xiàn)數(shù)據(jù)驅(qū)動業(yè)務在技術架構創(chuàng)新的同時,還需要關注數(shù)據(jù)與業(yè)務之間的協(xié)作機制、流程和標準創(chuàng)新,后者是實現(xiàn)數(shù)據(jù)驅(qū)動業(yè)務的關鍵,DataOps重點在解決這一問題。

3.DataOps考驗廠商的產(chǎn)品架構能力

與數(shù)據(jù)湖倉引擎、實時計算引擎不同,DataOps并非技術架構創(chuàng)新,而是產(chǎn)品架構創(chuàng)新。性能是DataOps項目建設的重要指標,但并非最核心指標。大部分DataOps建設面臨的問題是,如何實現(xiàn)技術、數(shù)據(jù)和業(yè)務的融合,同時滿足三方的需求。

第一,應用開發(fā)與數(shù)據(jù)開發(fā)融合。當前大部分企業(yè)的應用開發(fā)與數(shù)據(jù)開發(fā)還是分開,但越來越多應用都是數(shù)字化應用,基于數(shù)據(jù)驅(qū)動的應用,數(shù)據(jù)開發(fā)與應用開發(fā)呈現(xiàn)融合態(tài)勢,如何在滿足IT運維、安全等前提下,提升數(shù)據(jù)開發(fā)的效率是一大挑戰(zhàn),特別是集團型企業(yè)多數(shù)都有很強的合規(guī)要求。

第二,業(yè)務深度參與數(shù)據(jù)開發(fā)工作。當前業(yè)務和數(shù)據(jù)之間的協(xié)作并不緊密,自助式分析等數(shù)據(jù)分析工具興起,讓業(yè)務部門具備自助式數(shù)據(jù)分析和管理的能力,但大部分數(shù)據(jù)開發(fā)工作業(yè)務部門依然沒辦法深度參與,會導致很多數(shù)據(jù)開發(fā)工作并不能滿足業(yè)務需求,特別是在當下業(yè)務快速迭代的背景下。

基于上述挑戰(zhàn)可以看出,每個甲方企業(yè)在落地DataOps項目時,一定存在非常大的差異化,但背后要解決的本質(zhì)問題會非常類似。對于DataOps廠商而言,需要從數(shù)據(jù)開發(fā)管理的全局出發(fā),以終為始,在設計產(chǎn)品架構時要考慮到企業(yè)完整需求,才能夠應對不同DataOps項目的差異化甲方需求。 3. 廠商全景地圖

愛分析基于對甲方企業(yè)和典型廠商的調(diào)研以及桌面研究,遴選出在DataOps市場中具備成熟解決方案和落地能力的入選廠商。

       4. 市場分析與廠商評估

愛分析對本次DataOps項目重點研究的特定市場定義如下。同時,針對參與此次報告的部分代表廠商,愛分析撰寫了廠商能力評估。 4.1一站式數(shù)據(jù)開發(fā)管理平臺

市場定義:

一站式數(shù)據(jù)開發(fā)管理平臺,是指針對整個數(shù)據(jù)加工鏈路進行數(shù)據(jù)的監(jiān)控、管理和運維,實現(xiàn)數(shù)據(jù)質(zhì)量持續(xù)提升。

甲方終端用戶:

金融、制造、汽車、消費品零售、能源等行業(yè)的大數(shù)據(jù)部門負責人、IT部門負責人

甲方核心需求:

對甲方而言,核心是建立一套面向未來數(shù)據(jù)開發(fā)的機制,提升面向業(yè)務視角的數(shù)據(jù)開發(fā)能力,而不僅僅是實現(xiàn)數(shù)據(jù)整合。

過往,甲方更多是將數(shù)據(jù)整合和管理作為企業(yè)的階段性目標和項目來完成,對數(shù)據(jù)如何應用、如何在業(yè)務場景中發(fā)揮價值關注度不足。在實踐過程中,投入大量資源和人力,完成數(shù)據(jù)整合之后,“取數(shù)難”、“用數(shù)難”、數(shù)據(jù)質(zhì)量低等問題依然存在,甲方還是無法發(fā)揮數(shù)據(jù)的價值。

因此,甲方真正需要具備的是一套完整的數(shù)據(jù)開發(fā)管理的能力,包含但不限于統(tǒng)一開發(fā)管理平臺、面向業(yè)務需求的開發(fā)管理流程與機制等。

1)梳理流程,建立統(tǒng)一的開發(fā)管理機制。

在甲方現(xiàn)有流程中,應用開發(fā)和數(shù)據(jù)開發(fā)往往是分開進行,但考慮到越來越多數(shù)字化應用是基于數(shù)據(jù)驅(qū)動這一趨勢下,企業(yè)需要考慮將二者融合。過去建設的數(shù)據(jù)中臺盡管一定程度上能夠支持報表、自助式分析等應用,但實質(zhì)上仍未能滿足支撐整個數(shù)據(jù)開發(fā)管理體系,無法滿足越來越多基于數(shù)據(jù)驅(qū)動的應用需求,特別是以機器學習建模為代表的探索式應用。

隨著企業(yè)數(shù)字化轉(zhuǎn)型程度加深,數(shù)據(jù)管理和應用需求越來越迫切,很多甲方成立專門的數(shù)據(jù)部門處理數(shù)據(jù)相關的問題,并與IT部門和業(yè)務部門厘清職責邊界,建立起協(xié)作關系,數(shù)據(jù)部門與IT部門、業(yè)務部門如何進行協(xié)作,內(nèi)部需要達成共識并建立協(xié)作機制。

數(shù)據(jù)開發(fā)和管理的建設并非一蹴而就,而是一個長期的工程。在實際建設中,既要考慮長期方向與目標,與整個公司戰(zhàn)略方向相適配,又要設置階段性目標,讓高層和相關部門感受到落地效果。因此,甲方需要明確數(shù)據(jù)開發(fā)和管理的實現(xiàn)路徑,并設置階段性目標。

對于金融等強監(jiān)管行業(yè),整個機制還需要符合監(jiān)管要求。自數(shù)據(jù)安全法、個保法等法律法規(guī)出臺以來,監(jiān)管機構對數(shù)據(jù)安全審查加強,企業(yè)在數(shù)據(jù)開發(fā)和管理過程中要注意合規(guī)問題,審慎使用數(shù)據(jù),提升數(shù)據(jù)治理水平。

2)搭建功能豐富、具備擴展性的開發(fā)管理平臺。

經(jīng)過多年信息化和數(shù)字化建設,絕大多數(shù)甲方已經(jīng)具備一定數(shù)據(jù)基礎,以MPP、Hadoop為代表的技術架構,以大數(shù)據(jù)平臺為核心的數(shù)據(jù)開發(fā)和治理工具,因此,一站式數(shù)據(jù)開發(fā)管理平臺需要兼容現(xiàn)有的數(shù)據(jù)基礎設施。同時,隨著業(yè)務的發(fā)展,未來產(chǎn)生越來越多的創(chuàng)新業(yè)務場景,平臺需要有充分的擴展性以應對多元的需求,能夠支持各類型業(yè)務場景開展。

平臺需要圍繞整個數(shù)據(jù)開發(fā)管理的需求,提供豐富的功能,并具備自動化開發(fā)能力。企業(yè)需要在這一平臺上完成所有類型數(shù)據(jù)的開發(fā)和管理,覆蓋數(shù)據(jù)加工全鏈路的監(jiān)控、管理、運維等需求,具備對全域數(shù)據(jù)治理的能力。同時,為應對越來越多且時效性越來越強的開發(fā)任務,還需要利用自動化工具提升效率。

廠商能力要求:

廠商需要具備咨詢能力和成功實踐經(jīng)驗,能提供成熟的方法論。不僅提供數(shù)據(jù)平臺的產(chǎn)品,還能夠基于可復用的成功經(jīng)驗,針對客戶的業(yè)務需求和內(nèi)部建設現(xiàn)狀指導實施落地;需要具備規(guī)劃能力,能夠設計一套適用于未來幾年的框架,幫助數(shù)據(jù)部門、IT部門、業(yè)務部門能夠達成共識,通過幫助客戶梳理流程,基于數(shù)據(jù)產(chǎn)品調(diào)整組織架構并優(yōu)化協(xié)作方式,提供完整的咨詢服務;此外,還需要為客戶提供建議,幫助甲方設置實現(xiàn)路徑,并制定階段性目標。

產(chǎn)品需要有較強的架構能力和可擴展性。需要具備解耦能力,采用模塊化方式構建,能夠單獨拆分功能模塊按需提供。在擴展性方面,需要能夠適配企業(yè)內(nèi)的其他生態(tài),支持多種接口協(xié)議,已封測及對接多種軟件或硬件接口調(diào)用等方式,能夠快速滿足企業(yè)未來的創(chuàng)新應用。

產(chǎn)品需要具備豐富的功能,能夠覆蓋數(shù)據(jù)加工的全流程,包括數(shù)據(jù)開發(fā)、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)和運維監(jiān)控等各個方面,能夠提供多人可協(xié)作的項目空間管理,具備持續(xù)集成和發(fā)布的能力。

入選標準:

1.符合一站式數(shù)據(jù)開發(fā)管理平臺市場分析的廠商能力要求;

2.累計在該市場服務客戶數(shù)10家及以上;

3.累計在該市場收入5000萬及以上;

代表廠商評估:

       火山引擎

廠商介紹:

北京火山引擎科技有限公司(以下簡稱“火山引擎”),是字節(jié)跳動旗下的云服務平臺,將字節(jié)跳動快速發(fā)展過程中積累的增長方法、技術能力和工具開放給外部企業(yè),提供云基礎、視頻與內(nèi)容分發(fā)、大數(shù)據(jù)、人工智能、開發(fā)與運維等服務,幫助企業(yè)在數(shù)字化升級中實現(xiàn)持續(xù)增長。

產(chǎn)品服務介紹:

火山引擎數(shù)智平臺(Volcengine Data Intelligence,英文簡稱VeDI),基于字節(jié)跳動數(shù)據(jù)平臺多年的“數(shù)據(jù)驅(qū)動”實踐經(jīng)驗,匯集端到端的數(shù)智產(chǎn)品、場景化的行業(yè)解決方案和專業(yè)的數(shù)智轉(zhuǎn)型咨詢。其中大數(shù)據(jù)研發(fā)治理套件DataLeap是一站式大數(shù)據(jù)研發(fā)治理套件解決方案,提供數(shù)據(jù)集成、開發(fā)、運維、治理、資產(chǎn)管理等能力。以獨立部署方式,通過數(shù)據(jù)治理的思維,綜合運用數(shù)據(jù)管理制度、人員組織、技術方法和流程標準等手段,幫助企業(yè)對數(shù)據(jù)資產(chǎn)在可用性、完整性和安全上實現(xiàn)全面有效的管理,賦能企業(yè)基于數(shù)據(jù)驅(qū)動下的業(yè)務創(chuàng)新。目前,已服務幾百家來自汽車、零售、互聯(lián)網(wǎng)、金融、文旅等行業(yè)的知名企業(yè)。

廠商評估:

整體來看,火山引擎基于數(shù)智平臺和一站式大數(shù)據(jù)研發(fā)治理套件打造的數(shù)據(jù)驅(qū)動管理解決方案,在產(chǎn)品功能、產(chǎn)品架構與理念、落地實踐經(jīng)驗、體系機制四方面具備優(yōu)勢。

1)功能豐富易用,提供一站式數(shù)據(jù)研發(fā)全鏈路管理。

DataLeap為企業(yè)提供基于DataOps敏捷研發(fā)流程、海量任務秒級調(diào)度能力和開源計算引擎的拓展能力,覆蓋數(shù)據(jù)研發(fā)與運維、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)和安全合規(guī)等各個方面,賦能業(yè)務團隊進行數(shù)據(jù)自治。

具體來說,在全場景數(shù)據(jù)整合環(huán)節(jié),DataLeap支持20+多源異構數(shù)據(jù)集成,涵蓋常見的業(yè)務存儲系統(tǒng),支持全量、增量、實時的數(shù)據(jù)同步;在全鏈路的數(shù)據(jù)研發(fā)環(huán)節(jié),DataLeap支持多引擎(批、流、OLAP),敏捷開發(fā)CI/C,對開發(fā)、測試、發(fā)布、運維等研發(fā)全鏈路進行管理;在數(shù)據(jù)治理環(huán)節(jié),DataLeap集合了基線監(jiān)控、數(shù)據(jù)質(zhì)量、SLA治理等能力,提供事前預警、事中處理、事后復盤及推薦優(yōu)化的功能;在數(shù)據(jù)資產(chǎn)建設方面,DataLeap具備數(shù)據(jù)資產(chǎn)快速接入及自動構建全鏈路血緣等技術。

2)技術架構先進,融合分布式數(shù)據(jù)治理理念,能夠應對高并發(fā)、大批量數(shù)據(jù)處理需求。

火山引擎創(chuàng)新性提出分布式數(shù)據(jù)治理的理念,并落地于DataLeap產(chǎn)品中。DataLeap采用了標準化、組件化的解耦架構,各個模塊均可獨立使用分布式治理模式,建設周期較短,適配能力強;企業(yè)用戶不僅能實現(xiàn)各級業(yè)務及個人的自驅(qū)治理,還能充分根據(jù)業(yè)務階段來制定治理的內(nèi)容,讓數(shù)據(jù)治理對業(yè)務的沖擊和影響可以盡可能最小化;專業(yè)的治理知識可以沉淀下來,實現(xiàn)產(chǎn)品化協(xié)同,并結合智能化推薦功能,為企業(yè)提升執(zhí)行效率。

DataLeap通過對引擎和架構的優(yōu)化,提升了產(chǎn)品性能、擴展性和實時性,以應對業(yè)務多樣性和復雜度帶來的龐大數(shù)據(jù)處理作業(yè)量要求。為滿足時效性的需求,火山引擎通過自研的分布式調(diào)度系統(tǒng),實現(xiàn)了秒級調(diào)度能力。同時提供了任務的分級打標機制,通過多種任務資源控制方式,實現(xiàn)資源最合理的調(diào)配。還可以根據(jù)任務的歷史情況,對不合理的任務配置,提出配置優(yōu)化的告警建議。

3)數(shù)據(jù)技術能力均來自于字節(jié)跳動內(nèi)部多年實踐經(jīng)驗的積累與沉淀。

VeDI及DataLeap沉淀了字節(jié)跳動各業(yè)務線的數(shù)據(jù)治理經(jīng)驗和規(guī)則,適合多種類型客戶在業(yè)務的不同階段使用。

字節(jié)跳動根據(jù)內(nèi)部業(yè)務的痛點和需求,從2014年開始研發(fā)并逐步迭代出一套能夠挖掘分析海量數(shù)據(jù)、有效賦能業(yè)務的數(shù)據(jù)平臺。利用這一平臺敏捷支持內(nèi)部今日頭條、抖音、西瓜視頻、朝夕光年等各大業(yè)務線后,對大數(shù)據(jù)的架構、產(chǎn)品、治理、安全隱私、組織設計等方面積累了豐富實踐,開始對外To B輸出和商業(yè)化。目前,火山引擎已經(jīng)沉淀了完整的行業(yè)Know-How,能夠基于各部分產(chǎn)品組合和調(diào)用為客戶提供端到端解決方案,并以整體VeDI的方式呈現(xiàn)。

4)引入BP機制,幫助客戶建立體系化的數(shù)據(jù)治理方法。

火山引擎為客戶引入字節(jié)成熟的數(shù)據(jù)BP模式,從組織層面配合數(shù)據(jù)產(chǎn)品實現(xiàn)數(shù)據(jù)治理落地,切實把握業(yè)務的痛點,讓數(shù)據(jù)工具和平臺真正用起來。

數(shù)據(jù)BP,即“數(shù)據(jù)業(yè)務伙伴”,本質(zhì)是將具備數(shù)據(jù)專業(yè)能力的人才上升至業(yè)務線。數(shù)據(jù)BP的職責是在一線配合數(shù)據(jù)分析師充分滿足數(shù)據(jù)需求,同時保障數(shù)據(jù)治理工作的有序落地。希望在數(shù)據(jù)治理成果推進到一定程度之后,為企業(yè)進一步探索數(shù)據(jù)賦能業(yè)務發(fā)展的方法。

火山引擎還會派專家團隊駐場,近距離參與企業(yè)的數(shù)據(jù)治理工作中。對企業(yè)的實際情況進行具體問題分析后,在數(shù)據(jù)指標治理、業(yè)務數(shù)據(jù)治理、埋點數(shù)據(jù)治理、數(shù)據(jù)底座管理體系四大方向上,給出建議并協(xié)助企業(yè)進行體系化建設,為企業(yè)跨職能的數(shù)據(jù)治理實踐提供長期穩(wěn)定抓手。

典型客戶:

得到

代表廠商評估:

       科杰科技

廠商介紹:

科杰科技是一家數(shù)據(jù)能力構建商,核心技術團隊擁有豐富的頭部互聯(lián)網(wǎng)企業(yè)云數(shù)據(jù)平臺搭建及運營經(jīng)驗,致力于將成熟完備的數(shù)據(jù)底座產(chǎn)品與多業(yè)態(tài)復雜場景的最佳實踐有機融合,為企業(yè)提供數(shù)據(jù)管理、開發(fā)挖掘、運維一體化的整套方案,助力企業(yè)快速構建數(shù)據(jù)能力,實現(xiàn)高度規(guī)范化、敏捷化的數(shù)據(jù)工作協(xié)同與數(shù)據(jù)應用創(chuàng)新。現(xiàn)已服務百余家 政府單位及金融、能源、汽車、零售等行業(yè)頭部企業(yè)。

產(chǎn)品服務介紹:

科杰科技核心產(chǎn)品湖倉一體數(shù)據(jù)智能平臺 Keen Data Lakehouse是基于云原生技術自主研發(fā)的數(shù)據(jù)底座產(chǎn)品,產(chǎn)品設計內(nèi)置12大功能模塊,在實現(xiàn)多云資源統(tǒng)一納管、彈性擴展和靈活調(diào)度的基礎上,滿足數(shù)據(jù)統(tǒng)一采集、存儲、開發(fā)、管理和服務的需求,具有高性能高穩(wěn)定性的特性。其中數(shù)據(jù)開發(fā)管理平臺Keen BDP、數(shù)據(jù)同步系統(tǒng)Keen Dsync、實時計算平臺Keen Stream、數(shù)據(jù)標準產(chǎn)品Keen DSM、數(shù)據(jù)質(zhì)量產(chǎn)品Keen DQM、主數(shù)據(jù)管理平臺Keen MDM、數(shù)據(jù)資產(chǎn)目錄Keen Asset、數(shù)據(jù)服務平臺Keen DAAS、數(shù)據(jù)標簽平臺Keen TAG功能模塊與一站式數(shù)據(jù)開發(fā)管理平臺直接相關。

廠商評估:

整體來看,科杰科技形成了“領先的大數(shù)據(jù)技術+全域數(shù)據(jù)資產(chǎn)管理+大數(shù)據(jù)工作方法論”三位一體的解決方案,在產(chǎn)品、技術、行業(yè)Know-How和咨詢服務方面具備優(yōu)勢。

1)產(chǎn)品功能全,產(chǎn)品架構能力強。

基于過往實踐,科杰科技覆蓋數(shù)據(jù)開發(fā)管理的全生命周期,產(chǎn)品功能豐富??平芸萍紝ataOps的理論融入產(chǎn)品設計中,支持DataOps持續(xù)集成、持續(xù)開發(fā)、持續(xù)運營方法論的最佳實踐。科杰產(chǎn)品矩陣覆蓋數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)開發(fā)、智能任務依賴、智能血緣解析、自動沉淀數(shù)據(jù)資產(chǎn)的全生命周期,在貫穿全流程工程化能力的同時提供全局統(tǒng)一數(shù)據(jù)標準、數(shù)據(jù)質(zhì)量、主數(shù)據(jù)管理、元數(shù)據(jù)管理以及數(shù)據(jù)安全的全方面數(shù)據(jù)治理能力,是數(shù)據(jù)治理與數(shù)據(jù)工程相融合的增強型大數(shù)據(jù)平臺產(chǎn)品,提供一站式數(shù)據(jù)源到數(shù)據(jù)洞察分析和數(shù)據(jù)編織能力,為企業(yè)數(shù)字化轉(zhuǎn)型提供數(shù)據(jù)底座能力。

科杰科技對重點功能進行產(chǎn)品化、模塊化封裝,整個平臺采取松耦合架構,能夠獨立交付部署。Keen Data Lakehouse整體采用松耦合結構搭建而成,產(chǎn)品具備高度自主性和靈活性??平芸萍坚槍χ攸c功能進行產(chǎn)品化、模塊化封裝,每個模塊都能夠與企業(yè)內(nèi)信息系統(tǒng)進行對接,支持獨立交付和部署應用。因此能夠面向多業(yè)態(tài)、復雜的業(yè)務場景,以樂高式的產(chǎn)品組合方式搭建,支持大型組織全角色精細化業(yè)務開展,持續(xù)高效地創(chuàng)造高質(zhì)量、可復用的數(shù)據(jù)資產(chǎn)。

2)底層技術架構領先,支撐集團企業(yè)多源異構數(shù)據(jù)統(tǒng)一納管。

Keen Data Lakehouse采用了領先的湖倉一體、新一代技術架構。這一架構兼具數(shù)據(jù)倉庫的高性能、強管理能力和數(shù)據(jù)湖的靈活性,具備批流一體、存算分離、數(shù)據(jù)編織、ACID事務性等特點,打通企業(yè)的數(shù)據(jù)孤島和數(shù)據(jù)煙囪,提供一個統(tǒng)一可共享的數(shù)據(jù)底座。通過將生產(chǎn)過程中大量結構化和非結構化的離線、實時數(shù)據(jù)抽取到數(shù)據(jù)倉庫,實現(xiàn)多源多態(tài)數(shù)據(jù)匯聚,為后續(xù)數(shù)據(jù)標準化、資產(chǎn)化、安全管理等需求提供了基礎條件。

科杰科技通過多模數(shù)據(jù)統(tǒng)一處理技術,實現(xiàn)企業(yè)數(shù)據(jù)在數(shù)據(jù)湖和數(shù)據(jù)倉庫之上的無縫調(diào)度和管理,避免大數(shù)據(jù)平臺、云數(shù)倉、分析型數(shù)據(jù)庫等現(xiàn)有數(shù)據(jù)資產(chǎn)的遷移。既能利用企業(yè)已有建設成果提供包容性支撐,對歷史數(shù)據(jù)、實時數(shù)據(jù)進行存儲、計算和查詢,保持現(xiàn)有業(yè)務的連續(xù)性;又能以邏輯統(tǒng)一的數(shù)據(jù)資產(chǎn)和協(xié)作方式進行開發(fā),面向未來數(shù)據(jù)工作保持開放性,為技術部門與業(yè)務部門的高效協(xié)作奠定了基礎。

3)行業(yè)落地經(jīng)驗豐富,對集團企業(yè)的數(shù)據(jù)資產(chǎn)統(tǒng)一管理和高效協(xié)作方式有深刻理解。

科杰科技的核心研發(fā)成員具有互聯(lián)網(wǎng)大廠背景和十多年大數(shù)據(jù)實戰(zhàn)經(jīng)驗,曾親身經(jīng)歷大型企業(yè)的大數(shù)據(jù)部門組建、數(shù)據(jù)中臺項目的建設,對于大型企業(yè)的集團、分公司、不同業(yè)務條線之間數(shù)據(jù)權限、數(shù)據(jù)安全、數(shù)據(jù)使用和存儲壓力問題了解深入,能夠根據(jù)不同企業(yè)的組織架構、業(yè)務流程等特點,提出適合的解決方案。

基于多年實踐經(jīng)驗,科杰科技總結形成一套標準完善的企業(yè)級數(shù)據(jù)底座落地實施流程,結合Keen Data Lakehouse產(chǎn)品矩陣,能夠大大提升項目實施效率。目前,已在金融、新零售、能源、工業(yè)互聯(lián)網(wǎng)、汽車、通信等行業(yè)成功落地,并打造了具有針對性的多個行業(yè)解決方案。

4)具備咨詢服務能力,能為企業(yè)持續(xù)構建大數(shù)據(jù)能力提供建議。

科杰科技能夠為客戶提供前期的數(shù)字化咨詢服務,根據(jù)企業(yè)現(xiàn)狀給出問題診斷和建設路徑,幫助企業(yè)內(nèi)部的IT技術部門、數(shù)據(jù)部門和業(yè)務部門達成共識、明確目標、梳理流程、制定規(guī)則,真正實現(xiàn)數(shù)據(jù)驅(qū)動業(yè)務、數(shù)據(jù)驅(qū)動管理,推動一站式數(shù)據(jù)開發(fā)管理平臺項目真正實現(xiàn)落地。

典型客戶:

一汽、中石化、永旺、中金公司、銀華基金 4.2敏捷數(shù)據(jù)管道

市場定義:

基于ETL、ELT、CDC、Kafka等方式,從多種數(shù)據(jù)源采集原始數(shù)據(jù),經(jīng)過數(shù)據(jù)轉(zhuǎn)換,存儲至數(shù)據(jù)湖(數(shù)據(jù)倉庫)中,實現(xiàn)數(shù)據(jù)集成和標準化。

甲方終端用戶:

制造、汽車、消費品零售、能源等行業(yè)的大數(shù)據(jù)部門負責人、IT部門負責人和業(yè)務部門(業(yè)務部門ITBP)

甲方核心需求:

甲方的目標是更加敏捷、自動化地搭建數(shù)據(jù)管道,并對數(shù)據(jù)管道進行統(tǒng)一管理和編排。

隨著數(shù)字化轉(zhuǎn)型的深入和數(shù)據(jù)消費需求的增加,甲方內(nèi)部的IT環(huán)境和數(shù)據(jù)環(huán)境越來越復雜,數(shù)據(jù)集成工具越來越多,彼此難以融合,相互割裂運行,對運維和管理提出了很高的挑戰(zhàn)。與此同時,數(shù)據(jù)管道的重要度越來越高,特別在業(yè)務部門對數(shù)據(jù)分析需求日益增長的趨勢之下,越來越多的數(shù)據(jù)管道建設需求來自于業(yè)務部門。

因此,數(shù)據(jù)管道逐步從整個大數(shù)據(jù)平臺獨立出來,作為一個獨立項目進行建設、運維和管理。以新消費、新能源為代表的行業(yè),IT部門規(guī)模不大,但業(yè)務部門有很強烈的數(shù)據(jù)分析需求,敏捷、輕量、自助式數(shù)據(jù)管道建設需求日益增強。

1)數(shù)據(jù)類型和應用場景越來越多,對數(shù)據(jù)管道建設提出了更高要求。

傳統(tǒng)企業(yè)面臨的數(shù)據(jù)應用場景也更加多元,如BI報表、實時決策、基于機器學習的預測性分析等;同時,數(shù)據(jù)體量和多樣性也在快速增長,隨著物聯(lián)網(wǎng)應用的落地,時序、GIS、圖像、視頻、文本等新興數(shù)據(jù)類型大規(guī)模涌現(xiàn)。因此需要支持離線和在線場景,結構化、半結構化、非結構化等數(shù)據(jù)類型的數(shù)據(jù)采集。

2)業(yè)務快速迭代,敏捷搭建和自動化運維管理是數(shù)據(jù)管道建設的必備能力。

企業(yè)業(yè)務進行數(shù)字化轉(zhuǎn)型,產(chǎn)生大量數(shù)字化應用,對數(shù)據(jù)分析、數(shù)據(jù)應用提出了更高的要求。一方面業(yè)務發(fā)展變化快,傳統(tǒng)的ETL數(shù)據(jù)抽取、轉(zhuǎn)換和加載工作量繁雜,單這一流程會耗費數(shù)周乃至上月時間,導致業(yè)務面臨時效性之后,因此需要能夠快速搭建數(shù)據(jù)管道;另一方面隨著管道數(shù)量和數(shù)據(jù)量的迅速增加,數(shù)據(jù)管道的運維管理壓力變大,人工運維的模式無法應對,需要更多自動化的工具。

廠商能力要求:

廠商需要支持多類型數(shù)據(jù)源,滿足業(yè)務場景需求。同時支持離線和實時集成模式,滿足ETL、ETL、CDC、Kafka等多種技術路線,支持常見的各類型數(shù)據(jù)源,滿足各類型業(yè)務系統(tǒng)之間復雜的數(shù)據(jù)分發(fā)、推送、傳輸和共享發(fā)布。

圍繞著運維管理監(jiān)控,廠商需要支持豐富的工具鏈和較高的自動化程度。提供組件化的多種類型數(shù)據(jù)處理工具,支持相互銜接組合,以滿足數(shù)據(jù)采集、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)存儲過程中的各種數(shù)據(jù)處理需求,并把重復的工作流程嵌入自動化,提升效率。

產(chǎn)品需要具備易用性。數(shù)據(jù)管道的使用人群不僅僅是IT部門,還有一部分業(yè)務部門的ITBP角色,因此根據(jù)不同使用角色的需求,需要支持通過拖、拉、拽等簡單操作方式完成數(shù)據(jù)集成流程的構建和相關功能。

入選標準:

1.符合敏捷數(shù)據(jù)管道市場分析的廠商能力要求;

2.累計在該市場服務客戶數(shù)10家及以上;

3.累計在該市場收入1000萬及以上。

代表廠商評估:

       谷云科技

廠商介紹:

谷云科技(廣州)有限責任公司成立于2017年,是國內(nèi)最早一批專注于iPaaS混合集成中臺研發(fā)的產(chǎn)品和技術解決方案提供商。公司專注于數(shù)據(jù)集成、服務集成、MQ消息集成、API管理領域,從底層開發(fā)框架入手完全自主研發(fā),并基于統(tǒng)一平臺自主研發(fā)了全線RestCloud系列產(chǎn)品,服務于零售、制造、金融、教育等行業(yè)企業(yè)客戶,以及政府機構等各類組織。

產(chǎn)品服務介紹:

RestCloud 數(shù)據(jù)集成平臺是谷云科技基于DataOps理念完全自主研發(fā)和創(chuàng)新的新一代數(shù)據(jù)集成平臺,平臺一站式融合了ETL、ELT、CDC、API等能力,可幫助企業(yè)客戶快速搭建批流一體的數(shù)據(jù)集成底座,實現(xiàn)業(yè)務系統(tǒng)之間的數(shù)據(jù)集成和多源異構數(shù)據(jù)的交換和融合。

作為一套面向數(shù)據(jù)集成的輕量化、標準化產(chǎn)品,RestCloud 數(shù)據(jù)集成平臺采用全Web化配置,開箱即用,能夠讓用戶實現(xiàn)自助式構建數(shù)據(jù)管道,并具有豐富的組件,幫助用戶實現(xiàn)開發(fā)、測試、發(fā)布、監(jiān)控、告警、運維等一系列工作。同時,結合谷云科技的API服務平臺,RestCloud數(shù)據(jù)集成平臺可以幫助企業(yè)快速構建輕量級數(shù)據(jù)中臺,滿足企業(yè)統(tǒng)一數(shù)據(jù)管理和數(shù)據(jù)共享需求,幫助IT部門實現(xiàn)對業(yè)務部門的支持。

廠商評估:

整體來看,谷云科技自主研發(fā)的數(shù)據(jù)集成平臺在數(shù)據(jù)傳輸性能、任務調(diào)度架構、產(chǎn)品易用性和系統(tǒng)穩(wěn)定性等方面具備優(yōu)勢,同時創(chuàng)新的把CDC和ETL進了一體化設計,使得實時流數(shù)據(jù)和批數(shù)據(jù)可以進行混合處理和合并。

1)技術能力強,覆蓋多種技術路線,滿足多種場景數(shù)據(jù)處理要求。

谷云科技的RestCloud數(shù)據(jù)集成平臺支持ETL/ELT離線數(shù)據(jù)處理和CDC實時數(shù)據(jù)處理等技術路線,能夠滿足企業(yè)客戶離線和實時業(yè)務場景的數(shù)據(jù)處理需求,滿足大中小型企業(yè)進行數(shù)據(jù)倉庫/數(shù)據(jù)中臺構建、客戶主數(shù)據(jù)平臺的構建、工業(yè)互聯(lián)網(wǎng)IoT設備的數(shù)據(jù)采集、云上云下SaaS數(shù)據(jù)同步、混合云數(shù)據(jù)同步等各種復雜數(shù)據(jù)集成應用場景的需求。同時,通過配置BI以及API數(shù)據(jù)服務,谷云科技還可構建各種數(shù)據(jù)應用的創(chuàng)新場景,滿足于企業(yè)敏態(tài)化數(shù)據(jù)消費需求。

谷云科技的RestCloud 數(shù)據(jù)集成平臺能夠廣泛支持企業(yè)的各類數(shù)據(jù)源和數(shù)據(jù)類型,不但具備功能強大的離線數(shù)據(jù)處理能力,同時具備實時數(shù)據(jù)傳輸能力,能夠支持包含國產(chǎn)數(shù)據(jù)庫在內(nèi)的40多個數(shù)據(jù)源,以及Kafka、MQTT物聯(lián)網(wǎng)數(shù)據(jù)、HTTP等多類型實時數(shù)據(jù)流接入。

2)產(chǎn)品架構設計能力強,具有標準化、輕量化等特點。

谷云科技將RestCloud 數(shù)據(jù)集成平臺分為執(zhí)行層、管理層和調(diào)度層支持10000+數(shù)據(jù)管道的準確調(diào)度和執(zhí)行,平臺作為標準化產(chǎn)品,能夠按模塊進行自由地分離和組裝,大大增強了平臺的靈活性和可擴展性。一方面,平臺可以快速接入新的數(shù)據(jù)源,滿足不同場景的數(shù)據(jù)需求;另一方面,可以根據(jù)用戶的偏好和現(xiàn)狀,自定義配置平臺的功能和數(shù)據(jù)處理組件,平臺采用輕量化架構可以幾分鐘內(nèi)完成部署上線并可運行在公有云、私有云以及個人電腦上。

3)產(chǎn)品易用性強,能夠滿足不同發(fā)展階段的企業(yè)需求。

基于過往實踐經(jīng)驗,谷云科技將大量數(shù)據(jù)集成、數(shù)據(jù)服務過程中涉及的功能模塊封裝到RestCloud數(shù)據(jù)集成平臺中,數(shù)據(jù)抽取、加載、清洗、運算、脫敏、行轉(zhuǎn)列、列轉(zhuǎn)行等相關組件超過100種。

考慮到不同企業(yè)用戶自身IT能力的差異,谷云科技的RestCloud平臺支持自助式開發(fā)設計,支持基于純Java語法的自定義規(guī)則和算法,能夠通過規(guī)則實現(xiàn)復雜的自定義業(yè)務邏輯處理。因此,用戶通過可視化拖、拉、拽方式,完成數(shù)據(jù)管道的構建并實現(xiàn)數(shù)據(jù)抽取、轉(zhuǎn)換、清洗、脫敏、加載等功能。

4)底層技術架構以自研為主,平臺系統(tǒng)穩(wěn)定性、可用性強。

谷云科技基于微服務架構研發(fā)的RestCloud數(shù)據(jù)集成平臺,能夠支持大規(guī)模的分布式部署架構,滿足企業(yè)用戶的云原生應用場景的需求?;谖⒎占軜媽φ麄€平臺進行技術解耦,每個功能模塊都可以獨立運行,使得平臺未來具備SaaS化的發(fā)展?jié)摿Α?/p>

ETL、ELT、CDC、調(diào)度平臺、API開發(fā)平臺等技術均以自研為主,而不是基于開源技術架構之上做改進和優(yōu)化,底層技術能力完全自主可控,提升了整個平臺的穩(wěn)定性和可控性。

典型客戶:

浙商證券、中金財富、三一重工、中建科工、億緯鋰能 4.3智能數(shù)據(jù)資產(chǎn)目錄

市場定義:

面向業(yè)務場景,結合機器學習和知識圖譜技術,實現(xiàn)元數(shù)據(jù)一站式、自動化管理,包含數(shù)據(jù)采集、數(shù)據(jù)血緣、數(shù)據(jù)標準、數(shù)據(jù)發(fā)現(xiàn)、權限管理、資產(chǎn)監(jiān)控等。

甲方終端用戶:

金融、制造、汽車、消費品零售、能源等行業(yè)及政府機關的大數(shù)據(jù)部門負責人、IT部門負責人

甲方核心需求:

業(yè)務與數(shù)據(jù)“脫節(jié)”是很多甲方當前面臨的重要問題之一。一方面,數(shù)據(jù)開發(fā)部門對業(yè)務理解有限,導致整個數(shù)據(jù)開發(fā)過程緩慢;另一方面,不同業(yè)務之間的數(shù)據(jù)如何打通和融合,建立統(tǒng)一的數(shù)據(jù)標準,對數(shù)據(jù)開發(fā)部門來說挑戰(zhàn)很大。以政府應急管理為例,數(shù)據(jù)來自于多個不同的委辦局,需要以一套標準、流程和規(guī)范來開展工作,實現(xiàn)對安全隱患的排查、監(jiān)督和管理,背后是對不同業(yè)務的數(shù)據(jù)表單、字段和指標的融合和統(tǒng)一。企

針對當前快速、多變的數(shù)據(jù)服務需求,甲方的目標是基于現(xiàn)有數(shù)據(jù)資產(chǎn)目錄基礎上增加更多面向業(yè)務場景的標簽和指標,實現(xiàn)數(shù)據(jù)部門與業(yè)務部門的連接,并同時具備自動化迭代能力,持續(xù)提升數(shù)據(jù)開發(fā)效率。

1)快速梳理業(yè)務、建立業(yè)務認知的方法論。

以業(yè)務為中心,解決“數(shù)據(jù)在哪里”、“數(shù)據(jù)誰負責”以及數(shù)據(jù)如何用等問題,識別出業(yè)務主責部門、相關核心業(yè)務系統(tǒng)的核心對象、核心數(shù)據(jù),打通查數(shù)/取數(shù)環(huán)節(jié)、打通基礎類數(shù)據(jù)和指標類數(shù)據(jù)的聯(lián)系。這些問題需要有一套方法論,能夠幫助數(shù)據(jù)開發(fā)部門快速開展工作的標準、流程和規(guī)范。

2)兼顧當前和未來需求的可擴展架構。

隨著創(chuàng)新業(yè)務發(fā)展,未來會有越來越多業(yè)務部門納入到數(shù)字化建設中,數(shù)據(jù)驅(qū)動業(yè)務滲透率持續(xù)提升,勢必使得數(shù)據(jù)復雜度持續(xù)提升,如何能夠兼顧當前業(yè)務需求,并為長期發(fā)展奠定基礎,需要一套具備可擴展性的技術架構,能支撐未來的更豐富的應用需求,實現(xiàn)業(yè)務流程和場景智能化的提升。

廠商能力要求:

廠商需要滿足對甲方業(yè)務理解能力,能夠基于業(yè)務視角提供解決方案?;趶S商自身積累的方法論,快速從多維度業(yè)務視角理解業(yè)務表達的含義、關系和趨勢,理解業(yè)務服務的對象、范圍,厘清數(shù)據(jù)與業(yè)務、業(yè)務與業(yè)務之間的關系,建立起對業(yè)務的認知,從而指導數(shù)據(jù)匯聚和數(shù)據(jù)應用。

廠商需要具備較強的技術架構能力,產(chǎn)品滿足自動化和擴展性需求。能夠通過原生集成和擴展的方式連接全域數(shù)據(jù),并結合機器學習和知識圖譜等技術,實現(xiàn)自動編目數(shù)據(jù)、自動化數(shù)據(jù)和業(yè)務血緣,支持數(shù)據(jù)治理工作,并滿足不斷豐富的業(yè)務場景和數(shù)據(jù)應用需求。

入選標準:

1.符合智能數(shù)據(jù)資產(chǎn)目錄市場分析的廠商能力要求;

2.累計在該市場服務客戶數(shù)5家及以上;

3.累計在該市場收入1000萬及以上。

代表廠商評估:

       愛數(shù)

廠商介紹:

上海愛數(shù)信息技術股份有限公司(簡稱“愛數(shù)”)成立于2006年,是領先的全域數(shù)據(jù)能力服務商。愛數(shù)以全域數(shù)據(jù)能力、統(tǒng)一架構和平臺+生態(tài)模式,打造創(chuàng)新的大數(shù)據(jù)基礎設施,通過AnyBackup、AnyShare、AnyRobot、AnyDATA、AnyFabric等產(chǎn)品覆蓋全域數(shù)據(jù)的整合、治理、保護,實現(xiàn)數(shù)據(jù)資產(chǎn)化和知識化,與客戶共創(chuàng)數(shù)據(jù)驅(qū)動型組織。依托自身強大的大數(shù)據(jù)基礎設施,愛數(shù)已服務超40個國家、地區(qū)的27000+客戶。

產(chǎn)品服務介紹:

AnyFabric是面向全域數(shù)據(jù)的數(shù)據(jù)資產(chǎn)管理平臺,為企業(yè)或政府機構提供的一套智能數(shù)據(jù)資產(chǎn)管理解決方案?;陬I域認知智能和Data Fabric架構思想,通過對元數(shù)據(jù)的全面采集、深度學習、認知推理分析,自動關聯(lián)數(shù)據(jù)的業(yè)務語義,快速生成數(shù)據(jù)資產(chǎn)知識網(wǎng)絡,實現(xiàn)業(yè)務與數(shù)據(jù)的連接,業(yè)務與業(yè)務的連接,從而實現(xiàn)以業(yè)務為中心的數(shù)據(jù)管理和運營,助力客戶實現(xiàn)數(shù)據(jù)驅(qū)動組織,通過認知智能輔助數(shù)據(jù)管理和業(yè)務決策。目前已經(jīng)在政府、制造、零售等行業(yè)率先落地,已經(jīng)積累了不少成功落地案例。

廠商評估:

整體來看,愛數(shù)基于Data Fabric架構研發(fā)的AnyFabric在數(shù)據(jù)管理架構、認知智能和開放集成能力上具備優(yōu)勢。

1)以業(yè)務為中心設計產(chǎn)品架構,產(chǎn)品功能豐富且貼近業(yè)務需求。

AnyFabric通過業(yè)務治理整合數(shù)據(jù)孤島,簡化數(shù)據(jù)治理。相較于基于數(shù)倉的強管控模型下集中化的數(shù)據(jù)治理,愛數(shù)采用了以業(yè)務為中心編織、連接所有元數(shù)據(jù),通過建立數(shù)據(jù)資產(chǎn)知識網(wǎng)絡來編織和驅(qū)動數(shù)據(jù)的方式。AnyFabric通過連接型架構和領域認知智能作為核心引擎,以業(yè)務模型為中心連接全域數(shù)據(jù),利用知識圖譜引擎構建數(shù)據(jù)資產(chǎn)知識網(wǎng)絡,形成了增強型數(shù)據(jù)資產(chǎn)目錄。不僅能夠賦能企業(yè)整合數(shù)據(jù)孤島,還能從業(yè)務視角出發(fā),自動化、精確指導數(shù)據(jù)歸集、清洗、開發(fā)和加工等,簡化數(shù)據(jù)治理。

AnyFabric基于業(yè)務提升數(shù)據(jù)質(zhì)量,實現(xiàn)數(shù)據(jù)資產(chǎn)化。AnyFabric所建立的數(shù)據(jù)資產(chǎn)知識網(wǎng)絡,能夠快速發(fā)現(xiàn)業(yè)務與業(yè)務之間的融合關系,監(jiān)控業(yè)務指標、風險定位,做出問題分析、價值判斷等。在數(shù)據(jù)準備環(huán)節(jié)圍繞業(yè)務透視企業(yè)多個系統(tǒng)間的復雜關系,并實現(xiàn)直接獲取業(yè)務部門真正需要的原始數(shù)據(jù),提高數(shù)據(jù)質(zhì)量?;跇I(yè)務標準并結合領域認知智能,高效組織和調(diào)度數(shù)據(jù),開展數(shù)據(jù)治理,最終有效賦能業(yè)務最大化產(chǎn)生價值。

AnyFabric的業(yè)務可擴展性強。愛數(shù)采用業(yè)務視角的連接型架構,并將智能資產(chǎn)目錄建立的流程和模板固化到產(chǎn)品中。當企業(yè)出現(xiàn)新的業(yè)務時,將按照步驟進行業(yè)務梳理和成果輸出,原有的業(yè)務語義能夠由機器學習自動推薦,并識別相關的業(yè)務對象、業(yè)務對象,最終迅速到融入領域業(yè)務知識網(wǎng)絡中。后臺通過自動更新,不斷豐富業(yè)務和數(shù)據(jù)之間的關系,實現(xiàn)自動迭代和拓展,更好的應對企業(yè)的業(yè)務擴張。

2)融合知識圖譜技術,具備自動化和智能化能力。

愛數(shù)在知識圖譜領域已有超過四年的技術沉淀,并在多個行業(yè)有成功項目落地經(jīng)驗。在原有數(shù)據(jù)資產(chǎn)目錄之上,結合愛數(shù)現(xiàn)有知識圖譜技術沉淀,使得數(shù)據(jù)資產(chǎn)目錄具備自動化和智能化,形成領域知識網(wǎng)絡,并在此基礎上實現(xiàn)推理分析和輔助決策,最終實現(xiàn)業(yè)務智能化。

AnyFabric通過融合機器學習、知識圖譜等先進技術,實現(xiàn)自動化的元數(shù)據(jù)采集、編目數(shù)據(jù)和數(shù)據(jù)血緣跟蹤。通過自動抽取本體和連接,并輔以人工校核,自動形成單業(yè)務知識圖譜,將多個單業(yè)務知識圖譜自動匯聚,連接生成企業(yè)級的業(yè)務知識網(wǎng)絡,賦能數(shù)據(jù)服務開發(fā)工作。借助自動化、智能化技術降低整個過程中數(shù)據(jù)編目的復雜性和工作量,幫助業(yè)務和數(shù)據(jù)管理人員輕松掌握數(shù)據(jù)的轉(zhuǎn)換和流動。

3)統(tǒng)一技術架構,能夠與愛數(shù)其他產(chǎn)品線融合,能夠提供端到端的解決方案。

AnyFabric沿用了愛數(shù)統(tǒng)一的技術棧架構,與AnyDATA、AnyShare等愛數(shù)產(chǎn)品內(nèi)置對接,在統(tǒng)一的ONE架構上融合部署和深度集成,降低數(shù)據(jù)管理的運維難度和復雜性,為企業(yè)提供全域數(shù)據(jù)能力和一致的用戶體驗。

典型客戶:

中新天津生態(tài)城、郴州市城市大腦、中國中車 5. 入選廠商列表

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )