智能運(yùn)維AIOps:數(shù)據(jù)與場景的突破

阿克琉斯之踵,金融企業(yè)的數(shù)字化之痛

《新金融世界》記者見到云智慧(北京)科技有限公司副總裁李誠的時(shí)候,他剛剛從客戶現(xiàn)場回到公司。據(jù)介紹,這是一家數(shù)字化步伐比較快的大型金融機(jī)構(gòu),在國內(nèi)擁有3個(gè)數(shù)據(jù)中心,600個(gè)業(yè)務(wù)應(yīng)用系統(tǒng),上萬臺(tái)物理設(shè)備,系統(tǒng)彼此之間調(diào)用關(guān)系復(fù)雜,并且部分核心業(yè)務(wù)之間具有強(qiáng)依賴關(guān)系。

這些應(yīng)用系統(tǒng)每天產(chǎn)生海量日志數(shù)據(jù)和告警信息,對(duì)日志報(bào)文數(shù)據(jù)的處理分析需要3-4個(gè)小時(shí),時(shí)效性差,效率低。“隨著新業(yè)務(wù)的不斷上線,運(yùn)維團(tuán)隊(duì)每天會(huì)接收上萬條的故障告警通知消息,漏報(bào)、錯(cuò)報(bào)情況頻發(fā)。故障發(fā)生時(shí),需要各部門協(xié)調(diào)才能定位解決問題,平均故障解決時(shí)間在6個(gè)小時(shí)以上,整體運(yùn)維效率已經(jīng)成為制約企業(yè)數(shù)字化發(fā)展的障礙。”李誠告訴記者。

2016年,隨著AIOps從概念到落地,讓這家金融機(jī)構(gòu)的CIO看到了希望——利用智能運(yùn)維消除傳統(tǒng)IT支撐系統(tǒng)與數(shù)字化業(yè)務(wù)之間的數(shù)據(jù)斷層,簡化運(yùn)維操作復(fù)雜度,有效提供運(yùn)維效率,持續(xù)改善業(yè)務(wù)運(yùn)行狀態(tài)。經(jīng)過兩個(gè)多月與云智慧的溝通和深入調(diào)研,李誠針對(duì)客戶的運(yùn)維痛點(diǎn)開出了一劑良方——云智慧智能業(yè)務(wù)運(yùn)維DOCP平臺(tái)。

基于多數(shù)據(jù)源,貫穿四大場景

云智慧是從2016年開始涉足智能運(yùn)維,在過去兩年里,李誠和他所帶領(lǐng)的云智慧技術(shù)支持團(tuán)隊(duì)已經(jīng)為近百家大型企業(yè)實(shí)施了智能運(yùn)維解決方案,并獲得了成功。以此為基礎(chǔ),云智慧推出了面向業(yè)務(wù)和IT全生命周期的數(shù)字化運(yùn)維和運(yùn)營管理解決方案——智能業(yè)務(wù)運(yùn)維DOCP(Digital Operation Central Platform),以實(shí)時(shí)大數(shù)據(jù)處理、AIOps技術(shù)體系為基礎(chǔ),通過漸進(jìn)式的大數(shù)據(jù)運(yùn)維、業(yè)務(wù)運(yùn)維和智能運(yùn)維解決方案,搭建起一體化的數(shù)字化、智能化運(yùn)維管控中心平臺(tái),通過平臺(tái)賦予企業(yè)強(qiáng)大的大數(shù)據(jù)處理能力、算法能力和分析能力。

從技術(shù)角度來看,實(shí)現(xiàn)智能運(yùn)維AIOps還是具有相當(dāng)?shù)拈T檻的。

首先企業(yè)必須擁有大數(shù)據(jù)分析處理能力。在運(yùn)維領(lǐng)域,整體的數(shù)據(jù)量很大,數(shù)據(jù)來源包含基礎(chǔ)監(jiān)控、網(wǎng)絡(luò)質(zhì)量、APM數(shù)據(jù),還有日志數(shù)據(jù)等等,數(shù)據(jù)類型包含了機(jī)器數(shù)據(jù)、文本數(shù)據(jù)、流式數(shù)據(jù)等。而且更重要的一點(diǎn)是,作為運(yùn)維系統(tǒng),這些數(shù)據(jù)是實(shí)時(shí)產(chǎn)生并持續(xù)增加的。因此,智能運(yùn)維對(duì)系統(tǒng)的實(shí)時(shí)數(shù)據(jù)采集、存儲(chǔ)和分析能力都有很高的要求。

智能運(yùn)維AIOps:數(shù)據(jù)與場景的突破

而在此基礎(chǔ)之上,智能運(yùn)維的核心價(jià)值在于場景化。“智能運(yùn)維必須是基于客戶實(shí)際應(yīng)用場景,解決實(shí)際業(yè)務(wù)問題,才能有效提升IT運(yùn)維效率。云智慧梳理了智能運(yùn)維主要的四大類應(yīng)用場景:檢測、分析、發(fā)現(xiàn)(告警)、處置,大數(shù)據(jù)和人工智能技術(shù)始終貫穿于這四大類場景之中,通過數(shù)據(jù)的持續(xù)分析、積累和業(yè)務(wù)建模的不斷優(yōu)化,最終帶來真正意義上的智能運(yùn)維。” 李誠表示。

總而言之,智能運(yùn)維的價(jià)值體現(xiàn)在三個(gè)方面,首先是發(fā)現(xiàn)問題的時(shí)間縮短了,其次是解決問題的時(shí)間也變短了,更高級(jí)的是能夠通過故障預(yù)警,提前發(fā)現(xiàn)問題,將隱患消解于無形。

逐步深入,金融行業(yè)智能運(yùn)維落地的三個(gè)階段

眾所周知,金融企業(yè)的IT系統(tǒng)具有業(yè)務(wù)價(jià)值高、系統(tǒng)規(guī)模大、復(fù)雜程度高等特點(diǎn)。因此,金融企業(yè)智能運(yùn)維的落地也不是一蹴而就的,可以分為三步解決方案。

第一階段是大數(shù)據(jù)運(yùn)維,構(gòu)建統(tǒng)一監(jiān)控平臺(tái),實(shí)現(xiàn)IT資源的統(tǒng)一管控。利用大數(shù)據(jù)的手段,采集、分析基礎(chǔ)設(shè)施、網(wǎng)絡(luò)、日志等IT監(jiān)控?cái)?shù)據(jù),通過海量IT數(shù)據(jù)的實(shí)時(shí)處理分析,消除數(shù)據(jù)孤島,實(shí)現(xiàn)統(tǒng)一的告警,提升運(yùn)維管理效率。

第二階段是業(yè)務(wù)運(yùn)維,全面提升用戶體驗(yàn)和業(yè)務(wù)系統(tǒng)健康,實(shí)現(xiàn)業(yè)務(wù)和IT的雙向驅(qū)動(dòng)。用戶體驗(yàn)和業(yè)務(wù)效能是數(shù)字化業(yè)務(wù)的兩大核心指標(biāo),通過IT和業(yè)務(wù)雙向驅(qū)動(dòng)的業(yè)務(wù)運(yùn)維,能夠幫助企業(yè)發(fā)現(xiàn)IT故障對(duì)業(yè)務(wù)造成的影響有多大、IT如何更好的支撐金融業(yè)務(wù)轉(zhuǎn)型、如何最大程度的降低業(yè)務(wù)損失。

智能運(yùn)維AIOps:數(shù)據(jù)與場景的突破

第三階段是智能運(yùn)維,構(gòu)建智能化的IT運(yùn)營管控體系,持續(xù)提升業(yè)務(wù)價(jià)值。通過智能告警、異常監(jiān)測、根因分析、自動(dòng)處置、故障預(yù)測,極大提升IT運(yùn)維效率, 保障業(yè)務(wù)連續(xù),減少業(yè)務(wù)損失。

以前文提到的金融行業(yè)客戶為例,通過云智慧智能業(yè)務(wù)運(yùn)維DOCP,無論是整體運(yùn)維工作效率,還是核心 KPI 都有大幅度的提升,同時(shí)IT運(yùn)營也初步實(shí)現(xiàn)了數(shù)字化和智能化。“由于金融行業(yè)的IT成熟度普遍較高,所以目前70%~80%的金融企業(yè)都具備了第一階段的基礎(chǔ),而50%的客戶開始部署第二階段的業(yè)務(wù)運(yùn)維,也有一些金融客戶從今年開始嘗試采用AIOps解決方案。”李誠表示“通過DOCP平臺(tái),我們連接起前端業(yè)務(wù)和后端應(yīng)用系統(tǒng),實(shí)現(xiàn)了多種數(shù)據(jù)源和算法模型的融合,持續(xù)提升業(yè)務(wù)運(yùn)營和IT管理效率,從而最終實(shí)現(xiàn)智能運(yùn)維。”

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-08-22
智能運(yùn)維AIOps:數(shù)據(jù)與場景的突破
阿克琉斯之踵,金融企業(yè)的數(shù)字化之痛《新金融世界》記者見到云智慧(北京)科技有限公司副總裁李誠的時(shí)候,他剛剛從客戶現(xiàn)場回到公司。

長按掃碼 閱讀全文