原標題:不虛談AIOps,你要的全面可實施方案都在這里了
一個全球部署的商用云平臺系統(tǒng)使用AIOps系統(tǒng),對2000多個節(jié)點進行實時監(jiān)控,可以平均提前兩個小時預警系統(tǒng)異常;而某個電商企業(yè)引入AIOps后,能夠對未來一段時間內的運營數值進行精準預測,生成動態(tài)基線來監(jiān)控和告警,故障發(fā)現的準確率也可能會提升至80%或更高,極大提升企業(yè)的運營效率。
如果說最初的運維就是發(fā)現問題和解決問題,那么數字化的出現改變了IT運維的本質;它引入了圍繞服務可用性、性能和敏捷性的新需求;但這些需求也對運維管理提出了更高的要求,否則可能導致服務質量的惡化、對業(yè)務需求的遲鈍相應以及IT運營中的成本增加。
在這種情況下,智能化運維AIOps成為了越來越多企業(yè)的選擇。
下個趨勢將是AIOps
現代IT運營的目標之一是深入了解IT系統(tǒng)的歷史狀態(tài),并通過學習和分析,預判和調節(jié)整個IT平臺的潛在未來狀態(tài)。如IDC在一份《IT運營分析調查》的報告中所說,“53%的企業(yè)在今天將采用IT運營分析(ITOA)視為其整體云戰(zhàn)略的關鍵任務”。
雖然自動化技術有助于應對一些數字化運營帶來的新挑戰(zhàn),但大部分技術在產生大量數據的同時,卻缺乏從大量系統(tǒng)生成的日志中處理、關聯(lián)和挖掘洞察的能力;但是企業(yè)需要更具有前瞻性、可預測的智能IT運營,從而有助于建立新的、敏捷的業(yè)務模型,并支持創(chuàng)新計劃,從而保持企業(yè)的領先地位。
根據Gartner的分析預測,到2022年,所有大型企業(yè)中,40%的企業(yè)將使用AIOps工具,將大數據和機器學習功能結合起來,支持和部分取代現在5%以上的監(jiān)控,服務臺和自動化流程和任務,并且“客戶對使用AIOps功能已經表現出越來越多的興趣,應用大數據和機器學習來簡化工單和CMDB流程、促進自動化?!?/span>
離不開的人工智能
典型的AIops落地場景包括異常檢測、動態(tài)基線、根因分析、故障預測和應用性能監(jiān)控等。簡單來說,為了更好地支持業(yè)務,AIOps將人工智能引入了運維中的監(jiān)控和故障分析領域,探索更有效穩(wěn)定的系統(tǒng)運行效果。
比如面對大量組件構成的復雜系統(tǒng),以及在系統(tǒng)經常面臨變更,從而要求人工對監(jiān)控設置不斷進行調整的情況下,就可以通過歷史數據的機器學習來動態(tài)預測數據的趨勢,并通過大量的歷史數據形成每個組件自身的行為模型,從而實現基于動態(tài)畫像的系統(tǒng)異常檢測和基于學習組件行為模型的異常主動預測。
此外,隨著企業(yè)應用的大量微服務化,業(yè)務之間的調用以API的形式出現,傳統(tǒng)的應用性能監(jiān)控方式很難統(tǒng)一的反應出應用性能的實時情況;而且目前大量的系統(tǒng)擴縮容策略都是基于閾值(也就是一定的基線)設置的,很難及時根據實時狀態(tài)進行調整;這時,通過AIOps,就可以實現“動態(tài)基線”的效果,基于歷史數據,利用智能算法深度學習,對未來一段時間內每個時間點的數值進行精準預測,將預測值作為基線來監(jiān)控和告警。
又或者,當業(yè)務運營問題需要轉化為技術問題來解決時,通常面臨系統(tǒng)故障問題定位困難的情況,而且在今天越來越復雜的分布式系統(tǒng)面前,需要考慮更多的系統(tǒng)關聯(lián)性,而且往往一個故障的發(fā)生,可能涉及一連串的應用API調用,如果不能實現基于智能的根因分析(RCA),快速完成故障定位及解決將會非常困難。
端到端的全面服務
想象一下,一個解決方案可以在問題出現之前實時乃至預先解決;這就是智能化運維所蘊含的價值。
因此,越來越多的企業(yè)和組織開始重視并采用AIOps,通過認知與自動化相結合的運營平臺,實現企業(yè)混合多云架構智能運維的轉型目標。
比如,某大型商業(yè)銀行數據中心系統(tǒng)通過AIOps,能夠檢測包括Unix、Linux以及Windows在內的近千臺服務器節(jié)點,提前14小時檢測出應用節(jié)點出現資源消耗異常,并最終導致異常退出的故障;以及某個商業(yè)云平臺能從1000多個節(jié)點中,快速過濾出30多個異常點,并根據置信度給予優(yōu)先排序,幫助應用人員快速定位問題。
雖然AIOps是趨勢,但由于AIOps涉及“歷史數據管理”、“流數據管理”、“自動模式發(fā)現與預測”、“根本原因確定”、“內部部署交付”等多種功能需求,并需要熟悉不同行業(yè)的特定業(yè)務流程;迄今為止,很少有供應商能提供全面的AIOps平臺。
與其他服務提供商不同,IBM基于自身在各行業(yè)的最佳實踐經驗,提供從設計、構建到管理解決方案的端到端專業(yè)服務,并以服務的方式進行快速交付,幫助客戶降低運營成本。
IBM全球信息科技服務部推出的智能運維使用完全托管的IT分析解決方案,提供AIOps即服務的交付模式,該方案可提取企業(yè)IT運營數據,并采用預先構建的機器學習模型進行數據的統(tǒng)計、分析,提供深刻洞察及自動化服務。
獲取IBM AIOPS白皮書,請掃碼:
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉入資金提現免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。