近年來,隨著企業(yè)業(yè)務(wù)的越來越復(fù)雜和需求越來越多樣化,企業(yè)數(shù)字化轉(zhuǎn)型進一步深入,業(yè)務(wù)系統(tǒng)也日趨復(fù)雜。IT資源規(guī)模越來越大,種類越來越多,需要IT服務(wù)的人也越來越多,需要的響應(yīng)也越來越快。在數(shù)字化轉(zhuǎn)型,云原生的趨勢下,自動化運維也正在發(fā)生著變化。
對于越來越復(fù)雜的運維來說,將人工操作逐漸改變?yōu)樽詣踊芾硎且粋€重要發(fā)展趨勢。自動化運維,核心目標是由自動化的機器驅(qū)動的操作代替人工操作。
自動化運維的發(fā)展趨勢
隨著云計算和AI的發(fā)展,自動化運維也在持續(xù)的發(fā)展。我們總結(jié)了當前自動化運維的核心發(fā)展趨勢:
1)自動化運維從傳統(tǒng)的面向計算,網(wǎng)絡(luò),存儲等基礎(chǔ)設(shè)施資源在往面向應(yīng)用架構(gòu)發(fā)展;
2)私有云,公有云和專有云的普及,自動化運維不能僅僅局限于傳統(tǒng)的以操作系統(tǒng)為中心,需要更好的支持各種云的各種云服務(wù),而不局限于AWS EC2,阿里云ECS等;
3)云原生,微服務(wù),容器普及,自動化運維需要更好支持新型的資源和應(yīng)用架構(gòu);
4) DevOps普及,自動化運維不再是IT運維人員的工具,更需要變成面向全體技術(shù)人員的普遍服務(wù);
5)需要越來越強大的分析能力。這里的機器替代人工,不僅僅是替代運維人員的操作過程,更核心的是替代操作前的人工思考,分析,決策過程,而完成操作本身的自動化是執(zhí)行過程。這些新的需求,新的趨勢,都需要更加新型的工具和平臺來支持。云管理平臺作為面向云的IT管理平臺,承擔起了越來越多的自動化運維的任務(wù)。本文將介紹騫云SmartCMP如何提供更加新形態(tài)的自動化運維能力。
構(gòu)建面向多云的自動化運維能力體系
一個完善的自動化運維體系至少應(yīng)包括三類平臺:IT管理平臺、監(jiān)控平臺和資源管理平臺。騫云SmartCMP云管平臺是通過單一控制臺, 基于TOSCA 標準的藍圖建模技術(shù),連接、編排和分析包括私有云、公有云容器平臺、x86 裸金屬服務(wù)器、 SDN、 SDS 等在內(nèi)的多云環(huán)境,從而構(gòu)建新型的自動化運維能力體系。
01多云資源的端到端的自動化運維能力
隨著私有云,公有云和專有云的普及,自動化運維也不能僅僅局限于傳統(tǒng)的以操作系統(tǒng)為中心,需要更好的支持各種云的各種云服務(wù),而不局限于AWS EC2,阿里云ECS等。SmartCMP平臺將不同云上的基礎(chǔ)資源層、應(yīng)用層、業(yè)務(wù)層上的多種資源抽象成多個服務(wù),并管理和監(jiān)控這些服務(wù)的全生命周期,以此實現(xiàn)一站式跨云運維。
平臺通過Ansible,代理提供強大的腳本自動化能力,主要包含:
1)提供腳本庫,支持包括SQL腳本在內(nèi)的多種腳本類型,加強腳本分享能力;
2)支持MySQL,Oracle數(shù)據(jù)庫執(zhí)行SQL腳本的運維操作;
3)通過作業(yè)流水線,自動化執(zhí)行多腳本場景,完成文件分發(fā)、安裝補丁、自動化巡檢、數(shù)據(jù)庫運維等多種運維任務(wù)。
基于上述強大并開發(fā)的平臺級的功能,SmartCMP構(gòu)建多種通用的傳統(tǒng)自動化運維場景,不僅僅包括傳統(tǒng)的對操作系統(tǒng)批量打補丁,還將系統(tǒng)巡檢、合規(guī)性檢查從特定資源擴展到任意云資源, 從而極大豐富自動化運維的覆蓋面。
02強大的應(yīng)用服務(wù)編排能力,提供面向應(yīng)用的自動化運維能力
傳統(tǒng)的自動化運維往往是將IT基礎(chǔ)設(shè)施資源與應(yīng)用軟件分開進行運維的,每個節(jié)點都相對的孤立,沒有很好的聯(lián)動。為了更好的支持業(yè)務(wù)部門,SmartCMP平臺面向應(yīng)用架構(gòu),將IT基礎(chǔ)設(shè)施和應(yīng)用軟件結(jié)合統(tǒng)一,實現(xiàn)自動化運維。
SmartCMP平臺通過藍圖將應(yīng)用軟件和IT基礎(chǔ)設(shè)施按照統(tǒng)一的協(xié)議規(guī)范進行封裝,將軟件的交付模式標準化。通過部署拓撲圖我們可以快速實現(xiàn)應(yīng)用軟件及IT基礎(chǔ)設(shè)施上的運維操作,如:啟動、重新啟動、掛起、停止、執(zhí)行腳本等。
03強大的容器管理和編排,構(gòu)建面向云原生架構(gòu)的自動化運維能力
云原生,微服務(wù),容器正日益成為主流的IT基礎(chǔ)設(shè)施形態(tài)。自動化運維不僅需要支持非云資源,云化資源,也需要支持云原生資源。
SmartCMP平臺通過統(tǒng)一的藍圖和服務(wù)模型,對云原生和微服務(wù)應(yīng)用提供強大的自動化運維能力。
同時深度集成Helm,并對Kubernetes上容器化應(yīng)用進行如下操作:
1)應(yīng)用程序封裝
2)版本管理
3)依賴檢查
4)應(yīng)用程序分發(fā)
此外,SmartCMP平臺將藍圖、流水線功能、Kubernetes集群和審批系統(tǒng)整合在一起,實現(xiàn)應(yīng)用跨集群、多階段自動化部署,并對應(yīng)用全生命周期進行管理。
04集成監(jiān)控告警和分析,構(gòu)建強大的自動修復(fù)自動化運維能力
IT資源變多,變復(fù)雜,出現(xiàn)問題的可能性也在變大,解決問題的難度也會隨之增加。這就需要自動化運維平臺不僅僅擁有創(chuàng)建和變更云資源,云服務(wù)的能力,還需要有強大的發(fā)現(xiàn)問題,解決問題的能力。
為了構(gòu)建完整的故障自愈體系,騫云SmartCMP擁有靈活的監(jiān)控和告警,故障分析、定位和修復(fù)能力。具體場景示例如下圖:
當監(jiān)控系統(tǒng)觸發(fā)事件是通過手動處理的方式時,平臺會使用自身的工單系統(tǒng)或者第三方集成的工單系統(tǒng),通過多種即時通訊軟件對運維人員進行告警通知。
當監(jiān)控系統(tǒng)觸發(fā)自動處理方式時,平臺能基于根據(jù)客戶定義的流程策略,實現(xiàn)系統(tǒng)的自愈能力,解決客戶只能通過手動處理告警的弊端,協(xié)助客戶往AIOps的方向改造。
SmartCMP平臺之所以能夠?qū)崿F(xiàn)強大的自愈能力,主要是因為SmartCMP平臺擁有全方位、細粒度的資源監(jiān)控, SmartCMP平臺提供的全方位監(jiān)控主要包括:
1)基礎(chǔ)設(shè)施層:物理機、虛擬機、容器、云主機和各類云資源等;
2)中間件層:數(shù)據(jù)庫、緩存和配置中心等各種系統(tǒng)軟件;
3)業(yè)務(wù)應(yīng)用層:應(yīng)用軟件、企業(yè)消息中間件等。
從上述數(shù)據(jù)源中,采集業(yè)務(wù)、應(yīng)用、系統(tǒng)軟件的的全方位指標進行建模分析,從而提供準確、智能、分級的告警機制。
SmartCMP平臺的自愈修復(fù)能力和變更能力,ITSM的工單,審批等有機融合,從而構(gòu)建完整的故障自愈能力。
05提供面向全體技術(shù)人員的自動化運維即服務(wù)能力
傳統(tǒng)自動化運維是IT專業(yè)運維人員的工具,簡化運維人員的人工操作。隨著數(shù)字化轉(zhuǎn)型的發(fā)展,IT的敏捷性也是整個企業(yè)敏捷性的關(guān)鍵。如何將面向運維人員的自動化運維能力,拓展的整個企業(yè)的技術(shù)人員的IT自動化服務(wù)能力,也是新型自動化運維系統(tǒng)的新需求。
騫云SmartCMP云管平臺將面向運維人員的自動化能力與自服務(wù)體系結(jié)合,通過規(guī)范流程、標準、策略,提供用戶云資源和云服務(wù)的自服務(wù),包括自助申請、審批,日常運維自助操作、監(jiān)控信息自助查詢、自助續(xù)租或回收資源等,從而將運維人員從重復(fù)運維工作解脫出來。
同時,越來越多的云資源,云服務(wù)申請和變更從運維人員執(zhí)行,到業(yè)務(wù)用戶執(zhí)行,再到各自業(yè)務(wù)場景自動觸發(fā),最典型的就是DevOps中的CICD過程。為了構(gòu)建面向企業(yè)的自動化運維即服務(wù)體系,SmartCMP也通過流水線融合了CICD流程,通過流水線可以非常方便的使用任意自動化運維能力,如下圖所示:
總結(jié)
自動化運維在云計算和企業(yè)數(shù)字化轉(zhuǎn)型的影響下,在運維對象,運維場景,服務(wù)對象等多方面都在發(fā)生本質(zhì)變化。騫云SmartCMP云管平臺能夠幫助企業(yè)構(gòu)建面向多云,云原生,DevOps,自服務(wù)的新型自動化運維體系,從而自動化一切可以自動化的人工分析和操作。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )