讓監(jiān)控“動”起來,日志易新品觀察易深度實現(xiàn)可觀察性

前不久,日志易技術(shù)副總裁黃俊毅在GOPS全球運(yùn)維大會上發(fā)表了《基于業(yè)務(wù)鏈數(shù)據(jù)的可觀察性實踐》主題演講,詳盡介紹了可觀察性的發(fā)展由來并以實踐角度剖析了日志易可觀察性監(jiān)控平臺——觀察易,引起了多方關(guān)注。

黃俊毅提到,可觀察性的概念起源于工業(yè)領(lǐng)域,在該領(lǐng)域中,可觀察性被定義為從系統(tǒng)外部輸出推斷系統(tǒng)內(nèi)部健康狀態(tài)的能力。

據(jù)了解,Twitter工程師 Cindy Sridharan 在2017年發(fā)表的《Monitoring and Observability》一文中,首次將 Observability 一詞帶入開發(fā)者的視野。在軟件產(chǎn)品和服務(wù)領(lǐng)域,可觀察性則是指從應(yīng)用系統(tǒng)中收集盡可能多的遙測數(shù)據(jù),以便可以調(diào)查和解決新出現(xiàn)的復(fù)雜問題,確保企業(yè)能夠主動觀察系統(tǒng),在影響客戶體驗之前解決故障及問題,安全地進(jìn)行測試并實施優(yōu)化,更好地管理和控制業(yè)務(wù)風(fēng)險。

由此,可觀察性可以被視為系統(tǒng)的一個屬性,與功能性、安全性相似。

在Cindy Sridharan 提出可觀察性之前,谷歌著名的 SRE 體系就已經(jīng)為可觀察性奠定了理論基礎(chǔ),也就是說在微服務(wù)、可觀察性等概念出現(xiàn)以前,業(yè)內(nèi)通常稱之為監(jiān)控。其中, Google SRE 特別強(qiáng)調(diào)白盒監(jiān)控的重要性,而將當(dāng)時技術(shù)圈常用的黑盒監(jiān)控放在了相對次要的位置,而白盒監(jiān)控正應(yīng)和了可觀察性中“主動”的概念。

可觀察性與監(jiān)控經(jīng)常被混淆或互換,那么它們之間究竟是何關(guān)系呢?

讓監(jiān)控“動”起來,日志易新品觀察易深度實現(xiàn)可觀察性

圖一:可觀察性與監(jiān)控的異同

黃俊毅解釋道,監(jiān)控接收告警,同時反饋系統(tǒng)正常工作的部分;可觀察性則更加關(guān)注系統(tǒng)停止或減慢工作的原因。如圖一所示,傳統(tǒng)的運(yùn)維可能只能展示最頂層的“告警”和“概況”,當(dāng)應(yīng)用系統(tǒng)宕機(jī)時,運(yùn)維需要更深層次的錯誤信息排錯,則需要收集更多信息,利用動態(tài)分析手段去查明服務(wù)狀態(tài)及之間的關(guān)聯(lián)關(guān)系。

讓監(jiān)控“動”起來,日志易新品觀察易深度實現(xiàn)可觀察性

圖二:可觀察性三大支柱

如圖二所示,可觀察性是由日志、指標(biāo)和鏈路追蹤三大支柱構(gòu)建的,即遙測數(shù)據(jù)可以精簡為日志,指標(biāo)和鏈路追蹤。黃俊毅強(qiáng)調(diào),以上三種形式的組合使用將會產(chǎn)生豐富的觀察數(shù)據(jù),日志易由此推出了國產(chǎn)自研可觀察性監(jiān)控平臺——觀察易。

讓監(jiān)控“動”起來,日志易新品觀察易深度實現(xiàn)可觀察性

圖三:觀察易——日志易可觀察性監(jiān)控平臺

基于日志易平臺,觀察易是一個能夠從業(yè)務(wù)、服務(wù)、接口、設(shè)備四層維度對應(yīng)用系統(tǒng)進(jìn)行分析的可觀察性監(jiān)控平臺。在接入基礎(chǔ)監(jiān)控指標(biāo)和業(yè)務(wù)分析日志數(shù)據(jù)后,觀察易能夠通過梳理業(yè)務(wù)層面的依賴關(guān)系,展現(xiàn)出全面準(zhǔn)確的可觀察性內(nèi)容,幫助客戶了解并實時監(jiān)控應(yīng)用系統(tǒng)運(yùn)行狀態(tài)。

觀察易加強(qiáng)了日志、鏈路、指標(biāo)的三大可觀察性支柱間的關(guān)聯(lián),從而縮短了發(fā)現(xiàn)并解決問題的時間。

“運(yùn)維監(jiān)控是觀察易的立身之本”,黃俊毅提到,在「業(yè)務(wù)至上」的互聯(lián)網(wǎng)時代,DevOps需要持續(xù)監(jiān)控業(yè)務(wù)狀態(tài),當(dāng)故障發(fā)生時需要快速找到根因并進(jìn)行修復(fù)。觀察易能夠從業(yè)務(wù)維度對業(yè)務(wù)的平均耗時、請求量、錯誤數(shù)、成功率四個黃金指標(biāo)進(jìn)行監(jiān)控,也可以從服務(wù)和接口維度對業(yè)務(wù)的整體狀態(tài)進(jìn)行分析。另外,觀察易也提供和業(yè)務(wù)無關(guān)的服務(wù)監(jiān)控、接口分析和設(shè)備監(jiān)控,實現(xiàn)更全面的系統(tǒng)可觀察性。

高效的動態(tài)鏈路追蹤則是觀察易的招牌功能。伴隨企業(yè)IT由傳統(tǒng)架構(gòu)向分布式微服務(wù)架構(gòu)轉(zhuǎn)型,復(fù)雜單體應(yīng)用被拆分為多個輕量級服務(wù)。由于服務(wù)間的獨(dú)立性,一筆業(yè)務(wù)會涉及到多個微服務(wù)系統(tǒng)。觀察易可對接trace日志,實現(xiàn)業(yè)務(wù)鏈路追蹤,通過觀察易的拓?fù)鋱D、歷史回溯和指標(biāo)趨勢圖了解業(yè)務(wù)詳情,快速定位故障,讓IT運(yùn)維人員更準(zhǔn)確、高效地掌握微服務(wù)環(huán)境下業(yè)務(wù)的運(yùn)行狀態(tài)。

此外,觀察易還具備強(qiáng)大的指標(biāo)探索和故障定位能力。從業(yè)務(wù)、服務(wù)、設(shè)備角度來說,側(cè)重的是黃金指標(biāo)可觀察性,如果需要關(guān)聯(lián)黃金指標(biāo)對比觀察或需要關(guān)注黃金指標(biāo)以外的其他指標(biāo)時,運(yùn)維人員可以使用觀察易的指標(biāo)探索功能對時序數(shù)據(jù)進(jìn)行單指標(biāo)多維度(平均值、最大值、最小值等)或多指標(biāo)多維度查詢、分析并實現(xiàn)可視化。觀察易能夠提供標(biāo)準(zhǔn)的起點(diǎn)或圖表來幫助運(yùn)維人員查找問題,分別從業(yè)務(wù)、服務(wù)、設(shè)備的概覽追蹤到其詳情,進(jìn)而結(jié)合調(diào)用鏈的span信息或其他日志信息定位到故障原因。

讓監(jiān)控“動”起來,日志易新品觀察易深度實現(xiàn)可觀察性

圖四:觀察易實現(xiàn)價值

在安全性方面,觀察易是國產(chǎn)技術(shù)創(chuàng)新廠商日志易自研的監(jiān)控平臺,搭載了其自研的高性能數(shù)據(jù)搜索引擎Beaver和低代碼編程語言SPL(Search Processing Language)。據(jù)了解,日志易已經(jīng)加入了信息技術(shù)應(yīng)用創(chuàng)新工作委員會,并且成立了信創(chuàng)團(tuán)隊。黃俊毅還介紹道,觀察易發(fā)布于2020年10月,目前已經(jīng)成功被數(shù)十家關(guān)鍵行業(yè)客戶采購并安排部署。接下來,日志易將加大力度推動觀察易部署落地,以“業(yè)務(wù)、服務(wù)、接口、設(shè)備”四大維度為突破口,助力更多企業(yè)實現(xiàn)IT可觀察性,加快數(shù)字化轉(zhuǎn)型進(jìn)程。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )