為什么5G核心網(wǎng)和電信云需要可觀測(cè)性?在過(guò)去的2021年,其實(shí)5G核心網(wǎng)在全球發(fā)生了多次影響范圍大、持續(xù)時(shí)間長(zhǎng)、社會(huì)影響廣的故障。2021年的4月份加拿大Rogers發(fā)生了一次長(zhǎng)達(dá)26個(gè)小時(shí)全國(guó)范圍的移動(dòng)通信網(wǎng)故障,故障發(fā)生后缺乏快速定位手段,導(dǎo)致故障難以在短時(shí)間內(nèi)定位、消除。
5G通信網(wǎng)的穩(wěn)定運(yùn)行是保障社會(huì)穩(wěn)定運(yùn)行的重要基礎(chǔ),而5G核心網(wǎng)則是5G通信網(wǎng)的樞紐和大腦,是整個(gè)通信網(wǎng)運(yùn)行、維護(hù)、保障的重中之中。通過(guò)以上事件可以感知5G核心網(wǎng)在運(yùn)行穩(wěn)定性上還有待提升,另一方面現(xiàn)有的故障監(jiān)測(cè)、快速定位、快速恢復(fù)能力存在短板。
5G核心網(wǎng)的運(yùn)維困境
云杉網(wǎng)絡(luò)通過(guò)對(duì)多個(gè)運(yùn)營(yíng)商的一線運(yùn)維技術(shù)人員調(diào)研和交流之后,發(fā)現(xiàn)現(xiàn)階段5G核心網(wǎng)的運(yùn)維痛點(diǎn)集中在:(1)云網(wǎng)絡(luò)“黑盒化”:(2)運(yùn)維技術(shù)難度高;(3)故障定責(zé)定界難;(4)云平臺(tái)面向業(yè)務(wù)的保障難。以下舉幾個(gè)實(shí)際例子。
例子一:當(dāng)PCF出問(wèn)題的時(shí)候,核心網(wǎng)運(yùn)維可能會(huì)聯(lián)系云平臺(tái)“我們這里的PCF1服務(wù)不正常,看到服務(wù)器上有告警,你們趕緊處理一下”,而云平臺(tái)運(yùn)維可能會(huì)覺(jué)得“服務(wù)器的告警好像和PCF的服務(wù)異常沒(méi)什么關(guān)系,是不是PCF軟件出問(wèn)題了?”
例子二:某個(gè)VNF升級(jí)之后,服務(wù)有異常,核心網(wǎng)運(yùn)維查了半天也找不出原因,最后看到虛擬機(jī)有告警,反饋給網(wǎng)絡(luò)云運(yùn)維后,很可能得到這樣的反饋“升級(jí)前后都有相同的告警,升級(jí)前沒(méi)有問(wèn)題,是不是你們新版本軟件的原因?”
追究其原因,5G核心網(wǎng)和電信云是通過(guò)通用x86+云技術(shù)、容器技術(shù),提供軟硬解耦的解決方案,穩(wěn)定性不確定,更多的需要依靠云、容器的動(dòng)態(tài)、彈性能力提供相對(duì)的可靠性。同時(shí),5G核心網(wǎng)完全承載在一個(gè)Overlay疊加Underlay的網(wǎng)絡(luò)上,網(wǎng)元內(nèi)部復(fù)雜的微服務(wù)通過(guò)一個(gè)Full-Mesh的網(wǎng)絡(luò)互聯(lián),網(wǎng)元之間的邊界不清晰、路徑不清晰,網(wǎng)絡(luò)基本處于“黑盒”狀態(tài)。由此也不難看出:可觀測(cè)性對(duì)5G核心網(wǎng)的可靠性運(yùn)行非常重要!
近幾年,云原生可觀測(cè)性已經(jīng)成為IT領(lǐng)域解決業(yè)務(wù)可靠性的重要理論,“可觀測(cè)性=可靠性”基本成為IT運(yùn)維的共同認(rèn)知。所謂云原生可觀測(cè)性,簡(jiǎn)單來(lái)說(shuō)就是快速有效的診斷復(fù)雜業(yè)務(wù)系統(tǒng)內(nèi)部的運(yùn)行狀態(tài)。經(jīng)過(guò)近十年的發(fā)展,云杉網(wǎng)絡(luò)從SDN核心技術(shù)逐步走向網(wǎng)絡(luò)自動(dòng)化和可觀測(cè)性,致力解決云原生應(yīng)用診斷難的核心痛點(diǎn),其中DeepFlow產(chǎn)品在各行各業(yè)積累了大量的實(shí)戰(zhàn)經(jīng)驗(yàn),成功幫助數(shù)家企業(yè)構(gòu)建多維度、一體化的可觀測(cè)性平臺(tái)。
DeepFlow幫助5G核心網(wǎng)和電信云構(gòu)建可觀測(cè)性
DeepFlow是一款面向5G核心網(wǎng),應(yīng)對(duì)網(wǎng)絡(luò)功能服務(wù)(NFS)解耦后的新挑戰(zhàn),進(jìn)行網(wǎng)絡(luò)流量采集、分發(fā)、可視化與監(jiān)控保障的產(chǎn)品。幫助運(yùn)營(yíng)商在5G核心網(wǎng)基于服務(wù)架構(gòu)中統(tǒng)一采集網(wǎng)絡(luò)、系統(tǒng)、應(yīng)用的可觀測(cè)指標(biāo)數(shù)據(jù),并動(dòng)態(tài)關(guān)聯(lián)其資源、服務(wù)、業(yè)務(wù)、事件等屬性,實(shí)現(xiàn)對(duì)5G核心網(wǎng)全景性能監(jiān)控;并提供容器化后網(wǎng)元服務(wù)間訪問(wèn)調(diào)用的全棧鏈路追蹤,幫助構(gòu)建5G核心網(wǎng)可觀測(cè)性能力,應(yīng)對(duì)云原生特點(diǎn),緊密結(jié)合5G服務(wù),解決5G核心網(wǎng)生產(chǎn)中遇到的監(jiān)控、運(yùn)維、保障等難題。
1.多維度、深層次5G核心網(wǎng)全景性能監(jiān)控
在5G核心網(wǎng)中,自身運(yùn)行的網(wǎng)絡(luò)IP節(jié)點(diǎn)數(shù)量已經(jīng)百倍以上規(guī)模的增長(zhǎng),容器化微服務(wù)POD形成一個(gè)Full-Mesh的網(wǎng)絡(luò),網(wǎng)絡(luò)的虛擬化、彈性變化,使得整個(gè)5G核心網(wǎng)的內(nèi)部網(wǎng)絡(luò)“黑盒化”。
對(duì)5G核心網(wǎng)來(lái)說(shuō),可以通過(guò)DeepFlow的采集器技術(shù),實(shí)現(xiàn)網(wǎng)絡(luò)+應(yīng)用的全面可觀測(cè)性,不用再依賴5GC開(kāi)發(fā)廠商的日志輸出能力、指標(biāo)輸出能力、用戶追蹤數(shù)據(jù)輸出能力。同時(shí)借助DeepFlow強(qiáng)大的數(shù)據(jù)分析能力,可以對(duì)5G核心網(wǎng)網(wǎng)元、云平臺(tái),從宏觀到微觀、不同層次、不同維度的全景性能監(jiān)控。
比如,云平臺(tái)運(yùn)維人員:可以從全網(wǎng)宿主機(jī)的觀測(cè)視圖,監(jiān)測(cè)云資源池、宿主機(jī)之間的流量互訪拓?fù)?、業(yè)務(wù)訪問(wèn)性能;可以從單網(wǎng)元的宿主機(jī)觀測(cè)視圖,監(jiān)測(cè)某個(gè)網(wǎng)元(比如AMF或SMF)的VNF軟件內(nèi)部的微服務(wù)/模塊在宿主機(jī)上的分布情況,在宿主機(jī)之間的互訪拓?fù)洹⒒ピL性能,快速發(fā)現(xiàn)宿主機(jī)維度的異常情況。
比如,核心網(wǎng)運(yùn)維人員:通過(guò)VNF網(wǎng)元的維度,觀測(cè)全網(wǎng)VNF網(wǎng)元SBI口的業(yè)務(wù)互訪關(guān)系和業(yè)務(wù)互訪性能;通過(guò)VNF網(wǎng)元內(nèi)部的微服務(wù)POD維度,觀測(cè)VNF網(wǎng)元內(nèi)部POD粒度的互訪關(guān)系、互訪性能;通過(guò)POD到POD的網(wǎng)絡(luò)全棧鏈路追蹤,觀測(cè)任意一次客戶端到服務(wù)端在云網(wǎng)絡(luò)中的流量流轉(zhuǎn)路徑。
2.跨層、逐段分解網(wǎng)絡(luò)全棧鏈路追蹤
DeepFlow的網(wǎng)絡(luò)全棧鏈路追蹤,是解決5G核心網(wǎng)、云平臺(tái)之間快速跨層故障定界的關(guān)鍵能力,將虛擬化所實(shí)現(xiàn)的邏輯通信進(jìn)行逐步展開(kāi),清晰展示每段的網(wǎng)絡(luò)狀態(tài)、性能,結(jié)合知識(shí)圖譜及豐富的指標(biāo)數(shù)據(jù),快速定位性能異常的問(wèn)題范圍邊界。
對(duì)于5G核心網(wǎng)和電信云平臺(tái)的運(yùn)維人員來(lái)說(shuō),目前最頭痛事情就是故障的跨層定界,通過(guò)DeepFlow跨層的網(wǎng)絡(luò)全棧鏈路追蹤,可以非常迅速的確定某一次業(yè)務(wù)訪問(wèn)是否有丟包、時(shí)延問(wèn)題,并快速確定故障發(fā)生的位置,從而在云平臺(tái)和軟件層之間做快速的定界、定位。
3.業(yè)務(wù)訪問(wèn)從應(yīng)用到網(wǎng)絡(luò)端到端追蹤
除了全棧鏈路追蹤,DeepFlow對(duì)每一次業(yè)務(wù)訪問(wèn)的應(yīng)用層實(shí)現(xiàn)了應(yīng)用+網(wǎng)絡(luò)的端到端追蹤。運(yùn)維人員可以通過(guò)系統(tǒng)檢索、分析、追蹤任意一次訪問(wèn),快速洞察應(yīng)用異常。“從客戶端進(jìn)程——>服務(wù)1進(jìn)程——>服務(wù)2進(jìn)程——>……——>服務(wù)n”的端到端服務(wù)調(diào)用關(guān)系,每一段服務(wù)調(diào)用的時(shí)延、異常均實(shí)現(xiàn)了關(guān)聯(lián)分析,包括每一段服務(wù)調(diào)用的流量在云網(wǎng)絡(luò)中的關(guān)鍵路徑及時(shí)延指標(biāo)關(guān)聯(lián)分析,可以說(shuō)DeepFlow實(shí)現(xiàn)了應(yīng)用+網(wǎng)絡(luò)統(tǒng)一的可觀測(cè)性,并且深入且細(xì)致到每一次業(yè)務(wù)訪問(wèn)的粒度。
在5G核心網(wǎng)領(lǐng)域,監(jiān)控、運(yùn)維、保障都是新難題,作為一家IT網(wǎng)絡(luò)解決方案廠商,云杉網(wǎng)絡(luò)將加大創(chuàng)新力度,重點(diǎn)發(fā)展5G方面的業(yè)務(wù),持續(xù)為中國(guó)5G高質(zhì)量發(fā)展貢獻(xiàn)力量。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )