導(dǎo)讀:移動互聯(lián)時代,企業(yè)都面臨著海量數(shù)據(jù)帶來的挑戰(zhàn),有一些企業(yè)馴服了海量數(shù)據(jù),實現(xiàn)了“存的下、算的出”,但即使如此,這些企業(yè)很少跨過數(shù)據(jù)保護(hù)的門檻,因為傳統(tǒng)數(shù)據(jù)保護(hù)技術(shù)在面對PB級別數(shù)據(jù)量時,都或多或少的出現(xiàn)了問題,浪潮工程師開發(fā)了分級保護(hù)方案,很好的滿足了100PB級別的數(shù)據(jù)保護(hù)需求。
PB數(shù)據(jù)量挑戰(zhàn)傳統(tǒng)數(shù)據(jù)保護(hù)技術(shù)
提到數(shù)據(jù)保護(hù)和容災(zāi),很多人都會想到備份技術(shù)、存儲復(fù)制技術(shù)、數(shù)據(jù)卷復(fù)制技術(shù)、數(shù)據(jù)庫日志傳輸?shù)?,但是這些傳統(tǒng)技術(shù)沒法適應(yīng)海量數(shù)據(jù)環(huán)境。數(shù)PB乃至數(shù)十PB規(guī)模的數(shù)據(jù),是傳統(tǒng)數(shù)據(jù)保護(hù)技術(shù)和容災(zāi)技術(shù)在設(shè)計和形成之初,所不能想象的。這些技術(shù)適用于百TB以下數(shù)據(jù)規(guī)模,大多數(shù)不能做到實時保護(hù),容災(zāi)數(shù)據(jù)日常處于離線或不可訪問狀態(tài),難以滿足大數(shù)據(jù)的應(yīng)用需求。
勉強部署這些技術(shù)在海量數(shù)據(jù)環(huán)境下,災(zāi)難恢復(fù)、可用性、穩(wěn)定性等技術(shù)表現(xiàn)也會大打折扣。拿傳統(tǒng)備份技術(shù)來說,日常演練/驗證,數(shù)據(jù)需要重新加載,PB級數(shù)據(jù)環(huán)境下,加載時間往往是數(shù)天、甚至數(shù)周,若容災(zāi)數(shù)據(jù)不能進(jìn)行有效的日常驗證,整個容災(zāi)架構(gòu)的可靠性和實用性會急劇下降,所以在很多場景中,傳統(tǒng)方案僅限于方案,不能實際部署。
數(shù)據(jù)分級解決大數(shù)據(jù)容災(zāi)問題
OpenStack、Hadoop、Spark等目前主流的云和大數(shù)據(jù)平臺,數(shù)據(jù)可靠性主要通過存儲子系統(tǒng)的副本和糾刪碼等技術(shù)來保證,這些技術(shù)只能保證本地數(shù)據(jù)安全可靠,沒法應(yīng)對人為破壞、物理/邏輯故障、站點故障等情況,需要增加歷史數(shù)據(jù)保護(hù)和遠(yuǎn)距離容災(zāi)保護(hù)。
大數(shù)據(jù)平臺80%左右都是原始數(shù)據(jù),這些數(shù)據(jù)經(jīng)過數(shù)據(jù)清洗、治理形成平臺的標(biāo)準(zhǔn)資源庫數(shù)據(jù),這個環(huán)節(jié)是一個海量數(shù)據(jù)結(jié)構(gòu)化的過程,隨后,根據(jù)上層業(yè)務(wù)應(yīng)用需求,由標(biāo)準(zhǔn)資源庫快速派生出多個主題庫、專題庫等,這些數(shù)據(jù)庫就直接對接上層應(yīng)用了。
海量數(shù)據(jù)保護(hù)需要在深入了解業(yè)務(wù)模型和數(shù)據(jù)屬性的技術(shù)上,對這些數(shù)據(jù)進(jìn)行分級保護(hù),根據(jù)重要程度等技術(shù)指標(biāo),執(zhí)行不同的保護(hù)策略,避免了成本高、技術(shù)難落地等實際問題。
數(shù)據(jù)分級保護(hù)
一個案例——50PB數(shù)據(jù)的保護(hù)
分級僅是海量數(shù)據(jù)保護(hù)的方案框架,具體方案需要針對客戶的具體應(yīng)用場景進(jìn)行設(shè)計,所以我們以剛剛成功上線的一個案例來詳細(xì)展開。
該用戶的數(shù)據(jù)量屬于超大規(guī)模級別,在全省有11個大數(shù)據(jù)分中心,1個大數(shù)據(jù)總中心,各個中心采集自己區(qū)域的原始數(shù)據(jù),生成本地的標(biāo)準(zhǔn)資源庫,然后根據(jù)各自需求生成本地的主題庫、專題庫等,承接本地上層的應(yīng)用;同時,各分中心傳輸本地的標(biāo)準(zhǔn)資源庫至總中心,匯聚為全省的標(biāo)準(zhǔn)資源庫,生成相關(guān)主題庫、專題庫,具備承接全省范圍內(nèi)業(yè)務(wù)需求的能力,12個中心數(shù)據(jù)總量接近50PB。
數(shù)據(jù)分析——50PB數(shù)據(jù)保護(hù)1PB即可
用戶希望建立有效的容災(zāi)機制,防范物理、邏輯、站點等故障。根據(jù)上文所述的原則,需要先對客戶的數(shù)據(jù)進(jìn)行分類,根據(jù)不同的重要程度采取不同的數(shù)據(jù)保護(hù)技術(shù)。
首先是原始數(shù)據(jù),這些數(shù)據(jù)可再生,而且據(jù)經(jīng)過熱度訪問期后,便成為冷數(shù)據(jù),價值低,規(guī)模大,不必采用額外的保護(hù)技術(shù);其次是,標(biāo)準(zhǔn)資源庫數(shù)據(jù),這些庫數(shù)據(jù)是大數(shù)據(jù)平臺的初次結(jié)果數(shù)據(jù),含金量很高,是用戶大數(shù)據(jù)環(huán)境的核心數(shù)據(jù),不易重建,有很強的數(shù)據(jù)保護(hù)和容災(zāi)需求,然后是各類主題庫、專題庫等數(shù)據(jù),這些庫數(shù)據(jù)由標(biāo)準(zhǔn)資源庫數(shù)據(jù)經(jīng)過二次加工派生出而出,并支持快速重建,發(fā)生問題可以在用戶要求的RTO(復(fù)原時間目標(biāo))內(nèi)完成重建,因而這類數(shù)據(jù)也不需要額外容災(zāi)保護(hù)。最后則是各中心間冗余數(shù)據(jù),顯然這些數(shù)據(jù)不需要容災(zāi)保護(hù)
綜上,本項目僅需要為總中心的全量標(biāo)準(zhǔn)資源庫數(shù)據(jù)進(jìn)行容災(zāi)保護(hù),數(shù)據(jù)量約1PB。
應(yīng)用方案——3條傳輸通路冗余、計算存儲分離
浪潮為用戶設(shè)計了異地容災(zāi)方案,將方案按照客戶要求部署在分?jǐn)?shù)據(jù)中心10中??傊行牡娜繕?biāo)準(zhǔn)資源庫有1PB結(jié)構(gòu)化數(shù)據(jù),每日數(shù)據(jù)變化量為30TB~50TB,所以,異地容災(zāi)架構(gòu)中數(shù)據(jù)傳輸技術(shù)要支持高頻率周期性傳輸和實時傳輸模式,將增量數(shù)據(jù)復(fù)制過來,根據(jù)生產(chǎn)環(huán)境的壓力變化兩種傳輸技術(shù)可以靈活組合,保證異地容災(zāi)大數(shù)據(jù)平臺為在線狀態(tài),日??梢詫崟r查詢數(shù)據(jù)、驗證數(shù)據(jù)。所以,容災(zāi)數(shù)據(jù)傳輸采用ETL定制化工具,這種數(shù)據(jù)傳輸技術(shù)與大數(shù)據(jù)平臺有著天然的親和性,高速穩(wěn)定、成熟可靠,目前,容災(zāi)方案可以保證RPO≤1小時,RTO≤2小時。
最后,容災(zāi)中心大數(shù)據(jù)平臺,采用計算和存儲分離的部署模式,容災(zāi)存儲采用企業(yè)級分布式存儲,并和上層大數(shù)據(jù)平臺對接,使方案具備很強的數(shù)據(jù)湖特性:容災(zāi)數(shù)據(jù)可以靈活的分配給非大數(shù)據(jù)平臺環(huán)境,支持容災(zāi)數(shù)據(jù)在不同類型的業(yè)務(wù)系統(tǒng)間共享,避免數(shù)據(jù)再次復(fù)制過程,最大化數(shù)據(jù)價值。
以下為容災(zāi)方案技術(shù)架構(gòu)圖:
容災(zāi)方案技術(shù)架構(gòu)圖
本項目在總中心部署3臺ETL服務(wù)器(后續(xù)計劃在容災(zāi)中心也部署3臺,實現(xiàn)ETL服務(wù)器的站點互備架構(gòu)),形成三條邏輯冗余的數(shù)據(jù)傳輸通道,從總中心大數(shù)據(jù)平臺抽取標(biāo)準(zhǔn)資源庫全量數(shù)據(jù)至容災(zāi)中心,之后進(jìn)行差量數(shù)據(jù)復(fù)制,容災(zāi)中心數(shù)據(jù)和生產(chǎn)中心數(shù)據(jù)保持一定的時間差異,可以提升防范邏輯數(shù)據(jù)故障的能力。
容災(zāi)中心,日常主要工作為接收總中心標(biāo)準(zhǔn)資源庫數(shù)據(jù),并提供數(shù)據(jù)查詢、驗證服務(wù)、低頻運行臨時分配的作業(yè)任務(wù),根據(jù)建設(shè)目標(biāo),此平臺配置和生產(chǎn)中心標(biāo)準(zhǔn)資源庫同量存儲資源,但不需配置同等的計算資源,所以,本方案采用30臺服務(wù)器(約為總中心大數(shù)據(jù)平臺計算力的10%)、40臺高密存儲節(jié)點(配置海量數(shù)據(jù)存儲池,提供4PB可用容量,實現(xiàn)未來三年的容量預(yù)留)搭建大數(shù)據(jù)容災(zāi)平臺。30臺服務(wù)器包括1臺管理節(jié)點、2臺主服務(wù)節(jié)點以及27臺數(shù)據(jù)節(jié)點,平臺服務(wù)組件采用高可靠主備模式,防止單節(jié)點故障問題。海量存儲池采用糾刪數(shù)據(jù)冗余機制,保證可靠性和空間利用率,海量存儲池,被上層大數(shù)據(jù)平臺管理,隨著容災(zāi)數(shù)據(jù)的快速增長,可以實現(xiàn)在不擴容平臺計算資源的條件下,在線擴展其容量至數(shù)百PB,滿足用戶后期數(shù)據(jù)的快速增長需求。
Hadoop容災(zāi)平臺
結(jié)語,海量數(shù)據(jù)將是企業(yè)新常態(tài)
目前全球數(shù)據(jù)量約為44ZB,到2025年會上升至163ZB,也就是說,數(shù)據(jù)的高速增長將成為越來越多的企業(yè)面臨的常態(tài)化問題,而不是新挑戰(zhàn)。在可見的時間內(nèi),網(wǎng)絡(luò)等方面的技術(shù)條件都不足以使得企業(yè)進(jìn)行全面不加取舍的數(shù)據(jù)保護(hù),分級保護(hù)將成為越來越多用戶的選擇,希望這個案例能夠給更多的企業(yè)用戶提供良好的借鑒范例。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。