中國多主數據庫:壓強投入,期待破繭

拿破侖曾說:“戰(zhàn)爭的藝術就是在某一點上集中最大優(yōu)勢兵力”,強調了力量集中的重要性。

如今,國際形勢風云變幻,西方世界對中國的圍剿不再僅僅體現在軍事和地緣政治上,而更多表現在經濟與科技上。在科技領域,我們不得不再面臨一次從根技術、硬件到軟件的全面突圍戰(zhàn)爭;而無數戰(zhàn)略家總結的“集中力量突破一處”策略,仍是值得中國科技界借鑒的獲勝密碼。

中國數據庫產業(yè)突圍之戰(zhàn)

中國大地人杰地靈,自古以來,在一個領域發(fā)展早期,我國一定會出現百家爭鳴、百花齊放的場面。近10年來,中國數據庫產業(yè)迎來了黃金時代,從互聯(lián)網掀起的“去IOE”浪潮又開辟了新的架構賽道,使數百家數據庫企業(yè)噴涌而出;作為IT系統(tǒng)中最核心的軟件之一,相關行業(yè)標準的出臺也為中國數據庫發(fā)展帶來重大利好。

然而,正如不是每一次創(chuàng)新都能帶來產業(yè)革命,當前繁榮發(fā)展的背后也隱藏著隱憂;隨著經濟下行周期的到來,中國數據庫需要盡快在業(yè)務落地上找到突破口。

金融業(yè)數據庫使用情況一直是數據庫產業(yè)發(fā)展的風向標。1998年,IBM DB2、Informix在金融核心系統(tǒng)落地商用,奠定了此后20年大小機在核心系統(tǒng)的格局;如今,金融業(yè)成為大小機下移的急先鋒。隨著近年來數據庫國產化工作推進,中國數據庫在金融業(yè)IT系統(tǒng)規(guī)模增速喜人,但質量仍存在隱患。

據金融信息化研究所2022年編撰的《金融業(yè)數據庫供應鏈安全發(fā)展報告》顯示,當前銀行業(yè)辦公系統(tǒng)與一般系統(tǒng)中國數據庫使用比例已突破50%,但在核心系統(tǒng)使用比例仍在15%左右;而在證券和保險業(yè),非核心系統(tǒng)中國數據庫使用比例均低于30%,核心系統(tǒng)低于20%。

需知核心系統(tǒng)與非核心系統(tǒng)數據庫采購價格有倍數差異,無法突破核心系統(tǒng)可能使許多數據庫廠商難以形成商業(yè)正循環(huán),最終影響到其業(yè)務連續(xù)性;而金融行業(yè)對中國數據庫的投資占整體的46%,如果在金融業(yè)內數據庫廠商無法商業(yè)正向閉環(huán),在其它行業(yè)“找補”將更加艱難。

中國數據庫市場內卷也是構成危機的主要因素。據信通院2022年編撰的《數據庫發(fā)展研究報告》統(tǒng)計,中國數據庫廠商數量占全球總量的32%,是除美國外全球第二大數據庫廠商發(fā)源地;但中國數據庫市場規(guī)模只占全球的5.2%。“僧多粥少”的局面加上廠商間核心技術“大同小異”的特點,導致在競標中各中國數據庫難免陷入低價競爭,進一步加深商業(yè)難以正向閉環(huán)的惡性循環(huán)。

近年來不時傳出中國數據庫廠商因項目虧損導致不得不對客戶“停服”的不良事件,一方面損害了行業(yè)對中國數據庫的信任度,另一方面也打擊了資本市場對產業(yè)向好發(fā)展的信心。

總體來講,當前中國數據庫雖有強勢發(fā)展勁頭,但從關鍵行業(yè)應用情況及市場發(fā)展趨勢來看,仍面臨產業(yè)突圍的關鍵戰(zhàn)斗。

多主數據庫或是突圍關鍵缺口

事實上,中國數據庫并非沒有出海的野心。OceanBase曾在菲律賓第一大電子錢包GCash有過成功案例。但在非互聯(lián)網行業(yè)的交易型數據庫領域,在“自家園子”尚未成功戰(zhàn)勝Oracle、DB2等廠商的中國數據庫,尚無信心面對出海后更加腥風血雨的競爭。萬丈高樓平地起,中國數據庫產業(yè)突圍的方向仍是不斷提升自身實力。

然而,提升自己同樣需要找到方向。西方數據庫系統(tǒng)廠商起步遠遠早于國內,在引擎、管理系統(tǒng)乃至算法等方向均有深厚技術積累;雖然MySQL和PostgreSQL的開源化幫助其它廠商拉近了技術代差,但實際產品水平仍有不小差距。更難拉近的是使用經驗上的鴻溝,因為軟件的催熟往往是靠著大量用戶反饋來完成的,而缺少使用體驗與反饋的中國數據庫必然會有更多的Bug和更少的功能,使最終用戶的使用體驗差距更大。

總體來說,數據庫產業(yè)是一個優(yōu)勢積累型的市場,一味追趕永遠無法實現領先,唯有通過革命性創(chuàng)新開辟新賽道,才有機會改變格局。如今,這一革命性創(chuàng)新似乎已經顯現,這就是多主數據庫。

什么是多主數據庫?簡單來說,就是集群中所有節(jié)點可以同時讀寫數據。傳統(tǒng)基于數據分片實現節(jié)點同時讀寫的數據庫,在某一時刻能夠讀寫某一個分片的節(jié)點仍只有一個,其本質仍是“一主多備”的架構;而多主數據庫中,任何數據分片都能在任何時刻被所有節(jié)點并發(fā)讀寫。這樣做的顯著好處是線性提升了數據庫的并發(fā)度,使數據庫性能可以沒有瓶頸的橫向擴展;而分片型數據庫的性能嚴重依賴分片策略,如果某個分片訪問頻度過高則將導致性能瓶頸。

此外,多主數據庫還有穩(wěn)定時延、節(jié)省資源、提升運維效率等優(yōu)勢。早在上個世紀80年代,數據庫產業(yè)就興起了對多主數據庫的研究,但至今穩(wěn)定商用案例仍只有Oracle RAC,這也支撐它成為關系型數據庫的絕對王者。當前多主數據庫賽道還有大量空間,一旦取得突破,數據庫產業(yè)格局仍有顛覆的可能性。

筆者認為多主數據庫是中國數據庫的一個關鍵突破口。對于多主數據庫來說,單機能力與集群規(guī)模是其一體兩面,二者可以相互彌補,這給予中國數據庫以規(guī)模換性能的重要機會。

從過去二十年發(fā)展看,中國數據庫產業(yè)發(fā)展大方向就是集群化。由于數據庫單機性能瓶頸,加上國內互聯(lián)網市場高度發(fā)達帶來高并發(fā)訴求凸顯,中國數據庫大都往不斷擴大集群規(guī)模的方向發(fā)展,也因此在集群數據管理上積累了豐富經驗。

然而,不改變主從數據庫的本質,集群規(guī)模擴大反而會導致事務處理時延增加,無法真正提升交易性能;而多主數據庫可以在提升并發(fā)度的同時不影響事務效率,進而真正激發(fā)出集群威力。

近年來的產業(yè)動態(tài)也證明了這一點。早在2022年3月,阿里云就發(fā)布了其基于存算分離的多主架構PolarDB方案;2023年3月,華為宣布其基于存算分離和自研Cantian引擎,可幫助主備數據庫升級多主架構,并于同年9月將Cantian引擎正式開源;9月的DTCC數據庫技術大會上,優(yōu)炫軟件正式發(fā)布其基于共享存儲的數據庫多讀多寫方案,萬里數據庫也解讀了其通過Cantian引擎實現GreatDB多主架構的最新進展;10月,金融數據庫技術大會上,金融信息化研究所攜10家中國數據庫產業(yè)鏈領軍企業(yè),共同啟動金融多主數據庫應用推進計劃??梢哉f,中國數據庫產業(yè)已經全面瞄準多主架構這一關鍵缺口,開啟了一場轟轟烈烈的突圍戰(zhàn)爭了。

突圍關鍵:集中力量于一個缺口

雖然方向明確,但突破多主數據庫依然困難重重。多主數據庫完全實現穩(wěn)定商用乃至國際領先,還有許多技術難題需要攻克。

比如,多主數據庫節(jié)點間如何高效的交換緩存數據,這是事務的隔離性能否保障的關鍵;再比如,當集群規(guī)模擴大后,多主集群內如何高效管理,節(jié)點故障如何防止腦裂;還有多主集群使用的共享存儲能否應對整個集群的高并發(fā)訪問,能否承擔一些近數據計算工作以緩解計算集群壓力等等。每一個問題放眼全球數據庫產業(yè)都沒有“標準答案“可以借鑒,我們需要“摸著石頭過河”。

事實上,“摸著石頭過河”對中國科技界不是新鮮事,我們在很多科技領域都已探索至無人區(qū),依然能夠實現突破性創(chuàng)新。但以當前中國數據庫產業(yè)陣型來看,在多主數據庫之路迅速取得突破恐怕難言輕易。由于數據庫產品具有極強的商業(yè)屬性,難以像其它尖端技術領域由國家牽頭研發(fā),導致中國數據庫從業(yè)人數眾多,但力量分散,任何一個廠商都難以獨自攻克多主數據庫難題。

據信通院統(tǒng)計,中國43%的數據庫企業(yè)人數小于50人,只有前9%的企業(yè)擁有50-200人的核心研發(fā)團隊;而交換機、存儲等多主數據庫必須的硬件基礎設施產業(yè),也尚未與數據庫產業(yè)實現廣泛的研發(fā)合作。與之對比,數據庫行業(yè)巨頭Oracle常年保持上千人的核心研發(fā)團隊,且自身擁有強大的存儲研發(fā)能力,其ASM本身就是一個能力超強的存儲軟件,才能打造出業(yè)界經典的多主數據庫Oracle RAC。

借鑒先進經驗,當務之急是中國數據庫產業(yè)如何擰成一股繩,共同朝著既定目標分工合作攻克難關,而不再是各自為戰(zhàn)、無效內卷,筆者認為,此事非政策性機構牽頭不能完成。

令人振奮的消息很快傳來了。10月13日,在2023金融業(yè)數據庫技術大會-數據庫技術創(chuàng)新發(fā)展分論壇中,金融信息化研究所攜10家數據庫產業(yè)鏈的領軍企業(yè),共同啟動金融多主數據庫應用行動計劃。

據筆者了解,金融信息化研究所主要承接人民銀行金融科技研究課題,長期耕耘于中國金融科技研究咨詢與產業(yè)孵化工作,與中國人民銀行下屬的中國金融電子化集團有緊密聯(lián)系;而由金融信息化研究所主辦的金融業(yè)數據庫技術大會歷年均有人行、銀監(jiān)會、國有大行和股份制大行等高層領導與會,在業(yè)內影響力巨大。一言以蔽之,金融信息化研究所完全有能力對多主數據庫的產業(yè)發(fā)展進行統(tǒng)籌推進,此次應用行動計劃具有極強的落地性。

參與行動的首批企業(yè)也頗有意思。有阿里、奧星貝斯、達夢、南大通用四大行業(yè)巨頭壓陣,天翼云、萬里數據庫、優(yōu)炫數據庫等近年來在多主數據庫取得商用突破的新興廠商也加入其中,云和恩墨的出現則意味著openGauss生態(tài)同樣有意邁向多主架構。

更為讓人眼前一亮的,是此次代表華為出席的,是國產高端存儲領軍企業(yè)華為存儲,這意味著此次合作不再僅僅是數據庫界的大聯(lián)歡,而是整個IT產業(yè)界的歷史性握手。首批企業(yè)組成呈現生態(tài)多樣化、路線多樣化、產業(yè)結構多樣化的特點,而金融信息化研究所則可驅動金融行業(yè)提供廣泛的產品應用與催熟場景。期待在行動計劃工作組的統(tǒng)籌下,各與會組織可以合理分工、充分合作,共同加速中國多主數據庫穩(wěn)定落地商用。

無數勝利的經驗告訴我們,發(fā)現缺口、集中力量突破,是打贏局部戰(zhàn)爭、進而取得全面戰(zhàn)爭勝利的關鍵。如今,在政策機構的統(tǒng)籌牽引下,中國數據庫產業(yè)正積聚力量向多主數據庫發(fā)起沖擊。在空前的壓強投入下,期待中國數據庫破繭化蝶的一天。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2023-11-05
中國多主數據庫:壓強投入,期待破繭
中國多主數據庫:壓強投入,期待破繭

長按掃碼 閱讀全文