數(shù)據(jù)造假、數(shù)據(jù)不可信等問題的存在,給金融監(jiān)管及風(fēng)控等眾多應(yīng)用場景帶來了嚴(yán)峻的挑戰(zhàn),也正成為阻礙數(shù)據(jù)大規(guī)?;ヂ?lián)互通、共享共用的一大障礙。數(shù)據(jù)的真實(shí)可信問題長期影響著社會的各個領(lǐng)域,在更依賴數(shù)據(jù)的人工智能時代,這一影響將更為凸顯。
數(shù)據(jù)造假可能發(fā)生在任一環(huán)節(jié)。其中,在數(shù)據(jù)存儲期間造假往往更加簡單:因?yàn)樵诂F(xiàn)有數(shù)據(jù)存儲技術(shù)下,數(shù)據(jù)的所有者、管理人員或受托存儲方均有能力單方對數(shù)據(jù)進(jìn)行任意的篡改或刪除。
既然數(shù)據(jù)不可信的一個重要原因歸咎于單方可以擅自篡改和刪除數(shù)據(jù),那么如何避免這一問題自然也得到了業(yè)界大量的關(guān)注。區(qū)塊鏈和去中心化存儲技術(shù)的誕生,對數(shù)據(jù)篡改起到了一定的遏制作用,也在市場上取得了初步驗(yàn)證。
許多企業(yè)開始嘗試采用區(qū)塊鏈存儲數(shù)據(jù),例如在貨物追溯等場景。其做法往往是將重要數(shù)據(jù)直接寫入?yún)^(qū)塊中。這一簡單粗暴的做法確實(shí)解決了數(shù)據(jù)防刪改需求、繼而滿足了部分?jǐn)?shù)據(jù)的可信分享,但卻存在較多問題:
首先是無法存儲海量數(shù)據(jù):區(qū)塊內(nèi)不適合存儲包括多媒體數(shù)據(jù)等在內(nèi)的大數(shù)據(jù),否則區(qū)塊大小難以控制,使區(qū)塊鏈的可擴(kuò)展性變差。這就導(dǎo)致業(yè)務(wù)中必須對原生數(shù)據(jù)進(jìn)行篩選取舍,僅選取少量必要數(shù)據(jù)存入?yún)^(qū)塊,但這將降低可信數(shù)據(jù)的豐富程度。
其次是數(shù)據(jù)存取效率低:首先,由于打包過程的存在,區(qū)塊鏈數(shù)據(jù)存儲一般不用于高速的數(shù)據(jù)寫入。其次,由于遍歷式的數(shù)據(jù)讀取方法,區(qū)塊鏈無法支持快速索引、更無法支持SQL。
再次是數(shù)據(jù)維護(hù)效率低:區(qū)塊鏈因其順序引用的特點(diǎn),不支持對個別歷史數(shù)據(jù)的刪除和修改(除非對全鏈重新生成,但這是區(qū)塊鏈不應(yīng)鼓勵的行為)。這里需注意:“杜絕單方的私自篡改”和“完全不能刪改”是完全不同的兩件事。前者是一種確保互信的技術(shù)手段,但后者可能屬于一種必要功能點(diǎn)的喪失。
最后是有數(shù)據(jù)丟失風(fēng)險:這一風(fēng)險單指采用中本聰共識最長鏈原則的PoW區(qū)塊鏈系統(tǒng)。在這類區(qū)塊鏈中,當(dāng)出現(xiàn)鏈分叉時,最長(或最重)的鏈分支會被保留,其他分支會被拋棄,這就使區(qū)塊內(nèi)的數(shù)據(jù)實(shí)際上永遠(yuǎn)存在被“顛覆”、被丟棄的風(fēng)險。而自私挖礦等攻擊行為的存在,會加劇這一風(fēng)險。這在數(shù)據(jù)存儲應(yīng)用中是無法接受的。
正是由于上述原因,直接采用傳統(tǒng)區(qū)塊鏈進(jìn)行數(shù)據(jù)存儲顯然無法滿足大量實(shí)踐性場景中對可信數(shù)據(jù)存儲的需求。這一問題也因而引發(fā)了大量的探討,例如“什么數(shù)據(jù)應(yīng)該在鏈上存儲、什么數(shù)據(jù)應(yīng)該在鏈下存儲”。這些問題的出現(xiàn),究其根本,還是因?yàn)閰^(qū)塊鏈自身存儲效率及能力受限所致的。畢竟在數(shù)據(jù)庫時代,我們從來不會談?wù)?ldquo;什么數(shù)據(jù)應(yīng)該存放在數(shù)據(jù)庫之外”這樣的問題。
近年來也出現(xiàn)了一些產(chǎn)品,為解決上述的區(qū)塊鏈數(shù)據(jù)存儲效率低下問題提供了有益的實(shí)踐,例如:
星際文件系統(tǒng)IPFS, R3的Corda,騰訊TrustSQL等。然而這些產(chǎn)品在數(shù)據(jù)可信存儲方面仍存在或多或少的問題,具體而言:
IPFS對數(shù)據(jù)內(nèi)容生成哈希摘要,并在多個節(jié)點(diǎn)間進(jìn)行分布式存儲,單個保有者不掌握完整數(shù)據(jù),一定程度保護(hù)了數(shù)據(jù)隱私。但I(xiàn)PFS只能做到修改可知(因哈希值會因內(nèi)容改變而變化),并且沒有訪問控制等數(shù)據(jù)安全措施,整體而言仍難以滿足企業(yè)級服務(wù)需求。
Corda是面向金融交易隱私需求量身定做的存儲產(chǎn)品,重點(diǎn)關(guān)注數(shù)據(jù)存儲的隱私性。為此,Corda沒有全局賬本,并需要見證人的存在,是一種隱私但并不足夠安全可信的數(shù)據(jù)存儲方案。
TrustSQL與國內(nèi)其它同類產(chǎn)品采用了一種簡單直觀的設(shè)計思路,也是目前國內(nèi)最為常見的做法,即:先將數(shù)據(jù)存入數(shù)據(jù)庫(或IPFS),再將操作記錄、數(shù)據(jù)哈希等存于鏈上。相對于TrustSQL而言,一些類似產(chǎn)品如眾享比特的ChainSQL等進(jìn)一步提升了對SQL的支持度。該類產(chǎn)品滿足了數(shù)據(jù)“可審計”、“監(jiān)管透明”的需求,但缺點(diǎn)是依然無法杜絕對數(shù)據(jù)本身的刪改行為,只是能做到“刪改可知”;此外,對關(guān)鍵數(shù)據(jù)的保全需要依賴參與節(jié)點(diǎn)的全副本存儲,存儲成本略高。并且在數(shù)據(jù)隱私性方面的設(shè)計仍顯不足。
針對上述產(chǎn)品中存在的不足,物緣科技通過原創(chuàng)技術(shù)創(chuàng)新,探索出一條不同的道路,并推出自主知識產(chǎn)權(quán)產(chǎn)品“ImSQL”,旨在提供一種可真正確保數(shù)據(jù)不被私自篡改或刪除的可信存儲產(chǎn)品。
ImSQL(Immutable SQL Database)是基于區(qū)塊鏈和分布式存儲技術(shù)上的一種新型可信數(shù)據(jù)存儲解決方案,并完美解決了“防止私自刪改”、“保護(hù)數(shù)據(jù)隱私”、“降低存儲成本”等核心問題,為大數(shù)據(jù)時代的可信存儲與數(shù)據(jù)分享提供了可靠的技術(shù)路徑。
相比現(xiàn)有產(chǎn)品,ImSQL具有以下幾點(diǎn)突出優(yōu)勢:
1.徹底杜絕單方對數(shù)據(jù)的私自篡改和刪除。通過在存和取兩個環(huán)節(jié)進(jìn)行多方校驗(yàn)并在存儲過程中杜絕篡改刪除,全方位保障數(shù)據(jù)的真實(shí)可信性,使應(yīng)用中的參與方能夠互信、放心地采納它方數(shù)據(jù),使數(shù)據(jù)能夠支撐精準(zhǔn)追溯、追責(zé)。
2.杜絕單點(diǎn)失敗。多方共用數(shù)據(jù)的同時也共同維護(hù)數(shù)據(jù),數(shù)據(jù)不只存于一方,從根本上實(shí)現(xiàn)分布式數(shù)據(jù)的可信共享池,既避免了單點(diǎn)失敗風(fēng)險,也提升了數(shù)據(jù)分享效率。
3.碎片化存儲,滿足數(shù)據(jù)隱私需求,使任何一方無法掌握完整數(shù)據(jù),從而解決了傳統(tǒng)云計算的中心化存儲、或區(qū)塊鏈全副本存儲均存在的數(shù)據(jù)隱私問題。除了數(shù)據(jù)所有方,其他任何存儲托管者都無法獲得完整數(shù)據(jù)。
4.優(yōu)異的數(shù)據(jù)存取性能:ImSQL單節(jié)點(diǎn)可達(dá)3000TPS的寫入速度和10000QPS的讀取速度。此外,ImSQL還具有:支持SQL語言,可水平擴(kuò)展等優(yōu)點(diǎn),存取性能和使用體驗(yàn)優(yōu)異,并可充分利用集群擴(kuò)展使上述指標(biāo)進(jìn)一步達(dá)到數(shù)倍增長。
5.滿足多媒體等大數(shù)據(jù)的高效存取需求,支持高效存取、高效索引、高效擴(kuò)展,真正勝任大數(shù)據(jù)業(yè)務(wù)場景,可以對視頻等數(shù)據(jù)實(shí)現(xiàn)既可信又高效的存儲,從而給視頻監(jiān)控等場景提供前所未有的可信保全體驗(yàn)。
6.采用分片式設(shè)計,極大降低了每個存儲參與方的存儲壓力和成本,使更多參與方有機(jī)會加入和參與到數(shù)據(jù)可信共享的生態(tài)中。
7.分布式架構(gòu),兼容輕節(jié)點(diǎn),鼓勵更多節(jié)點(diǎn)參與。不存在超能節(jié)點(diǎn),參與存儲的節(jié)點(diǎn)地位相同,更好保證系統(tǒng)的可靠性和抗毀性。此外,如果節(jié)點(diǎn)選擇運(yùn)行在輕副本模式,可只存儲部分?jǐn)?shù)據(jù),使自身存儲壓力極大降低,義務(wù)雖然減輕但權(quán)力可不受任何影響。
ImSQL兼顧了海量存儲、快速索引、水平擴(kuò)展等數(shù)據(jù)庫屬性,也兼顧了數(shù)據(jù)即存即固化的區(qū)塊鏈特征,在眾多關(guān)注數(shù)據(jù)可信存儲與分享的領(lǐng)域中,有望帶來前所未有的使用體驗(yàn)和便利,例如:實(shí)現(xiàn)供應(yīng)鏈中各方數(shù)據(jù)的互通與互信、實(shí)現(xiàn)政府或大企業(yè)各部門間數(shù)據(jù)的互聯(lián)互通、支撐可信追溯相關(guān)海量數(shù)據(jù)的存儲等。
以政府大數(shù)據(jù)建設(shè)為例。在政府眾多不同部門和實(shí)體間實(shí)現(xiàn)高效的數(shù)據(jù)互聯(lián)互通一直是個難題?,F(xiàn)行做法往往需要建立獨(dú)立的大數(shù)據(jù)部門,構(gòu)建獨(dú)立數(shù)據(jù)存儲體系,從不同實(shí)體拉取相關(guān)數(shù)據(jù)后解析、重構(gòu),再實(shí)現(xiàn)可視化。這往往會帶來較大的前期開銷,既包含人、財、物等多種顯性開銷,也暗含人員編制、權(quán)責(zé)利益、時間成本、部門墻等隱性開銷。同時,獨(dú)立大數(shù)據(jù)部門的存在也隱含了需要一個可信第三方背書乃至承擔(dān)責(zé)任的考慮。如果在這一場景下采用ImSQL作為數(shù)據(jù)互通的底層基礎(chǔ)平臺,就可以更為高效的完成這一任務(wù),具體體現(xiàn)在:
1.無須依賴第三方實(shí)體背書:不同實(shí)體間數(shù)據(jù)可直接寫入ImSQL,寫入即保全,數(shù)據(jù)無法再被任一單方私自篡改和刪除,保證其他實(shí)體在任何時間取用數(shù)據(jù)時的可用性、一致性和可信性;
2.無須建立和維護(hù)額外的數(shù)據(jù)存儲系統(tǒng):數(shù)據(jù)由所有參與實(shí)體共同存儲和維護(hù),天然共享、打通,不降低使用效率的同時減少了系統(tǒng)實(shí)施和維護(hù)成本。同時,ImSQL的數(shù)據(jù)碎片化存儲技術(shù),在實(shí)現(xiàn)數(shù)據(jù)共享的同時也能兼顧隱私保護(hù),即,所有實(shí)體存儲的數(shù)據(jù)可以是不完整的片段,只有那些具備訪問權(quán)的實(shí)體才掌握對片段數(shù)據(jù)進(jìn)行查找、組合并解釋的鑰匙。
綜上,作為一種可信的、防數(shù)據(jù)篡改的數(shù)據(jù)存儲技術(shù),ImSQL完全繼承了區(qū)塊鏈數(shù)據(jù)保全的優(yōu)勢,又突破了區(qū)塊鏈在效率方面的弱點(diǎn),為用戶提供了和數(shù)據(jù)庫同樣高效的數(shù)據(jù)存取體驗(yàn)。ImSQL是區(qū)塊鏈和數(shù)據(jù)庫技術(shù)相結(jié)合而產(chǎn)生的新品類,更是實(shí)現(xiàn)可信數(shù)據(jù)存儲的不二選擇。
作者信息:焦臻楨博士,物緣科技創(chuàng)始人,副教授/碩導(dǎo)(中科院)。
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。