盡管目前圖數(shù)據(jù)庫(kù)的價(jià)值已經(jīng)受到了市場(chǎng)的認(rèn)可,大部分企業(yè)也都加大了對(duì)于圖技術(shù)的投入和應(yīng)用。但對(duì)于企業(yè)而言要選擇一款圖數(shù)據(jù)庫(kù)投入實(shí)際生產(chǎn)也是一個(gè)不小的挑戰(zhàn)。圖數(shù)據(jù)庫(kù)的最終應(yīng)用對(duì)于企業(yè)長(zhǎng)期發(fā)展來說至關(guān)重要。面對(duì)市場(chǎng)上的圖數(shù)據(jù)庫(kù)和圖分析產(chǎn)品,應(yīng)該如何選擇?產(chǎn)品性能自然是首要考慮的因素,除此之外,企業(yè)在選擇合適的圖數(shù)據(jù)庫(kù)時(shí)還需要注意哪些方面?而哪些又是企業(yè)在做評(píng)估時(shí)容易忽略的問題,會(huì)對(duì)未來的項(xiàng)目實(shí)施,甚至業(yè)務(wù)發(fā)展產(chǎn)生影響?本文或許會(huì)給大家一些參考。
在回答如何選擇合適的圖數(shù)據(jù)庫(kù)之前,企業(yè)決策者和項(xiàng)目負(fù)責(zé)人首先需要考慮以下幾個(gè)問題:
企業(yè)為什么選擇圖數(shù)據(jù)庫(kù)?
企業(yè)選擇圖數(shù)據(jù)庫(kù)嗎?
選擇之前要準(zhǔn)備什么?
企業(yè)為什么選擇圖數(shù)據(jù)庫(kù)?
部分企業(yè)在沒想明白這幾個(gè)問題前,很容易盲目跟風(fēng)選擇圖技術(shù)。圖技術(shù)雖好,但每個(gè)企業(yè)情況不一樣,發(fā)展階段不一樣,也就意味著選擇不一樣。所以在做圖數(shù)據(jù)庫(kù)采購(gòu)的選擇之前,首先需要想清楚企業(yè)為什么需要圖數(shù)據(jù)庫(kù)。是有明確的技術(shù)問題有待解決和提高?還是業(yè)務(wù)場(chǎng)景具有典型的圖問題?例如,反欺詐、風(fēng)控管理、供應(yīng)鏈流程優(yōu)化等跟圖相關(guān)的復(fù)雜結(jié)構(gòu)業(yè)務(wù)場(chǎng)景。如果有這類明確的問題和場(chǎng)景,需要對(duì)應(yīng)的解決辦法,那答案就很明確,選擇圖。對(duì)于一些新型的熱點(diǎn)行業(yè),例如人工智能、區(qū)塊鏈和最近的元宇宙,他們更多地是在探索和尋找新的技術(shù)或投資方向,那圖技術(shù)是他們很好的選擇。
企業(yè)選擇圖數(shù)據(jù)庫(kù)嗎?
那回答完上面的問題,知道了為什么選擇圖數(shù)據(jù)庫(kù),那企業(yè)就一定要選擇圖數(shù)據(jù)庫(kù)嗎?首先,需要了解圖數(shù)據(jù)庫(kù)的市場(chǎng)現(xiàn)狀和接受程度。
首先,圖數(shù)據(jù)庫(kù)還沒有完全統(tǒng)一的標(biāo)準(zhǔn),都還在逐步建立當(dāng)中。但國(guó)際上有第三方的機(jī)構(gòu),如LDBC,已經(jīng)制定了一些標(biāo)準(zhǔn)對(duì)圖數(shù)據(jù)庫(kù)的性能瓶頸和使用場(chǎng)景進(jìn)行驗(yàn)證。另外,IEEE和ANSI也在逐步確定統(tǒng)一的圖查詢語言。
各家產(chǎn)品的優(yōu)勢(shì)不一樣,企業(yè)在選擇時(shí),面對(duì)的并不是同質(zhì)的產(chǎn)品,那考評(píng)標(biāo)準(zhǔn)必定也不一樣。
另外,圖技術(shù)本身的核心業(yè)務(wù)場(chǎng)景和優(yōu)勢(shì)業(yè)務(wù)場(chǎng)景有待驗(yàn)證和確定。目前并沒有發(fā)現(xiàn)有什么特定業(yè)務(wù)場(chǎng)景非圖不可。只能說在一些業(yè)務(wù)場(chǎng)景上,圖技術(shù)相比傳統(tǒng)技術(shù),有一定的優(yōu)勢(shì),但也不是一定要選擇圖。另一個(gè)現(xiàn)實(shí)就是大多數(shù)的圖應(yīng)用和部署需要圖數(shù)據(jù)庫(kù)廠商、合作伙伴和終端客戶共同探索完成。這就需要選擇圖技術(shù)的企業(yè)具有探索的主動(dòng)性,才能更好地促成圖項(xiàng)目的實(shí)施落地。
而且,從我們接觸的大部分客戶來說,都會(huì)提出這樣一個(gè)問題,圖技術(shù)很好,但是對(duì)我來說有什么用呢?同時(shí),知道圖數(shù)據(jù)庫(kù)的人很多都是緊跟前沿技術(shù)趨勢(shì)非常專業(yè)的小部分技術(shù)人員,還遠(yuǎn)遠(yuǎn)沒有到大眾熟知的階段。整體而言,圖數(shù)據(jù)庫(kù)屬于較早的初期接受階段,還沒有到廣泛的應(yīng)用階段。
所以,如果企業(yè)還處在比較保守的發(fā)展階段,其實(shí)可以不用選擇圖數(shù)據(jù)庫(kù)。
選擇之前要準(zhǔn)備什么?
對(duì)于一部分創(chuàng)新型企業(yè)而言,已經(jīng)對(duì)圖數(shù)據(jù)庫(kù)的現(xiàn)狀有了一定的了解,也確定要采用圖技術(shù)的情況下,應(yīng)該先充分了解企業(yè)自身是否已經(jīng)準(zhǔn)備好了應(yīng)用圖技術(shù)的條件。首先,團(tuán)隊(duì)是否已經(jīng)了解圖數(shù)據(jù)庫(kù)的基本知識(shí),同時(shí)是否放下了對(duì)于關(guān)系型數(shù)據(jù)庫(kù)的先入為主的概念體系,開始全新的圖思維模式。
第二點(diǎn),團(tuán)隊(duì)需要先收集技術(shù)瓶頸和難于實(shí)現(xiàn)的業(yè)務(wù)需求,然后再整理哪些可以使用圖技術(shù)來解決。而不是先入為主認(rèn)為圖可以解決哪些問題,而企業(yè)是不是有這些問題。TigerGraph的客戶經(jīng)常就有圖的創(chuàng)新應(yīng)用,是因?yàn)樗麄兏约旱膯栴}是什么,而圖剛好可以幫到他們解決。例如,最近在溝通的制造行業(yè)客戶遇到的一個(gè)列轉(zhuǎn)行的操作問題,關(guān)系型數(shù)據(jù)庫(kù)處理很慢,圖數(shù)據(jù)庫(kù)可以提升10以上的性能,這并不是一開始就知道用圖來解決,是看到了問題,發(fā)現(xiàn)用圖解決會(huì)更好,這就是一種創(chuàng)新應(yīng)用。
第三點(diǎn),對(duì)企業(yè)本身的技術(shù)棧用哪些工具構(gòu)建和人才儲(chǔ)備情況進(jìn)行梳理,例如,團(tuán)隊(duì)成員是否有數(shù)據(jù)庫(kù)經(jīng)驗(yàn),對(duì)于哪些大數(shù)據(jù)工具更為熟悉等。還有就是對(duì)于業(yè)務(wù)場(chǎng)景的梳理,圖數(shù)據(jù)庫(kù)的構(gòu)建非常需要和業(yè)務(wù)專家不斷地溝通才能獲得更有效的schema,才能促成項(xiàng)目落地。
最后一點(diǎn),利用圖相關(guān)技術(shù)并不是一蹴而就的,需要反復(fù)迭代,需要有見效周期較長(zhǎng)的心理建設(shè)。
在想清楚了以上的幾個(gè)問題,我們?cè)賮碛懻?ldquo;如何選擇合適的圖數(shù)據(jù)庫(kù)”。
首先考慮的必然是產(chǎn)品本身。我們通常會(huì)看以下這些方面:準(zhǔn)確性、性能、擴(kuò)展性、表達(dá)性(語言)、軟件技術(shù)生態(tài),數(shù)據(jù)上下游(BI,AI,Dashboard)、企業(yè)級(jí)功能(穩(wěn)定性,安全性)、可視化、CI/CD。因?yàn)閷?duì)比圖數(shù)據(jù)庫(kù)產(chǎn)品性能的內(nèi)容非常多也非常全面,這次我們就不在這里展開,但要強(qiáng)調(diào)的是,我們通常說的性能強(qiáng)并不只是說響應(yīng)時(shí)間越快越好,而應(yīng)該看單位時(shí)間處理數(shù)據(jù)和計(jì)算的性能。遍歷數(shù)據(jù)和統(tǒng)計(jì)計(jì)算的能力作為標(biāo)準(zhǔn)。這是圖數(shù)據(jù)庫(kù)優(yōu)于傳統(tǒng)方案的地方。性能的重要性還主要體現(xiàn)在計(jì)算量和吞吐量上,另外,就是體現(xiàn)在處理大量的圖分析場(chǎng)景。全圖計(jì)算,比如中心度、社區(qū)計(jì)算、連接分析、相似度算法等大批量算法是非常消耗性能的。如果選擇的圖數(shù)據(jù)庫(kù)不能在可接受的時(shí)間內(nèi)完成,這些構(gòu)想就無法實(shí)現(xiàn)在實(shí)際的業(yè)務(wù)當(dāng)中。這里完整版大家感興趣可以去看我們的直播回放。
成本
那第二個(gè)關(guān)鍵就是大家都很關(guān)心的實(shí)施圖數(shù)據(jù)庫(kù)項(xiàng)目的總擁有成本,除了產(chǎn)品本身的直接成本,這里還需要注意開發(fā)時(shí)間成本、人員成本、遷移成本、硬件成本、維護(hù)成本。開發(fā)時(shí)間和圖數(shù)據(jù)庫(kù)產(chǎn)品本身的易用性和運(yùn)行效率密切相關(guān),這將決定在對(duì)一個(gè)場(chǎng)景進(jìn)行驗(yàn)證、深度開發(fā)和穩(wěn)定部署運(yùn)行需要多長(zhǎng)的時(shí)間。另外,圖數(shù)據(jù)庫(kù)產(chǎn)品的易用性也將影響項(xiàng)目的人員成本的投入,具體來說就是,一共需要投入多少人?是否需要招聘新的人員加入來進(jìn)行項(xiàng)目開發(fā)?是否經(jīng)常需要廠商介入調(diào)試?這些對(duì)企業(yè)來說都是可能增加的成本。便捷的圖數(shù)據(jù)庫(kù)產(chǎn)品將幫助企業(yè)最大程度地節(jié)約這部分成本。
然后是遷移成本。我們都知道如果替換產(chǎn)品,涉及上下游的連接方式、圖查詢語言替換等問題,我們都知道目前市場(chǎng)還沒有統(tǒng)一的查詢語言標(biāo)準(zhǔn),因此,遷移成本是企業(yè)需要慎重考量的。但好消息是,查詢語言標(biāo)準(zhǔn)(GQL)已經(jīng)取得了一定的進(jìn)展,而像TigerGraph可以支持馬上就要出臺(tái)的GQL,對(duì)于企業(yè)未來想要替換同樣符合標(biāo)準(zhǔn)的任何圖數(shù)據(jù)庫(kù),都將大大降低遷移成本。
然后就是硬件成本。存儲(chǔ)同樣的數(shù)據(jù),進(jìn)行同樣的計(jì)算需要多少硬件資源,比如,CPU、內(nèi)存、網(wǎng)絡(luò)等等,這些都是項(xiàng)目管理者需要考量的成本。高性能的圖數(shù)據(jù)庫(kù)就有更高的壓縮率和資源的利用率。就我們得到的反饋來說,同樣的東西,TigerGraph只需更少的硬件資源,一定程度降低了這部分的成本。
專業(yè)的技術(shù)支持
圖數(shù)據(jù)庫(kù)廠商是否提供完整專業(yè)的技術(shù)服務(wù)支持是重要的考察點(diǎn),包括但不限于,24x7的及時(shí)響應(yīng)服務(wù)、完整的響應(yīng)流程、專業(yè)的客戶成功團(tuán)隊(duì)支持、知識(shí)共享庫(kù)等等。尤其是對(duì)于風(fēng)險(xiǎn)厭惡型的行業(yè),如,金融、智能制造、能源、通訊等,對(duì)于宕機(jī)等故障是低容忍的,那及時(shí)專業(yè)的響應(yīng)服務(wù)就非常有必要。TigerGraph也是在與客戶實(shí)際的溝通當(dāng)中發(fā)現(xiàn)客戶成功團(tuán)隊(duì)的必要性,有別于傳統(tǒng)的售后團(tuán)隊(duì),客戶成功團(tuán)隊(duì)不僅僅是在客戶使用產(chǎn)品出問題時(shí)才提供服務(wù)。而是定期與客戶進(jìn)行溝通,深入了解客戶的業(yè)務(wù)訴求,幫助客戶一同探索圖應(yīng)用。同時(shí),聽取和反饋客戶的建議,讓產(chǎn)品的每一次升級(jí)都更加客戶友好。讓客戶無論是作為企業(yè)、團(tuán)隊(duì)甚至個(gè)人,都能從中收益,這才是真正意義上的客戶成功。
社區(qū)
另外一個(gè)重點(diǎn)要考察的就是圖數(shù)據(jù)庫(kù)產(chǎn)品的社區(qū)。無論開源還是閉源產(chǎn)品,都會(huì)有自己的社區(qū)。雖然市面上對(duì)于選擇開源和閉源產(chǎn)品有很大的爭(zhēng)議,但其實(shí)對(duì)于企業(yè)使用來說,產(chǎn)品是否是開源,意義并不大。為什么這么說呢?如果本身不是數(shù)據(jù)庫(kù)的開發(fā)者,那么圖數(shù)據(jù)庫(kù)的源代碼也就并不重要了。只是使用圖數(shù)據(jù)庫(kù)來說,社區(qū)、技術(shù)文檔、專業(yè)支持相對(duì)來說就更重要。特別是社區(qū),作為一項(xiàng)很新的技術(shù),市面上從事這方面的人才還相對(duì)較少,招聘成本相對(duì)較高。而且有社區(qū)不斷地產(chǎn)生內(nèi)容可以參考學(xué)習(xí),專業(yè)玩家相互交流。因此,社區(qū)的活躍度也就很重要了。像TigerGraph雖然是閉源產(chǎn)品,但其社區(qū)的活躍度非常高,同時(shí),面向的是全球的開發(fā)者和使用者,可以參考的內(nèi)容更多,應(yīng)用案例范圍更廣,有助于企業(yè)大大降低人員的培訓(xùn)成本。
其他
一個(gè)企業(yè)是否能夠提供足夠多的學(xué)習(xí)參考資料也是需要關(guān)注的。我們?cè)谂c客戶交流的過程當(dāng)中,經(jīng)常有客戶咨詢是否有案例和經(jīng)驗(yàn)可參考。如果圖數(shù)據(jù)庫(kù)廠商能提供一些前沿的國(guó)內(nèi)外案例可供參考,那也能很大程度上幫助剛接觸圖數(shù)據(jù)庫(kù)的企業(yè)少走很多彎路。
另外,圖數(shù)據(jù)庫(kù)廠商是否在往技術(shù)前沿不斷地探索和實(shí)踐也是很重要的考察點(diǎn)。圖技術(shù)作為一項(xiàng)非常新的技術(shù),與機(jī)器學(xué)習(xí)關(guān)聯(lián)性越來越強(qiáng),大家熟知的GNN、GCN、等,TigerGraph一直都在進(jìn)行相關(guān)的實(shí)踐和測(cè)試,這也是為了讓更多人能從圖技術(shù)上收益,從而不斷地進(jìn)行最前沿的探索實(shí)踐。一旦有企業(yè)有這方面的圖技術(shù)需求,才有能力為企業(yè)提供這樣的支持。
圖數(shù)據(jù)庫(kù)提供商的合作伙伴生態(tài)的搭建也是至關(guān)重要的。是否有足夠多的合作伙伴能夠共同構(gòu)建,打磨相互之間的接口,這些都需要關(guān)注。包括,云平臺(tái),服務(wù)器,硬件加速,行業(yè)解決方案,咨詢,數(shù)據(jù)上下游等等。
說了這么多,希望能夠?qū)τ行枰娜似鸬浇梃b意義,總而言之,大家在選擇圖數(shù)據(jù)庫(kù)的時(shí)候,要結(jié)合自身情況,具體問題具體分析,適合自己的才是最好的。
相關(guān)資源
完整版
回放:企業(yè)如何選擇合適的圖數(shù)據(jù)庫(kù)?
開發(fā)者社區(qū)
免費(fèi)下載企業(yè)級(jí)圖數(shù)據(jù)庫(kù)
2022 Graph+AI 全球峰會(huì)正式開始報(bào)名
百萬美元圖技術(shù)挑戰(zhàn)賽
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )