875名受訪者得出6條重要結(jié)論,解析數(shù)據(jù)分析和可視化應(yīng)用的現(xiàn)狀

各行各業(yè)的企業(yè)在收集、存儲(chǔ)和分析來自不同格式的數(shù)據(jù)。在數(shù)據(jù)競(jìng)爭(zhēng)下,要想獲得成功,利用數(shù)據(jù)進(jìn)行商業(yè)決策則變成了比業(yè)務(wù)本身更重要的事情。

數(shù)據(jù)分析和可視化技術(shù)的快速發(fā)展意味著企業(yè)和個(gè)人非常希望通過正確的技術(shù)選擇盡快地獲得業(yè)務(wù)上的成功。

創(chuàng)業(yè)者們需要知道他們是否選擇了正確的語(yǔ)言、產(chǎn)品、架構(gòu)和數(shù)據(jù)源,而個(gè)人則需要知道他們是否正在學(xué)習(xí)正確的技能來獲得更有前途的工作。那些沒有選擇正確的人會(huì)面臨被淘汰的危險(xiǎn),因?yàn)樗麄儧]有充分利用實(shí)時(shí)的數(shù)據(jù)分析和可視化程序提供的洞察理解。

基于數(shù)據(jù)分析和可視化技術(shù)的迅速發(fā)展,大數(shù)據(jù)分析和可視化工具提供商Zoomdata聯(lián)合橫跨多領(lǐng)域的科技媒體公司O’Reilly Media進(jìn)行了一次調(diào)查,以評(píng)估數(shù)據(jù)分析和可視化應(yīng)用的現(xiàn)狀。有875名受訪者提供了他們使用這些技術(shù)的情況。在詳細(xì)分析調(diào)研結(jié)果之前,我們先把主要的結(jié)論列出,以便大家閱讀:

大數(shù)據(jù)分析和可視化應(yīng)用在制造業(yè)、金融服務(wù)和科技/軟件公司中是最成熟的。這些技術(shù)通常是企業(yè)級(jí)用戶及業(yè)務(wù)分析師來使用,他們通常是依靠可視化儀表盤來獲取所需的見解,以優(yōu)化業(yè)務(wù)流程并更好的了解客戶。關(guān)系型數(shù)據(jù)庫(kù)仍然是最常見的數(shù)據(jù)源(雖然分析型數(shù)據(jù)庫(kù)和Hadoop是大數(shù)據(jù)領(lǐng)域最常見的數(shù)據(jù)源)。企業(yè)非常需要Python、SQL和關(guān)系型數(shù)據(jù)庫(kù)的能力。Kafka和Spark正在成為流數(shù)據(jù)技術(shù)(streaming data technology)的首選。360度客戶洞察是最常見的使用場(chǎng)景。

數(shù)據(jù)分析和可視化使用概覽

875個(gè)受訪者來自不同的行業(yè)(如圖1所示),其中超過35%來自科技/軟件行業(yè),接近10%來自金融服務(wù),8%來自醫(yī)療健康/醫(yī)療科技領(lǐng)域,還有制造業(yè)、政府、零售和教育/學(xué)術(shù)這幾個(gè)領(lǐng)域分別占約5%。

圖1?受訪者所在的行業(yè)及占比

從受訪者的工作崗位來看,18%是是工程師/開發(fā)人員,17%是數(shù)據(jù)科學(xué)家,15%是數(shù)據(jù)分析師/業(yè)務(wù)分析師,還有13%是架構(gòu)師,他們的公司規(guī)模各異。有趣的是,企業(yè)CXO們和經(jīng)理的占比也非常高(14%),甚至高于IT專家(8%)。

還有一個(gè)值得關(guān)注的是,有26%的受訪者是來自員工人數(shù)少于50人的企業(yè),這也表明了小型企業(yè)是使用這些新技術(shù)和業(yè)務(wù)流程的領(lǐng)導(dǎo)者。

超過50%的受訪者表示,他們使用分析來獲得全方位的客戶洞察,43%的受訪者使用分析來優(yōu)化業(yè)務(wù)流程(如圖2所示)。客戶和業(yè)務(wù)流程是直接影響業(yè)務(wù)的重要因素,因此這些環(huán)節(jié)也是企業(yè)需要使用數(shù)據(jù)分析和可視化工具從而通過數(shù)據(jù)來輔助決策的重要方面。

圖2?數(shù)據(jù)分析和可視化工具使用的主要領(lǐng)域和占比

主要領(lǐng)域分析

在圖2中,我們看到360度客戶洞察是數(shù)據(jù)分析和可視化工具使用最多的領(lǐng)域,但是從不同的行業(yè)來看情況可能就有所不同,而且也能顯示出一些趨勢(shì)。

在科技/軟件、金融服務(wù)和零售行業(yè),360度客戶洞察無疑是使用分析技術(shù)最主要的領(lǐng)域,占比在50%以上。令我們感到驚訝的是在教育/學(xué)術(shù)行業(yè),使用分析技術(shù)最主要的領(lǐng)域也是360度客戶洞察。毫無疑問這些行業(yè)都是客戶至上的行業(yè),只有全面的了解客戶,才能給客戶更好的體驗(yàn),才能獲得更多的收入。

醫(yī)療保?。t(yī)療科技行業(yè)中醫(yī)療數(shù)據(jù)分析是使用分析技術(shù)的主要領(lǐng)域,這并不令人驚訝,因?yàn)槟芊Q作是醫(yī)療科技的醫(yī)療企業(yè)都需要分析醫(yī)療數(shù)據(jù),否則很難做出有現(xiàn)實(shí)意義的成果。

業(yè)務(wù)流程優(yōu)化也是一個(gè)重度使用分析技術(shù)的主要領(lǐng)域,在調(diào)查報(bào)告里的所有涉及到的行業(yè),業(yè)務(wù)流程優(yōu)化使用技術(shù)分析技術(shù)的占比都排在前三位,在制造業(yè)和政府行業(yè)則排名第一。優(yōu)化業(yè)務(wù)流程通常會(huì)降低運(yùn)營(yíng)成本,并可能提高客戶的滿意度,因此這也是在許多行業(yè)中建立競(jìng)爭(zhēng)優(yōu)勢(shì)的戰(zhàn)略途徑之一。

制造業(yè)和零售行業(yè)也把重點(diǎn)放在了供應(yīng)鏈分析上。及時(shí)發(fā)現(xiàn)供應(yīng)鏈環(huán)節(jié)中存在的問題,可以幫助零售商和制造企業(yè)節(jié)省換供應(yīng)商的時(shí)間。一個(gè)優(yōu)化的供應(yīng)鏈結(jié)構(gòu)也是一個(gè)企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)和技術(shù)壁壘。

欺詐檢測(cè)/網(wǎng)絡(luò)安全情報(bào)是金融服務(wù)和政府行業(yè)的重要領(lǐng)域。欺詐檢測(cè)對(duì)于任何金融服務(wù)都至關(guān)重要,離錢越近的地方越容易出現(xiàn)欺詐行為。檢測(cè)并消除欺詐行為有助于與客戶建立信任并降低運(yùn)營(yíng)成本。網(wǎng)絡(luò)安全情報(bào)是眾多政府機(jī)構(gòu)關(guān)注的焦點(diǎn),在選舉和可持續(xù)運(yùn)營(yíng)層面,防止欺詐也至關(guān)重要。

我們還向受訪者提了這樣一個(gè)問題“貴公司的大數(shù)據(jù)分析處于什么階段?是剛剛開始,還是已經(jīng)應(yīng)用在工作的各個(gè)方面?”,有助于我們理解各行業(yè)的采用率如何變化。令我們驚訝的是制造業(yè)行業(yè)有26%的受訪者表示他們的公司在多個(gè)方面都已經(jīng)使用了數(shù)據(jù)分析技術(shù),是所有行業(yè)中最高的,而最低的是政府行業(yè),只有7%的人認(rèn)為公司在多個(gè)方面已經(jīng)應(yīng)用了數(shù)據(jù)分析技術(shù)。政府行業(yè)也是“我們沒有使用大數(shù)據(jù)分析技術(shù)”這個(gè)選項(xiàng)占比最多的行業(yè),達(dá)到33%,科技/軟件行業(yè)則占比最低。

如何使用數(shù)據(jù)

在如何獲取數(shù)據(jù)來源的問題中,數(shù)據(jù)倉(cāng)庫(kù)/數(shù)據(jù)集市是最多的回答,在零售行業(yè)最為明顯。虛擬聯(lián)合/糅合(Virtual federation/mashup,即時(shí)混合數(shù)據(jù)而不移入倉(cāng)庫(kù))在醫(yī)療健康/醫(yī)療科技、科技/軟件和政府行業(yè)應(yīng)用的最多。

圖3 數(shù)據(jù)來源在各行業(yè)的分布占比

關(guān)系型數(shù)據(jù)庫(kù)仍然是各行業(yè)使用最多的,在醫(yī)療健康/醫(yī)療科技行業(yè)的占有率達(dá)到39%。非關(guān)系型數(shù)據(jù)庫(kù)以及大數(shù)據(jù)存儲(chǔ)的分析型數(shù)據(jù)庫(kù)、Hadoop、NoSQL數(shù)據(jù)庫(kù)、云數(shù)據(jù)存儲(chǔ)、內(nèi)存數(shù)據(jù)庫(kù)和搜索數(shù)據(jù)庫(kù)中,金融服務(wù)和政府使用分析型數(shù)據(jù)庫(kù)最多,而零售和科技/軟件行業(yè)使用云數(shù)據(jù)庫(kù)存儲(chǔ)最多。

Kafka和Spark是分析流數(shù)據(jù)最常用的技術(shù),在我們的調(diào)查中,這兩個(gè)技術(shù)占流數(shù)據(jù)分析的65%以上。科技/軟件行業(yè)是使用Kafka的主要行業(yè),其次是金融服務(wù)。政府中最普遍的是使用Confluence。

大數(shù)據(jù)分析的必備技術(shù)

在我們分析使用數(shù)據(jù)分析和可視化工具的技術(shù)人員的相關(guān)技能時(shí),我們發(fā)現(xiàn)總體上需求最大的是Python、SQL和關(guān)系型數(shù)據(jù)庫(kù),其次是Hadoop和Java。政府行業(yè)最需要的是會(huì)Python的人才,其次是關(guān)系型數(shù)據(jù)庫(kù)的人才,而醫(yī)療健康/醫(yī)療科技最需要的事SQL的人才。

大數(shù)據(jù)的價(jià)值所在

衡量大數(shù)據(jù)的價(jià)值有四個(gè)方面:準(zhǔn)確性、實(shí)時(shí)性、多樣性和數(shù)據(jù)量。準(zhǔn)確性指的是數(shù)據(jù)接近“真相”的程度,實(shí)時(shí)性指的是數(shù)據(jù)收集和分析的速度,多樣性指的是結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的多種來源和類型,數(shù)據(jù)量指的是能夠收集和分析的總數(shù)據(jù)量。我們通過了解各個(gè)企業(yè)看重這四個(gè)方面的哪幾個(gè)方面,來深入理解數(shù)據(jù)分析是如何影響公司業(yè)務(wù)的。

從整體來看,衡量數(shù)據(jù)的價(jià)值最重要的方面是準(zhǔn)確性,這并不令人意外,因?yàn)闆]有真實(shí)的數(shù)據(jù),那么分析結(jié)果就沒有任何意義。其次重要的是多樣性,這表明無論什么行業(yè),做數(shù)據(jù)分析和可視化必須要結(jié)合多種來源和類型的數(shù)據(jù),才能更好的提供企業(yè)所需的見解。實(shí)時(shí)性是最不重要的,這表明典型的商業(yè)數(shù)據(jù)獲取是否及時(shí)并不影響分析的結(jié)果和業(yè)務(wù)的決策,這也是流數(shù)據(jù)分析相對(duì)少的原因之一。但實(shí)時(shí)性對(duì)于科技/軟件和制造業(yè)來說卻是最有價(jià)值的。

總之,為了更好的給企業(yè)提供商業(yè)價(jià)值,數(shù)據(jù)分析和可視化工具越來越多的應(yīng)用在日常工作中,給業(yè)務(wù)分析師和管理人員提供所需的信息。這些信息通常嵌入到生產(chǎn)環(huán)境的應(yīng)用程序或獨(dú)立的BI應(yīng)用中,并通過儀表盤進(jìn)行操作。我們通過這個(gè)調(diào)研希望可以給企業(yè)一個(gè)直觀的感受,讓各個(gè)行業(yè)的從業(yè)人員都了解到大數(shù)據(jù)分析技術(shù)已經(jīng)發(fā)展到什么程度以及采用度如何,在今后采用這些新技術(shù)或拓展大數(shù)據(jù)收集、存儲(chǔ)、分析和可視化應(yīng)用時(shí),有一個(gè)參考。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-12-01
875名受訪者得出6條重要結(jié)論,解析數(shù)據(jù)分析和可視化應(yīng)用的現(xiàn)狀
各行各業(yè)的企業(yè)在收集、存儲(chǔ)和分析來自不同格式的數(shù)據(jù)。在數(shù)據(jù)競(jìng)爭(zhēng)下,要想獲得成功,利用數(shù)據(jù)進(jìn)行商業(yè)決策則變成了比業(yè)務(wù)本身更重要的事情。 數(shù)據(jù)分析和可視化技術(shù)的快

長(zhǎng)按掃碼 閱讀全文