數(shù)據(jù)科學(xué)家面臨的7大挑戰(zhàn)及解決方法

數(shù)據(jù)科學(xué)家面臨的7大挑戰(zhàn)及解決之法數(shù)據(jù)科學(xué)已經(jīng)徹底改變了企業(yè)AI,如果提供有價(jià)值的見解,以做出數(shù)據(jù)驅(qū)動(dòng)的決策,那么數(shù)據(jù)科學(xué)有很大的升級潛力。每天,全球各地的組織都在尋找2.5萬億字節(jié)的數(shù)據(jù),以獲得對其業(yè)務(wù)的見解和價(jià)值驅(qū)動(dòng)的行動(dòng)。為了實(shí)現(xiàn)這一目標(biāo),需要高技能的科學(xué)專家或數(shù)據(jù)科學(xué)家參與開發(fā)業(yè)務(wù)中的企業(yè)AI。在不斷增長的業(yè)務(wù)領(lǐng)域中,數(shù)據(jù)科學(xué)家的每一個(gè)行動(dòng)都有助于改進(jìn)業(yè)務(wù)的功能。所有的職業(yè)都會遇到一定的障礙或挑戰(zhàn),數(shù)據(jù)科學(xué)家的角色也不例外。許多企業(yè)未能充分利用數(shù)據(jù)科學(xué)家,將其置于錯(cuò)誤的角色或不提供必要的要求。根據(jù)LinkedIn,當(dāng)今數(shù)據(jù)科學(xué)家的十大技能包括機(jī)器學(xué)習(xí)、大數(shù)據(jù)、數(shù)據(jù)科學(xué)、R、Python、數(shù)據(jù)挖掘、數(shù)據(jù)分析、SQL、MatLab和統(tǒng)計(jì)建模。大多數(shù)數(shù)據(jù)科學(xué)家都可以在他們的電腦中運(yùn)用這些技能;然而,這些技能還不足以讓他們擔(dān)任正確的角色以實(shí)現(xiàn)最佳的業(yè)務(wù)增長。

下面來探討一下,當(dāng)今數(shù)據(jù)科學(xué)家面臨的共同挑戰(zhàn)。1、為智能企業(yè)AI準(zhǔn)備數(shù)據(jù)數(shù)據(jù)科學(xué)家最重要的功能是識別和準(zhǔn)備正確的數(shù)據(jù)。根據(jù)CrowdFlower的一項(xiàng)調(diào)查,近80%的數(shù)據(jù)科學(xué)家每天都在清理、組織、挖掘和收集來自不同數(shù)據(jù)集的數(shù)據(jù)。在這里,對數(shù)據(jù)進(jìn)行徹底檢查,然后對其進(jìn)行分析和進(jìn)一步工作。這是一個(gè)非常艱苦的過程,76%的數(shù)據(jù)科學(xué)家認(rèn)為這是他們工作中最糟糕的部分之一。數(shù)據(jù)之爭要求數(shù)據(jù)科學(xué)家在維護(hù)日志以防止系統(tǒng)中的數(shù)據(jù)重復(fù)的同時(shí),在不同的平臺上以不同的格式和代碼精簡TB級數(shù)據(jù)。克服這一問題的最佳方法是采用基于人工智能的技術(shù),讓數(shù)據(jù)科學(xué)家在其功能上保持敏銳和更強(qiáng)大。增強(qiáng)學(xué)習(xí)是另一種多功能的企業(yè)AI工具,可以幫助和協(xié)助數(shù)據(jù)準(zhǔn)備,并提供對手頭問題的見解。2、從多個(gè)來源生成數(shù)據(jù)組織以各種格式從不同的應(yīng)用程序、軟件和工具獲取數(shù)據(jù)。對于數(shù)據(jù)科學(xué)家來說,處理大量數(shù)據(jù)是一個(gè)巨大的挑戰(zhàn)。這個(gè)過程需要手動(dòng)輸入和編譯數(shù)據(jù),這非常耗時(shí),并且可能導(dǎo)致重復(fù)或錯(cuò)誤的決策。當(dāng)數(shù)據(jù)被適當(dāng)?shù)赜糜谄髽I(yè)AI的最佳功能時(shí),它可能是最有用的。企業(yè)可以建立具有集中平臺的智能虛擬數(shù)據(jù)倉庫,將所有數(shù)據(jù)源集成到一個(gè)地方。可以對來自中央存儲庫的數(shù)據(jù)進(jìn)行控制或加重處理,以滿足和提高企業(yè)的效率。這個(gè)簡單的修復(fù)方法可以有效地節(jié)省數(shù)據(jù)科學(xué)家所需要的寶貴時(shí)間和精力。3、識別業(yè)務(wù)問題問題識別是穩(wěn)定運(yùn)行的一個(gè)重要方面。在構(gòu)建數(shù)據(jù)集和分析數(shù)據(jù)之前,數(shù)據(jù)科學(xué)家應(yīng)專注于識別與企業(yè)運(yùn)營相關(guān)的關(guān)鍵問題。在設(shè)置數(shù)據(jù)集之前,有必要找到問題的根源,而不是跳到機(jī)械的方法。數(shù)據(jù)科學(xué)家可以在啟動(dòng)任何分析過程之前維護(hù)受監(jiān)管的工作流程。工作流程必須考慮到所有業(yè)務(wù)利益相關(guān)者和關(guān)鍵方。特殊的儀表板軟件提供了一系列可視化小部件,可用于使數(shù)據(jù)對企業(yè)更有意義。4、將結(jié)果傳達(dá)給非技術(shù)利益相關(guān)者數(shù)據(jù)科學(xué)家的角色與業(yè)務(wù)策略相一致,他們的基本目標(biāo)是改善組織中的決策。數(shù)據(jù)科學(xué)家面臨的最大挑戰(zhàn)是與企業(yè)高管溝通他們的結(jié)果或分析。大多數(shù)管理者或利益相關(guān)者都不了解數(shù)據(jù)科學(xué)家使用的工具和設(shè)備,因此,為了通過企業(yè)AI實(shí)現(xiàn)模型,向他們提供正確的基本理念至關(guān)重要。數(shù)據(jù)科學(xué)家需要采用一些概念,比如數(shù)據(jù)講故事,為他們對概念的分析和可視化提供強(qiáng)有力的敘述。5、數(shù)據(jù)安全快速升級使組織轉(zhuǎn)向云管理來存儲其重要數(shù)據(jù)。云存儲受到網(wǎng)絡(luò)攻擊和在線欺騙的威脅,使機(jī)密數(shù)據(jù)容易受到外界的攻擊。為了防止這些網(wǎng)絡(luò)攻擊,已經(jīng)實(shí)施了嚴(yán)格的法規(guī)來保護(hù)中央存儲庫中的數(shù)據(jù)。新的指導(dǎo)方針迫使數(shù)據(jù)科學(xué)家繞開這些新規(guī)定,使他們的工作變得更加復(fù)雜。為了克服對安全的威脅,組織必須安裝高級加密和機(jī)器學(xué)習(xí)安全系統(tǒng)來保護(hù)數(shù)據(jù)。這些系統(tǒng)必須遵守所有安全規(guī)范,旨在避免耗時(shí)的審計(jì),以提高運(yùn)營效率。6、高效協(xié)作數(shù)據(jù)科學(xué)家通常與數(shù)據(jù)工程師一起為組織開展相同的項(xiàng)目。那么良好的溝通渠道是必不可少的,以消除任何沖突。組織機(jī)構(gòu)應(yīng)采取措施建立良好的溝通渠道,以確保雙方團(tuán)隊(duì)的工作流程匹配。企業(yè)還可以設(shè)立一名首席執(zhí)行官來監(jiān)督兩個(gè)部門是否在同一條線上工作。7、非特定KPI指標(biāo)的選擇有一種誤解,認(rèn)為數(shù)據(jù)科學(xué)家可以獨(dú)自完成大部分工作,并為組織面臨的所有問題提供現(xiàn)成的解決方案。這給數(shù)據(jù)科學(xué)家?guī)砹司薮蟮膲毫?,也降低了其的工作效率。對于每個(gè)組織來說,有一套確定的指標(biāo)來衡量數(shù)據(jù)科學(xué)家提出的分析是至關(guān)重要的。此外,他們必須檢查這些指標(biāo)對業(yè)務(wù)運(yùn)作的影響。

數(shù)據(jù)科學(xué)家的工作是一項(xiàng)具有挑戰(zhàn)性的工作,因?yàn)橛懈鞣N的任務(wù)和要求。然而,其是當(dāng)今市場上需求量最大的工作之一。數(shù)據(jù)科學(xué)家面臨的問題可以輕松地減少,以提高企業(yè)AI在苛刻的工作環(huán)境中的生產(chǎn)力和功能。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-06-23
數(shù)據(jù)科學(xué)家面臨的7大挑戰(zhàn)及解決方法
數(shù)據(jù)科學(xué)已經(jīng)徹底改變了企業(yè)AI,如果提供有價(jià)值的見解,以做出數(shù)據(jù)驅(qū)動(dòng)的決策,那么數(shù)據(jù)科學(xué)有很大的升級潛力。

長按掃碼 閱讀全文