亞馬遜云科技:釋放數(shù)據(jù)價(jià)值,安全是前提條件

一直以來(lái),數(shù)據(jù)安全都是重中之重。

隨著生成式AI的興起,大語(yǔ)言模型就像一把“雙刃劍”,帶來(lái)生產(chǎn)力飛速提升的同時(shí),也需要海量數(shù)據(jù)進(jìn)行持續(xù)訓(xùn)練,隨之而來(lái)就是數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)隱私保護(hù)等一系列全新的挑戰(zhàn)。

可以說(shuō),生成式AI等人工智能新趨勢(shì)正在打開(kāi)數(shù)據(jù)安全、數(shù)據(jù)治理的全新格局。用戶們需要重新全面審視自身的數(shù)據(jù)安全與數(shù)據(jù)治理。正如亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建所言:“數(shù)據(jù)已經(jīng)是現(xiàn)代發(fā)明和創(chuàng)新之源。進(jìn)入到數(shù)智化時(shí)代,數(shù)據(jù)安全是企業(yè)的首要優(yōu)先級(jí)?!?/p>

那么,面對(duì)數(shù)據(jù)安全與數(shù)據(jù)治理的新趨勢(shì),企業(yè)應(yīng)該如何在保證數(shù)據(jù)本身安全合規(guī)的前提下,全面釋放出數(shù)據(jù)的價(jià)值?為此,亞馬遜云科技圍繞業(yè)務(wù)數(shù)據(jù)的可識(shí)別、可見(jiàn)、可協(xié)作和安全數(shù)據(jù)的可操作四大場(chǎng)景提供創(chuàng)新服務(wù)和解決方案,并助力生成式AI基礎(chǔ)模型廣泛獲取內(nèi)外部數(shù)據(jù)并實(shí)現(xiàn)安全訓(xùn)練。

識(shí)別敏感數(shù)據(jù)

一直以來(lái),數(shù)據(jù)價(jià)值的釋放與數(shù)據(jù)合規(guī)就像一對(duì)“矛盾體”,讓很多企業(yè)左右為難。

事實(shí)上,數(shù)據(jù)合規(guī)乃大勢(shì)所趨。近年來(lái),全球主要經(jīng)濟(jì)體均在推動(dòng)數(shù)據(jù)合規(guī)的完善。從歐盟的GDPR,到美國(guó)的 ADPPA,再到中國(guó)的《個(gè)人信息保護(hù)法》、《數(shù)據(jù)出境安全評(píng)估辦法》等,各個(gè)國(guó)家均希望數(shù)據(jù)在合規(guī)的前提下有序流動(dòng)、共享與應(yīng)用。

比如,今年生成式AI浪潮興起,大語(yǔ)言模型帶來(lái)了數(shù)據(jù)安全與數(shù)據(jù)隱私等一系列的新問(wèn)題。國(guó)家馬上出臺(tái)了《生成式人工智能服務(wù)管理暫行辦法》來(lái)規(guī)范大模型的訓(xùn)練和保障數(shù)據(jù)安全。

在數(shù)據(jù)合規(guī)方面,敏感數(shù)據(jù)的識(shí)別、管理和分級(jí)至關(guān)重要,且耗時(shí)費(fèi)力,尤其是從多個(gè)數(shù)據(jù)源中自動(dòng)識(shí)別敏感數(shù)據(jù)是很多企業(yè)面臨的挑戰(zhàn)。陳曉建認(rèn)為,數(shù)據(jù)的安全合規(guī)需要人、流程、工具全鏈路的相互配合,并且充分利用機(jī)器學(xué)習(xí)、模式匹配等方式自動(dòng)識(shí)別敏感數(shù)據(jù),降低數(shù)據(jù)合規(guī)的操作難度。

為此,亞馬遜云科技打造出敏感數(shù)據(jù)保護(hù)解決方案(Sensitive Data Protection on Amazon Web Services, 簡(jiǎn)稱 SDP)等量身定制的工具產(chǎn)品與解決方案,允許客戶創(chuàng)建數(shù)據(jù)目錄、使用內(nèi)置或定制數(shù)據(jù)識(shí)別規(guī)則定義敏感數(shù)據(jù)類型,中心化的管理平臺(tái)讓客戶通過(guò)網(wǎng)頁(yè)應(yīng)用程序?qū)γ舾袛?shù)據(jù)資產(chǎn)進(jìn)行可視化管理,實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)合規(guī),為釋放數(shù)據(jù)價(jià)值鋪平道路。

“SDP是開(kāi)源的云原生解決方案,可以自動(dòng)發(fā)現(xiàn)敏感數(shù)據(jù)并管理數(shù)據(jù)資產(chǎn),適合存量數(shù)據(jù)多、數(shù)據(jù)類型不好判斷這兩個(gè)典型的場(chǎng)景。”陳曉建表示道。

提高數(shù)據(jù)可見(jiàn)性

數(shù)據(jù)如何充分共享永遠(yuǎn)是數(shù)據(jù)價(jià)值釋放過(guò)程中的一道難題。

因?yàn)槠髽I(yè)通常組織架構(gòu)復(fù)雜、涉及人員眾多,并且數(shù)據(jù)根據(jù)不同階段和場(chǎng)景散落在企業(yè)各個(gè)數(shù)據(jù)系統(tǒng),數(shù)據(jù)安全有效的進(jìn)行共享與協(xié)作具有極高的難度。如今,數(shù)據(jù)可見(jiàn)已經(jīng)成為企業(yè)數(shù)據(jù)治理和釋放數(shù)據(jù)價(jià)值的基礎(chǔ)。陳曉建認(rèn)為,數(shù)據(jù)可見(jiàn)是企業(yè)內(nèi)不同部門、不同角色高效挖掘數(shù)據(jù)價(jià)值的前提。

因此,企業(yè)需要構(gòu)建連接數(shù)據(jù)提供者與數(shù)據(jù)消費(fèi)者的橋梁,但出于數(shù)據(jù)安全的考慮又不能無(wú)限制地將所有數(shù)據(jù)共享給所有人。通常,在數(shù)據(jù)治理與高效協(xié)同方面,集中式和聯(lián)邦式是企業(yè)中最為常見(jiàn)的聯(lián)眾類型。這兩種方式有著各自的優(yōu)劣勢(shì)和適應(yīng)的企業(yè)規(guī)模,且均需要多個(gè)角色的高效協(xié)同。

對(duì)此,亞馬遜云科技帶來(lái)了數(shù)據(jù)管理服務(wù)Amazon DataZone,幫助企業(yè)加速數(shù)據(jù)網(wǎng)格建設(shè)以對(duì)不同網(wǎng)格來(lái)源的數(shù)據(jù)進(jìn)行共享和治理。該服務(wù)可以讓客戶更快、更輕松地對(duì)存儲(chǔ)在亞馬遜云科技、客戶本地和第三方來(lái)源的數(shù)據(jù)進(jìn)行編目、發(fā)現(xiàn)、共享和治理。此外,務(wù)Amazon DataZone通過(guò)數(shù)據(jù)所有權(quán)的去中心化、聯(lián)邦式數(shù)據(jù)治理、點(diǎn)對(duì)點(diǎn)的數(shù)據(jù)共享等功能讓數(shù)據(jù)生產(chǎn)者輕松管理和控制數(shù)據(jù)訪問(wèn),讓廣大數(shù)據(jù)開(kāi)發(fā)者、數(shù)據(jù)科學(xué)家、分析師和業(yè)務(wù)用戶可以快速實(shí)現(xiàn)協(xié)作分析。

“Amazon DataZone可幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)一站式管理,實(shí)現(xiàn)快速實(shí)現(xiàn)協(xié)作分析,并且大幅簡(jiǎn)化數(shù)據(jù)治理難度?!标悤越ㄑa(bǔ)充道。

賦能協(xié)作,激發(fā)數(shù)據(jù)價(jià)值

眾所周知,數(shù)據(jù)只有充分的流動(dòng)、共享和應(yīng)用才能發(fā)揮出最大的價(jià)值。如今,除了企業(yè)自身內(nèi)部業(yè)務(wù)數(shù)據(jù)之外,產(chǎn)業(yè)上下游和合作伙伴等第三方數(shù)據(jù)的加入也成為大勢(shì)所趨

但多方數(shù)據(jù)的協(xié)作依然面臨著數(shù)據(jù)安全、數(shù)據(jù)泄露等風(fēng)險(xiǎn),比如有些產(chǎn)業(yè)鏈上下游是通過(guò)給合作伙伴提供數(shù)據(jù)副本的方式,雖然數(shù)據(jù)實(shí)現(xiàn)了共享,但依然面臨著很大的數(shù)據(jù)泄露風(fēng)險(xiǎn)。因此,近年來(lái)多方計(jì)算、聯(lián)邦學(xué)習(xí)等隱私計(jì)算技術(shù)開(kāi)始興起,成為企業(yè)與第三方數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)共享與應(yīng)用的保障。

陳曉建認(rèn)為,數(shù)據(jù)協(xié)作參與方增多之后,必然會(huì)面臨著數(shù)據(jù)保護(hù)與業(yè)務(wù)價(jià)值安全之間的權(quán)衡,而多方安全合規(guī)計(jì)算就是目前最為合適的方式。尤其是生成式AI興起之后,大語(yǔ)言模型的訓(xùn)練更加渴望第三方數(shù)據(jù)。為此,亞馬遜云科技推出了Amazon Clean Rooms分析服務(wù),幫助企業(yè)與其合作伙伴在互相不暴露原始數(shù)據(jù)的情況下進(jìn)行數(shù)據(jù)協(xié)作,也無(wú)需在云上移動(dòng)數(shù)據(jù),從而最大化數(shù)據(jù)價(jià)值。

通過(guò)Amazon Clean Rooms分析服務(wù),企業(yè)只需幾分鐘即可創(chuàng)建一個(gè)安全的數(shù)據(jù) Clean Room,創(chuàng)建協(xié)作項(xiàng)目實(shí)現(xiàn)數(shù)據(jù)的多方協(xié)作。此外,Amazon Clean Rooms還提供了一個(gè)密態(tài)計(jì)算的環(huán)境,數(shù)據(jù)提供方在 Clean Rooms 環(huán)境中的數(shù)據(jù)能夠以加密的形態(tài)完成數(shù)據(jù)分析操作,并將分析結(jié)果解密并返回,在數(shù)據(jù)安全得到最大保護(hù)的同時(shí),還在協(xié)作方之間充分開(kāi)發(fā)了數(shù)據(jù)價(jià)值。

“多方安全合規(guī)計(jì)算還處于發(fā)展的早期階段。目前來(lái)看,非常適合亞馬遜云科技這種云環(huán)境。全球像汽車、生命科學(xué)非常渴望上下游數(shù)據(jù)交易,并且都在使用Amazon Clean Rooms服務(wù)?!标悤越ㄑa(bǔ)充道。

此外,針對(duì)生成式AI的大語(yǔ)言模型所需要的海量第三方非結(jié)構(gòu)化數(shù)據(jù),亞馬遜云科技Amazon Data Exchange提供來(lái)自300多家提供商的3500多種公共數(shù)據(jù)產(chǎn)品,數(shù)據(jù)來(lái)源包括金融、天氣、地理空間、健康醫(yī)療等非常多的行業(yè)和領(lǐng)域??蛻艨梢暂p松查找、訂閱和使用所需的各種第三方數(shù)據(jù)。Amazon Data Exchange與Amazon EMR Serverless等分析服務(wù)相結(jié)合,可以大大簡(jiǎn)化企業(yè)生成式AI應(yīng)用開(kāi)發(fā)方面的數(shù)據(jù)獲取難題,加速生成式AI落地。

提升數(shù)據(jù)可操作性

不可否認(rèn),如今企業(yè)的IT環(huán)境正在變得越來(lái)越復(fù)雜。這其中,以安全環(huán)境尤為明顯。

眾所周知,安全供應(yīng)商多、產(chǎn)品類型豐富,通常一家企業(yè)往往具有多家安全供應(yīng)商和種類繁多的安全產(chǎn)品。加上企業(yè)對(duì)于安全越來(lái)越重視,直接造成了企業(yè)的安全環(huán)境走向復(fù)雜化。針對(duì)安全類的數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)可操作,即安全日志的統(tǒng)一管理及分析,已是業(yè)界共識(shí)。

Gartner《2022 年網(wǎng)絡(luò)安全重點(diǎn)趨勢(shì)》就認(rèn)為:安全供應(yīng)商的整合排到了趨勢(shì)的第 4 位。在 2020 年有 29% 的客戶在尋求安全供應(yīng)商的整合,僅僅過(guò)了 2 年,到 2022 年這個(gè)數(shù)字就變成了 75%。

陳曉建表示,企業(yè)要想在短時(shí)間內(nèi)做到整合安全廠商,是有相當(dāng)大的挑戰(zhàn)和難度。因?yàn)?,各類安全日志和安全事件的?shù)據(jù)來(lái)自不同安全產(chǎn)品供應(yīng)商的不同產(chǎn)品,這些安全數(shù)據(jù)的整合與管理難度極大?!耙粋€(gè)用戶可能擁有超過(guò)十家安全供應(yīng)商,安全整合是大勢(shì)所趨,需要通過(guò)更好的工具去解決安全數(shù)據(jù)問(wèn)題。”陳曉建表示道。

為此,亞馬遜云科技推出了Amazon Security Lake安全數(shù)據(jù)湖服務(wù),統(tǒng)一管理來(lái)自不同廠商的日志,并且讓這些日志可被用來(lái)進(jìn)行安全事件的分析。Amazon Security Lake支持包括亞馬遜云科技、安全合作伙伴和第三方分析服務(wù)提供商在內(nèi)的80多個(gè)安全數(shù)據(jù)源。

企業(yè)可將不同來(lái)源的安全數(shù)據(jù)傳入該數(shù)據(jù)湖中并轉(zhuǎn)換為符合開(kāi)放網(wǎng)絡(luò)安全架構(gòu)框架(Open Cybersecurity Schema Framework,OCSF)要求的格式,從而自動(dòng)收集、組合和分析這些安全數(shù)據(jù)。此外,Amazon Security Lake還與亞馬遜云科技成熟的數(shù)據(jù)分析工具集成,助力企業(yè)安全團(tuán)隊(duì)在熟悉的分析環(huán)境中實(shí)現(xiàn)更快的威脅檢測(cè)、調(diào)查和事件響應(yīng),有效解決潛在安全隱患。

“從第一天起,亞馬遜云科技就把安全作為最高優(yōu)先級(jí)。針對(duì)業(yè)務(wù)數(shù)據(jù)可識(shí)別、可見(jiàn)、可協(xié)作和安全數(shù)據(jù)的可操作等難題,亞馬遜云科技通過(guò)豐富的工具集和創(chuàng)新的解決方案,致力于通過(guò)數(shù)據(jù)分析與安全服務(wù)的融合幫助客戶釋放數(shù)據(jù)價(jià)值,確??蛻粼跀?shù)據(jù)安全上無(wú)后顧之憂?!标悤越ㄗ詈蟊硎镜?。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-10-08
亞馬遜云科技:釋放數(shù)據(jù)價(jià)值,安全是前提條件
亞馬遜云科技:釋放數(shù)據(jù)價(jià)值,安全是前提條件

長(zhǎng)按掃碼 閱讀全文