6月26日消息(趙婷婷)6月26日至28日,由中國信息通信研究院、中國通信標準化協(xié)會主辦,中國通信標準化協(xié)會大數據技術標準推進委員會(CCSA TC601)承辦的2023大數據產業(yè)發(fā)展大會在京召開,中國信通院云大所所長何寶宏在大會主論壇上發(fā)布《2023大數據十大關鍵詞》。
何寶宏指出,數據從計算機語言到成為生產要素的全生命周期包括七個環(huán)節(jié),數據資源化、數據治理、數據資產化、數據開發(fā)應用、數據流通、數據要素市場建設、數據安全。而今年的十大關鍵詞中有四項分布于數據開發(fā)應用環(huán)節(jié),兩項分布于數據要素市場環(huán)節(jié),兩項分布于數據安全環(huán)節(jié),體現出了今年發(fā)展的重點在于數據的業(yè)務賦能與內外部融通,以及繼續(xù)夯實安全基礎。
《2023大數據十大關鍵詞》如下:
關鍵詞一:湖倉一體,數據平臺發(fā)展進入融合一體化新階段
隨著移動互聯網飛速發(fā)展,為滿足多種數據類型存儲、多場景分析等業(yè)務訴求,部分企業(yè)采用在一個數據平臺之上混合部署數據湖和數據倉庫,通過ETL進行數據交換的業(yè)務架構。湖+倉混合架構存在存儲成本高、時效性差、易出現一致性問題、開發(fā)運維難度高四大問題。
為解決這四大問題,湖倉一體技術應運而生,湖倉一體是融合數據湖與數據倉庫的優(yōu)勢,形成一體化、開放式的數據處理平臺,底層支持多數據類型統(tǒng)一存儲,實現了一份數據、一套任務在數據湖、數據倉庫之間無縫調度和管理,上層則通過統(tǒng)一接口進行訪問查詢和分析。
湖倉一體打破了數據倉庫與數據湖之間的壁壘,構建在數據湖低成本的數據存儲架構之上,同時具備數據倉庫的數據處理和管理能力。隨著各行業(yè)數字化轉型的不斷推進,湖倉一體平臺市場需求持續(xù)增長,亞馬遜、阿里云、騰訊云等廠商紛紛推出湖倉一體產品,并在互聯網、電信、金融等行業(yè)得到廣泛應用。
關鍵詞二:數據資產化,產學研齊推進,關鍵環(huán)節(jié)有望突破
以加快培育發(fā)展數據要素市場為最終目標,產學研各界紛紛開展數據資產化研究與實踐。
近三年,數據資產化實踐如火如荼。數據權屬方面,以數據交易所和知識產權局為代表的機構提出了數據資產登記的要求,為數據資產規(guī)范交易奠定基礎。數據估值方面,數據資產估值的目的和對象逐漸清晰,企業(yè)關注點從數據應用價值視角向數據資本視角轉移,例如光大銀行根據前期的研究基礎,完成對貴陽移動金融發(fā)展有限公司授信1000萬元,是數據估值實踐的一大突破。數據入表方面,財政部會計司于去年發(fā)布了《企業(yè)數據資源相關會計處理暫行規(guī)定(征求意見稿)》,提出根據數據資源的持有目的、形成方式等,對數據資源相關交易和事項進行會計確認、計量和報告,為數據資產入表提供了一種思路。場內數據交易方面,以北京、上海、貴陽、深圳等為代表的數據交易所紛紛搭建了交易平臺,構建交易生態(tài)圈,推動交易市場健康有序發(fā)展。
信通院云大所在數據資產化方面的工作也作出了相關部署。一是聯合大數據局、通信、金融等機構,發(fā)布數據估值標準;二是聯合數據交易所開展數據產品的數據質量評估;三是制定了數據資產運營能力成熟度的標準。
關鍵詞三:DataOps,標準引領,國內DataOps已進入規(guī)模落地階段
數據研發(fā)運營一體化(DataOps)是數據開發(fā)的新范式,它將敏捷、精益等理念融入數據開發(fā)過程,通過對數據相關人員、工具和流程的重新組織,打破協(xié)作壁壘,構建集開發(fā)、治理、運營于一體的自動化數據流水線,不斷提高數據產品交付效率與質量,實現高質量數字化發(fā)展。
隨著產業(yè)實踐的與理論研究發(fā)展,DataOps已從模糊的概念期逐步演化至落地實踐階段。2022年,中國信通院與多家頭部的通信、金融、互聯網企業(yè)共同成立DataOps標準工作組,并發(fā)布《DataOps能力框架模型》,定義了DataOps的七大能力域;2022年底,工作組發(fā)布研發(fā)管理能力域的細化標準。2023年上半年,工作組發(fā)布《DataOps實踐指南(1.0)》,從最佳實踐中抽象DataOps的理論框架,為產業(yè)界實踐DataOps提供理論參考;中國信通院依據DataOps研發(fā)管理能力域標準,開展評估貫標工作,驗證了工行、農行、浙江移動、江蘇移動等領先企業(yè)在數據研發(fā)管理方面的能力,以評促建,推動這些機構完善自身能力。同時中國信通院還發(fā)起了“DataOps社區(qū)”,目前有130家機構加入,根據調研,這些機構均已經開展DataOps相關實踐,國內DataOps已經進入規(guī)?;涞仉A段。
關鍵詞四:數據服務,服務體系建設成為數據中臺發(fā)展規(guī)劃的重點
隨著各方數據中臺底層能力建設的逐步成熟,數據服務成為了數據中臺建設的重點方向。快手、建設銀行以及中國移動等各領域頭部企業(yè)的數據中臺團隊均將數據服務能力建設作為2023年工作的重點。數據服務能力的建設方向主要有以下三個:一是構建多樣化的數據服務方式,以滿足不同業(yè)務需求;二是整合分散的數據服務平臺,構建統(tǒng)一的數據服務用戶界面,實現服務門戶一體化;三是完善數據服務的全生命周期運營管理,實現服務運營規(guī)范化。通過提供多樣化的數據服務、一體化的數據服務門戶,以及規(guī)范化的數據服務運營,企業(yè)能夠讓更多的用戶高效地使用數據中臺的各項能力,從而充分地發(fā)揮數據中臺價值。
2022年4月至今,信通院牽頭聯合行業(yè)專家和頭部企業(yè)共同編制《數據中臺能力成熟度模型》系列標準,數據服務能力作為數據中臺六大能力域之一納入到了該標準體系。2023年上半年,浙江移動、工商銀行完成了基于該標準的首批數據服務能力評估。
關鍵詞五:智能增強分析,數據分析的智能化升級
智能增強型數據分析工具是通過機器學習、自然語言處理等智能化技術提升數據分析流程中的數據準備、洞察發(fā)現、結果輸出共享三方面能力,從而提升數據分析工作的自動化程度。此概念由gartner于2017年提出,但受限于當時的AI技術水平,該領域并未取得突破性的發(fā)展。隨著2023年AIGC技術的火熱,其在數據分析領域的應用也受到了各方關注。微軟PowerBI、百度SugarBI、觀遠BI等團隊紛紛加快智能增強型數據分析方向的探索和布局,并推出以BI+大模型為理念的智能增強型分析工具。
智能增強型數據分析工具使用戶能通過對話式的形式同工具進行交互;工具通過語義解析,調用相關的數據源,適配相應的分析算法和數據可視化呈現方式,并自動生成統(tǒng)計圖表、文字見解和分析報告;智能增強型數據分析工具使得數據分析工作可以通過類似聊天的形式輕松完成,使非技術背景的用戶能夠以更低的門檻、更高的效率實現具有一定深度的分析,使數據能夠賦能于更多一線人員,這將極大地促進數據分析工作的普惠化發(fā)展。
關鍵詞六:數據倫理,國家數字經濟治理體系重要組成部分
大數據、人工智能等新技術的蓬勃發(fā)展促進了科技創(chuàng)新和經濟發(fā)展。但大數據應用的負面效益也不容忽視,如大數據殺熟、隱私數據泄露、數據濫用、不良內容推薦等現象層出不窮,人類基于傳統(tǒng)生活世界的倫理價值也面臨著巨大挑戰(zhàn)。因此,自2021年開始,我國針對數據安全、個人信息保護、科技倫理等問題陸續(xù)出臺多項法律法規(guī)旨在搭建數據倫理治理框架,持續(xù)推進科技向善發(fā)展;縱觀國際社會,美國自2020年開始加速數據倫理體系的布局,目前已涵蓋理論框架、實踐指引、相關立法三個層面。為了更好的治理細分領域數據倫理問題,2023年2月美商務部發(fā)布的《商業(yè)數據倫理框架》是其在商務領域的補充。由此可見,建立完善的數據倫理治理體系是保障數字經濟健康發(fā)展的必要條件,需要政府、企業(yè)和社會各方面的共同努力。
關鍵詞七:數據基礎制度,破解數據要素價值釋放難題
去年年底,中共中央、國務院印發(fā)《關于構建數據基礎制度 更好發(fā)揮數據要素作用的意見》,也就是“數據二十條”。這是我國首部從生產要素高度部署數據要素價值釋放的國家級專項政策文件,具有里程碑式的重大意義。
“數據二十條”綱舉而目張,首先明確了構建數據基礎制度、發(fā)揮數據要素作用的前提、主線和目標,即在維護國家數據安全、保護個人信息和商業(yè)秘密的前提下,促進數據合規(guī)高效流通使用、賦能實體經濟,從而充分實現數據要素價值、促進全體人民共享數字經濟發(fā)展紅利。進一步地,“數據二十條”具體提出了適應數據特征、符合發(fā)展規(guī)律、彰顯創(chuàng)新引領的數據基礎制度體系,具有獨特的政策設計,即以基礎制度破解數據要素價值釋放中的基礎性問題。保障權益、合規(guī)使用的數據產權制度,合規(guī)高效、場內外結合的數據要素流通和交易制度,體現效率、促進公平的數據要素收益分配制度,安全可控、彈性包容的數據要素治理制度,這四大制度構成了數據基礎制度的“四梁八柱”,為進一步推動數據要素價值釋放指明了方向。
關鍵詞八:公共數據授權運營,全國各地廣泛開展,走向規(guī)?;c規(guī)范化
2022年12月,“數據二十條”發(fā)布,提出要建立公共數據確權授權機制,為此前公共數據開發(fā)利用中存在爭議的“所有權”問題提供了一種合理解決思路,為公共數據授權運營帶來了全新機遇。
前期,北京、海南、貴州、成都等地區(qū)積極開展各類創(chuàng)新實踐探索,基本形成了公共數據的授權運營模式。公共數據管理機構進行資源整合,統(tǒng)一推進開發(fā)利用,授權運營機構或加工方進行數據處理加工,以產品或服務的形式進入市場,提供給應用方。
2023年以來,在“數據二十條”指導下,各地方積極落實了針對性舉措。一是杭州、濟南、青島、武漢、煙臺、鄭州等地相繼發(fā)布公共數據授權運營管理辦法,推進建立工作機制。二是河南、福建、湖北、湖南、蘇州等地相繼成立地方數據集團公司作為開展授權運營的市場主體,推動公共數據與社會數據融合開發(fā)利用。
人社部、民航局、最高法等行業(yè)主管部門也開展了以行業(yè)為單位的探索,形成了電子社??ā⒑铰每v橫、司法大數據服務網等產品及服務,為公共數據價值釋放提供新思路。
但目前為止,公共數據尚未形成統(tǒng)一的授權運營機制,實踐中存在風險和挑戰(zhàn),還需要探索更完善的標準規(guī)范體系,從運營主體能力、運營平臺技術、運營成果等方面切入,促進規(guī)范化發(fā)展。
關鍵詞九:數據安全風險評估,數據安全治理的重要抓手
數據要素市場化發(fā)展的不斷演進對數據安全底座能力的要求不斷提升。數據安全風險評估作為數據安全治理能力提升的關鍵環(huán)節(jié),一方面受國家各項政策驅動備受關注,另一方面隨著數據泄露等事件的愈演愈烈,基于風險防范目標而開展的數據安全工作也成為業(yè)務數字化健康發(fā)展中的必選題。因此,數據安全風險評估正在成為數據安全治理的重要抓手,國家也在標準化工作、實踐指南等方面做出了相應探索。此前,中國信通院也提出了基于系統(tǒng)管理安全、系統(tǒng)數據安全、系統(tǒng)應用安全的數據安全風險評估框架,助力企業(yè)數據安全風險防范。
關鍵詞十:數據出境,三條路徑從理論走向實踐
隨著2023年6月1日《個人信息出境標準合同辦法》的正式施行,數據出境話題再次引發(fā)熱議。自國家網信辦發(fā)布第一版《數據出境安全評估申報指南》,各省市積極跟進響應,或開展解讀活動,或發(fā)布當地申報指南,為出境評估工作的順利開展探索實踐路徑。同時,個人信息保護認證、個人信息出境標準合同辦法也進入大眾視野。三條出境路徑各有適用場景,互為補充,為數據出境工作的落地實踐提供指導。
《2023大數據十大關鍵詞》涵蓋政策、理念、安全、技術等等支撐數據要素價值釋放的方方面面,表明我國大數據產業(yè)已形成政策引領、理念先行、技術支撐、安全護航的健康發(fā)展格局。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 國家發(fā)改委成立低空經濟發(fā)展司
- 什么是人工智能網絡? | 智能百科
- 工信部:2025年推進工業(yè)5G獨立專網建設
- 人工智能如何改變全球智能手機市場
- 企業(yè)網絡安全挑戰(zhàn)頻出?Fortinet 給出破解之法
- 2025年生成式人工智能將如何影響眾行業(yè)
- 報告:人工智能推動數據中心系統(tǒng)支出激增25%
- 千家早報|馬斯克預測:人工智能或將超越單個人類;鴻蒙生態(tài)(武漢)創(chuàng)新中心啟用,推動鴻蒙軟硬件在武漢首試首用——2024年12月27日
- 中移建設被拉入軍采“黑名單”
- 大理移動因違規(guī)套現等問題,擬被列入軍采失信名單
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。