智行千里,“人文”為本:可視化文本分析將引領人工智能3.0時代

2020年第二季度的Forrester Wave分析報告中,SAS被評為基于AI的文本分析領域領導者。

2020年7月20日,中國北京 — 近日,全球領先的獨立研究機構Forrester發(fā)布2020年第二季度的Forrester Wave分析報告。與往年有所不同,今年的報告首次將“基于人工智能的文本分析平臺”的分析主題分為“文檔數(shù)據(jù)”和“個人數(shù)據(jù)”兩大方向。而作為全球數(shù)字分析領域的領導者,SAS憑借多年以來在文本分析上的技術深耕以及人工智能上的創(chuàng)新成果,同時被Forrester Wave分析報告評為基于人工智能的“文檔數(shù)據(jù)”和“個人數(shù)據(jù)”文本分析雙領域的領導者。

眾所周知,大部分的商業(yè)相關信息都是以非結構化格式(主要是文本數(shù)據(jù))而存在的,但是由于近年來數(shù)據(jù)的爆發(fā)式激增,不僅使本來非結構化的數(shù)據(jù)被進一步沉積,也讓數(shù)據(jù)質量更加糅雜。倒逼之下,越來越多的企業(yè)竭力尋找更高效、更智能的工具來獲得快速增長的數(shù)據(jù)并從中挖掘出可實現(xiàn)的價值。但是,一些錯綜復雜的因素(比如:價格、專家評定、學習過程、時間)成為企業(yè)尋找“得手”工具的阻礙??梢暬谋痉治銎脚_的出現(xiàn),能幫助企業(yè)擺脫這種“進退兩難”的境地,并讓收集信息比以前更加簡單??梢暬谋痉治銎脚_讓每一個人都能夠在數(shù)據(jù)驅動基礎上增加決策程序,同時這個平臺也可成為一些綜合商業(yè)智能計劃的重要成分。

“對于不同的行業(yè)領域,任何企業(yè)和機構都可從海量的非結構化數(shù)據(jù)中挖掘出深刻洞察和巨大商業(yè)價值”。SAS公司高級產(chǎn)品市場經(jīng)理Katie Tedrow表示:“文本分析確實可以幫助企業(yè)機構解決復雜的業(yè)務問題,例如偵測欺詐行為、評估客戶反饋等,但是傳統(tǒng)的分析流程更傾向于勞動密集型,更依賴手動操作且需要更多的人力投入。SAS可視化文本分析(SAS Visual Text Analytics)則通過自然語言處理(NLP)、機器學習和語言規(guī)則等強大功能,幫助商業(yè)用戶輕松挖掘非結構化數(shù)據(jù)背后隱藏的價值,制定商業(yè)決策并提升用戶體驗?!?/p>

以“人文”為本,透視非結構化數(shù)據(jù)中蘊藏的金礦

針對結構化數(shù)據(jù)的可視化在許多公司中成為最優(yōu)也是最便捷的文本分析方式。但是無法回避的是,許多企業(yè)仍然被淹沒在巨大的數(shù)據(jù)量以及文本數(shù)據(jù)源快速增長的洪流當中。因此許多的數(shù)據(jù)都夾雜了大量的非結構化數(shù)據(jù)。

文本數(shù)據(jù)一直存在且隨處可見。這些數(shù)據(jù)可以在你公司內(nèi)部的郵件信息、聊天記錄以及搜集到的調(diào)查結果中得到,也可以是你對個人網(wǎng)站上的評論、對客戶關系管理系統(tǒng)中的評論或者是從你使用的個人應用程序中得到的文本字段。甚至是你在公司外部的社會媒體、論壇以及來自于一些你很感興趣的話題的評論。因此,這些文本數(shù)據(jù)零散且冗雜,對于企業(yè)而言針對這些非結構化數(shù)據(jù)進行文本分析有些“入不敷出”。所以有些企業(yè)現(xiàn)在正投資幾十億美金分析結構化數(shù)據(jù),卻對非結構化數(shù)據(jù)置之不理。

熟不知,無論是各類文檔數(shù)據(jù),還是能夠描繪用戶畫像的個人數(shù)據(jù),在這些非結構化數(shù)據(jù)中都蘊藏著有用的信息寶庫,利用數(shù)據(jù)可視化工具分析非結構化數(shù)據(jù)能夠幫助企業(yè)快速地了解現(xiàn)狀、顯示趨勢并且識別新出現(xiàn)的問題。在Forrester Wave基于人工智能的文檔數(shù)據(jù)和個人數(shù)據(jù)文本分析平臺兩大分析報告中,SAS可視化文本分析秉持“人文為本”的研發(fā)和優(yōu)化策略,在諸多子類別評選中均獲得了最高分,包括:子文檔分析、機器學習能力、架構、安全性、產(chǎn)品支持及服務、全球市場表現(xiàn)等。

兩份報告都指出:“SAS可視化文本分析進一步完善了自身強大的分析產(chǎn)品和解決方案組合,它主要基于SAS Viya 平臺,不僅能夠實現(xiàn)不同應用場景之間的數(shù)據(jù)共享和模型管理,更輔以杰出的商業(yè)智能、便捷的分析圖形用戶界面和其他微服務架構,為企業(yè)和用戶提供絕佳的用戶體驗?!?/p>

讓機器決策,賦能文本分析引領人工智能3.0時代

事實上,“人工智能”正式提出時,計算機國際象棋和機器翻譯就是人工智能的兩個標志性目標,但直到國際象棋甚至圍棋都被人工智能所攻克,機器認知智能的核心能力之一,即自然語言處理(NLP)能力依然無法和人類相比。

NLP大致包含三個技術層面:詞法分析、句法分析、語義分析,三者之間既遞進又相互包含,這也構成了NLP技術的最大瓶頸。由于詞句往往在具體的場景下?lián)碛胁煌暮x,人在理解時會基于已有知識儲備和上下文環(huán)境,然而人工智能目前還很難做到。要讓機器理解我們?nèi)祟惖恼Z言,機器必需共享與我們類似的背景知識,還需要依賴深度學習技術,這也就需要大規(guī)模甚至超大規(guī)模的數(shù)據(jù)積累,讓機器不斷訓練和學習。

SAS公司副總裁兼大中華區(qū)董事總經(jīng)理何偉信表示:“回首人工智能發(fā)展的60多年,我們經(jīng)歷了“算法為重”的1.0階段,現(xiàn)在則進入“數(shù)據(jù)凸顯”的2.0階段,但真正步入“讓機器做明智決策”的3.0階段,還需要大量數(shù)據(jù)積累和技術的提升。因此,實現(xiàn)認知智能不僅是當前人工智能領域發(fā)展的重要使命,更是SAS未來幾年不斷探索追求的終極目標?!?/p>

SAS可視化文本分析就融合了智能算法、NLP、機器學習等創(chuàng)新技術,自動抽取非結構化數(shù)據(jù)中的關系和模式,從而使手動分析成為歷史。NLP工具可幫助用戶進行情感分析,將語音轉化為文本,理解自然語言并生成自然語言。例如,通過NLP訪問和分析未挖掘的數(shù)據(jù),使金融機構能夠提高反洗錢(AML)調(diào)查的管理效率和精準度。采用自動化分析后,調(diào)查人員可以使用統(tǒng)一的風險識別手段來應對負面新聞監(jiān)測、交易單據(jù)違規(guī)監(jiān)控等繁雜的業(yè)務場景。這使得用戶能夠了解各個事件的風險級別,然后優(yōu)先調(diào)查風險最大的事件。

以“知的力量”,讓智能分析服務人類社會健康發(fā)展

一直以來,SAS都秉持“知的力量”,對其簡單易用且功能強大的自動化分析平臺進行完善和升級,以幫助數(shù)字顛覆者和新興領導者開辟前進的道路。最新版的SAS Viya 、SAS平臺、SAS可視化文本分析等均加入人工智能相關的創(chuàng)新技術,尤其在機器學習、計算機視覺、NLP以及其它支持人工智能的技術領域大舉發(fā)力。

特別是SAS近年來宣布將投資10億美元用于人工智能,在此基礎上SAS還將改進計算機視覺軟件,以幫助企業(yè)利用可視化數(shù)據(jù)來改善業(yè)務成果。“我們一直不斷推行‘知的力量’并強調(diào)智能創(chuàng)新,這一點清晰地體現(xiàn)在SAS平臺和SAS人工智能技術中。創(chuàng)新推動著領先的公司、管理人員和數(shù)據(jù)科學家通過應用高級分析來改變其公司、行業(yè)的發(fā)展軌跡,甚至為人類社會謀福祉”。SAS首席執(zhí)行官Jim Goodnight表示。

因此,正值疫情期間,SAS還發(fā)布了COVID-19科學文獻搜索與文本分析平臺,該平臺為研究人員提供了免費的可視化文本分析環(huán)境,憑借強大的人工智能和機器學習技術,讓相關人員能夠從數(shù)以萬計的研究文獻中檢索最需要的文本內(nèi)容,不僅讓研究人員能夠更快、更精準地找到潛在的解決方案,同時也為疫情防控做出貢獻。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )

贊助商
2020-07-20
智行千里,“人文”為本:可視化文本分析將引領人工智能3.0時代
2020年第二季度的Forrester Wave分析報告中,SAS被評為基于AI的文本分析領域領導者。

長按掃碼 閱讀全文