12月4日,在AWS re:Invent全球大會上,AWS發(fā)布五項新的人工智能 (AI) 服務,旨在將機器學習交到更多應用程序開發(fā)者和終端用戶手中,而他們無需機器學習經(jīng)驗,也能輕松使用AI。
這五項AI新服務分別是:
1、Amazon Kendra重塑企業(yè)搜索,它利用自然語言處理及其它機器學習技術,將企業(yè)內(nèi)部的多個數(shù)據(jù)孤島統(tǒng)一起來,始終如一地為常見查詢提供高質量的結果,而不是以隨機的鏈接列表響應關鍵字查詢;
2、Amazon CodeGuru可幫助軟件開發(fā)者自動執(zhí)行代碼審核,確定應用中開銷最大的代碼行;
3、Amazon Fraud Detector基于為Amazon.com開發(fā)的相同技術,幫助企業(yè)實時識別線上身份欺詐和支付欺詐;
4、Amazon Transcribe Medical為醫(yī)療保健提供商提供高精度的、實時語音到文本轉錄,以便他們可以專注于患者護理;
5、Amazon Augmented Artificial Intelligence (A2I) 幫助機器學習開發(fā)者通過人工確認驗證機器學習預測。
具體而言
Amazon Kendra
盡管多年來多種嘗試,但內(nèi)部搜索對于當今的企業(yè)來說仍是一個棘手的問題,大多數(shù)員工仍然經(jīng)常難以找到他們需要的信息。機構擁有大量非結構化文本數(shù)據(jù),如果能夠發(fā)現(xiàn)、存儲多種格式并跨不同的數(shù)據(jù)源(例如Sharepoint、Intranet、Amazon S3和本地文件存儲系統(tǒng)),則這些數(shù)據(jù)非常有用。即使通用的、基于 Web 的搜索工具隨處可見,機構仍然發(fā)現(xiàn)內(nèi)部搜索很困難,因為沒有可用工具能夠很好地跨越現(xiàn)有數(shù)據(jù)孤島編制索引,無法提供自然語言查詢,并且無法提供準確的結果。當員工有疑問時,他們需要使用可能出現(xiàn)在不同上下文、多個文檔中的關鍵字,這些搜索通常會生成一長串隨機鏈接,員工必須篩選這些鏈接才能找到他們查找的信息(如果他們找得到的話)。
Amazon Kendra讓員工可以使用真實問題(而不僅僅是關鍵字)在多個數(shù)據(jù)孤島中搜索,在后臺部署AI技術來提供他們尋求的精確答案(而不是隨機的鏈接列表),重塑企業(yè)搜索。員工可以使用自然語言運行搜索(關鍵字仍然有效,但大多數(shù)用戶更喜歡自然語言搜索)。例如,員工可以提出一個特定問題,如“IT服務臺什么時候開?”Amazon Kendra會給他們一個具體答案,如“IT 服務臺在上午9:30打開”,同時給出指向IT門戶和其它相關網(wǎng)站的鏈接??蛻艨梢栽趹贸绦?、門戶和 wiki 中使用Amazon Kendra。只需在AWS管理控制臺中單擊幾下,客戶即可將Amazon Kendra指向其各種文檔存儲庫,服務會聚合PB級的數(shù)據(jù)以構建集中索引。Amazon Kendra會掃描文檔的權限,確保搜索結果符合現(xiàn)有的文檔訪問策略,搜索結果僅包含用戶有權訪問的文檔。此外,Amazon Kendra還根據(jù)客戶的特定情況,積極地重新訓練機器學習模型,使用點擊率數(shù)據(jù)、用戶位置和反饋提高準確性,隨著時間的推移提供越來越好的答案。
Amazon CodeGuru
跟亞馬遜一樣,AWS客戶也編寫了大量代碼。軟件開發(fā)是一個廣為人知的過程。開發(fā)者編寫代碼、查看代碼、編譯代碼和部署應用程序、衡量應用程序的性能并使用該數(shù)據(jù)改進代碼,循環(huán)往復。然而,如果代碼一開始就不正確,那么所有這些過程都沒什么用,所以團隊都會在新代碼添加到現(xiàn)有應用程序代碼庫之前執(zhí)行代碼檢查,檢查邏輯、語法和樣式。即使對于像亞馬遜這樣的大型機構,考慮其每天要編寫的代碼量,也很難有那么多有經(jīng)驗的開發(fā)者、他們有足夠的富余時間來審核代碼。而且即使是有經(jīng)驗的審閱者遇到面向客戶的應用程序時也會漏掉問題,從而導致出錯和性能問題。
Amazon CodeGuru是一種新的機器學習服務,可自動執(zhí)行代碼審核,找到應用程序開銷最大的代碼行。Amazon CodeGuru有兩個組件: 代碼審核和應用程序分析。對于代碼審核,開發(fā)者像往常一樣提交其代碼(目前支持GitHub和CodeCommit,未來會支持更多的存儲庫),將Amazon CodeGuru添加為代碼審閱者之一,無需對正常過程或要安裝的軟件進行其他更改。Amazon CodeGuru收到拉取請求,會自動開始使用經(jīng)過預先訓練的模型來評估代碼。這些模型已經(jīng)在亞馬遜和GitHub前10000的項目中經(jīng)受過數(shù)十年的代碼審核訓練。Amazon CodeGuru將檢查代碼更改的質量,如果發(fā)現(xiàn)問題,它將向拉取請求添加易于閱讀的注釋,標識出代碼行、特定問題和修正建議,包括示例代碼和指向相關文檔的鏈接。
Amazon CodeGuru還包含一個機器學習驅動的應用程序探查器,可幫助客戶找到開銷最大的代碼行。要使用它,客戶只要在其應用程序中安裝一個小小的代理程序,然后Amazon CodeGuru就可以觀察應用程序運行時,每五分鐘分析一次應用程序代碼。代碼配置文件包括有關延遲和CPU利用率的詳細信息,直接鏈接到特定的代碼行。Amazon CodeGuru可幫助操作者在應用程序中找到開銷最大的代碼行,生成火焰圖,幫助直觀地標識出造成性能瓶頸的其它代碼行。多年來,亞馬遜內(nèi)部團隊使用Amazon CodeGuru對80000多個應用程序進行了代碼分析。2017 到2018年,Amazon CodeGuru內(nèi)部版本的廣泛使用,幫助亞馬遜消費者業(yè)務的Amazon Prime Day團隊提高了其應用效率,CPU利用率提高325%,減少了管理Prime Day所需的實例數(shù)量,整體成本降低了39%。
Amazon Fraud Detector
Amazon Fraud Detector提供完全托管的服務,基于亞馬遜消費者業(yè)務使用的相同技術,實時檢測潛在的線上身份欺詐和支付欺詐,無需機器學習經(jīng)驗。Amazon Fraud Detector使用欺詐和合法交易的歷史數(shù)據(jù)來構建、訓練和部署機器學習模型,提供實時、低延遲的欺詐風險預測。首先,客戶將交易數(shù)據(jù)上傳到Amazon S3,定制模型訓練。客戶只需提供與交易關聯(lián)的電子郵件地址和IP地址,可以選擇添加其它數(shù)據(jù)(例如帳單地址或電話號碼)。根據(jù)客戶想要預測的欺詐類型(新帳戶或線上支付欺詐),Amazon Fraud Detector將預處理數(shù)據(jù)、選擇一個算法、訓練一個模型————使用亞馬遜數(shù)十年來大規(guī)模運行欺詐檢測風險分析的經(jīng)驗。Amazon Fraud Detector還使用基于機器學習的、根據(jù)亞馬遜數(shù)據(jù)訓練過的數(shù)據(jù)檢測器。這些數(shù)據(jù)檢測器可幫助識別與發(fā)生在Amazon上的欺詐活動(例如異常的電子郵件命名規(guī)律)相似的模式,即使客戶向Amazon Fraud Detector提供的欺詐示例數(shù)量很少,也可以幫助提高模型訓練的準確性。
Amazon Fraud Detector將模型訓練、部署到完全托管的私有API端點??蛻艨梢詫⑿禄顒樱ɡ缱曰蛐沦徺I)發(fā)送到API、接收包括風險評分的欺詐報告。根據(jù)此報告,應用程序可以確定正確的行動(例如接受購買,或將其傳遞給人工審核)。借助Amazon Fraud Detector,客戶可以更快、更輕松地、更準確地檢測欺詐。
Amazon Transcribe Medical
如今,醫(yī)生們的一部分日常工作,是將詳細的數(shù)據(jù)輸入病歷(EHR)系統(tǒng)。然而,幫助他們準確記錄和存檔病情的解決方案是欠佳的。在許多醫(yī)院,醫(yī)生必須將醫(yī)療筆記口述到記錄器中,然后將這些語音文件提交到第三方手動抄錄,服務成本高昂,可能需要長達三個工作日,延誤了存檔流程。另一種選擇是利用現(xiàn)有的前端聽寫軟件,但受限于現(xiàn)有的工具,醫(yī)生們?nèi)匀幻刻煲谂R床記錄上花費好幾小時。第三種選擇是醫(yī)療保健提供商雇用人工抄寫員,在醫(yī)生們看病時協(xié)助做記錄,但人工抄寫員可能會令患者感到不安,醫(yī)生們經(jīng)常提到他們的記錄有欠缺,醫(yī)療機構也很難大規(guī)模地安排和協(xié)調(diào)抄寫員??傊F(xiàn)有的解決方案在提高臨床記錄效率和改善患者護理方面都有不足。
Amazon Transcribe Medical通過使用機器學習技術自動轉錄自然醫(yī)學語音來解決這些問題。建立在 Amazon Transcribe Medical語音到文本功能之上的病歷應用,可以準確、經(jīng)濟實惠地生成記錄。Amazon Transcribe Medical由多個機器學習模型組成,這些模型經(jīng)過數(shù)萬小時的醫(yī)學語音訓練,可提供準確的、機器學習驅動的醫(yī)學轉錄。實時生成記錄,消除了多日的流轉時間。
Amazon Transcribe Medical可以幫助醫(yī)生們在跟患者溝通時自動轉錄對話,不用分心手動筆記,醫(yī)療保健提供商能夠專注于患者護理。醫(yī)生可以自然地說話,Amazon Transcribe Medical使用內(nèi)置的自動標點符號,克服現(xiàn)有轉錄軟件的局限性。對于醫(yī)療保健提供商,基于Amazon Transcribe Medical的語音解決方案可擴展到數(shù)千個潛在的醫(yī)療中心,消除了管理和協(xié)調(diào)臨時抄寫員的操作難題。Amazon Transcribe Medical符合HIPAA認證,提供易于使用的 API,可與支持語音的應用程序和帶有麥克風的任何設備集成。Amazon Transcribe Medical的輸出文本也可以用于其他AWS服務,例如自然語言處理服務Amazon Comprehend Medical,在最終進入病歷系統(tǒng)前進行下一步的數(shù)據(jù)分析。
Amazon Augmented Artificial Intelligence (A2I)
機器學習可以為各種應用場景提供高度準確的預測,包括識別圖像中的對象、從掃描的文檔中提取文本、或者轉錄與理解口語。在每種情況下,機器學習模型都會提供預測,提供置信度分數(shù)以表示模型預測的確定性。置信度分數(shù)越高,結果的可信度就越高。對于許多應用場景,當開發(fā)者收到高置信度結果時,他們可以信任其結果可能是準確的,可以自動處理它們(例如,自動調(diào)整社交網(wǎng)絡上用戶生成的內(nèi)容,或者給視頻加字幕)。但是,在置信度低于預期的情況下,預測結果模糊,可能需要人工審核才能解決這種模糊性。機器學習和人工審閱之間的這種相互作用,對于機器學習系統(tǒng)的成功至關重要,但人工審核的大規(guī)模構建和運營,很有挑戰(zhàn),成本高昂,通常涉及多個流程步驟,需要定制軟件管理人工審核任務和結果,需要招聘和管理大量審核人員。結果,開發(fā)者時常花費大量的時間來管理人工審核過程,而不是構建其預想的應用程序,或者不得不放棄人工審核,導致許多預測的信心和效用都很低。
Amazon Augmented Artificial Intelligence (A2I) 是一項新服務,使用它很容易構建和管理機器學習應用程序的人工審核。Amazon A2I為常見的機器學習任務——例如圖像中的對象檢測、語音轉錄和內(nèi)容審核——提供預構建的人工審核工作流,方便對來自Amazon Rekognition和Amazon Textract的機器學習預測做人工審核。開發(fā)者為其特定應用程序選擇置信閾值,所有置信度分數(shù)低于閾值的預測都將自動發(fā)送給人工審核人員進行驗證。開發(fā)者可以選擇Amazon Mechanical Turk的50萬全球人工、預授權人工的第三方機構如Startek、iVision、CapeStart、Cogito和iMerit、或他們自己的審核人員執(zhí)行其審核。審核結果存儲在Amazon S3中,開發(fā)者在審核完成后會收到通知,以便他們根據(jù)審核人員的可信結果進行下一步操作。Amazon A2I為所有開發(fā)者帶來了人工審核,消除了構建和管理定制審核流程或招募大量審核人員方面的繁重工作。
截至目前,AWS提供超過175項全功能的服務,涵蓋計算、存儲、數(shù)據(jù)庫、聯(lián)網(wǎng)、分析、機器人、機器學習與人工智能、物聯(lián)網(wǎng)、移動、安全、混合云、虛擬現(xiàn)實與增強現(xiàn)實、媒體,以及應用開發(fā)、部署與管理等方面,遍及22個地理區(qū)域的69個可用區(qū)。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )