騰訊李學朝:推動交互智能走向產業(yè)應用,打造有智能、有形象、可生動交互的“數(shù)智人”

11月4日,在2021騰訊數(shù)字生態(tài)大會的云智能專場中,騰訊智能產品副總裁、騰訊教育副總裁李學朝通過題為《溝通有溫度,服務新高度》的主題演講,正式發(fā)布了騰訊云小微基于新一代多模態(tài)人機交互技術的全新數(shù)智人產品矩陣,并對外分享了數(shù)智人產品的技術優(yōu)勢、業(yè)務場景和應用案例。

騰訊李學朝:推動交互智能走向產業(yè)應用,打造有智能、有形象、可生動交互的“數(shù)智人”

(騰訊智能產品副總裁、騰訊教育副總裁李學朝)

AI助手不僅要提供更加智能的交互體驗,還需要通過自學習和自適應等來提升對于行業(yè)、應用和用戶的理解能力、應變能力和表達能力。”李學朝表示,為賦予AI助手交互智能的能力,騰訊云小微整合了語音交互、自然語言理解、圖像識別等AI能力,融合AI Lab前沿AI技術以及搜狗數(shù)字人團隊豐富的業(yè)務模式,打造了基于新一代多模態(tài)人機交互技術的全新數(shù)智人產品矩陣,實現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級。

談及數(shù)智人的技術優(yōu)勢時,李學朝介紹道,在NLP、知識圖譜、視覺等全棧AI底層能力的加持下,數(shù)智人擁有強大的形象表現(xiàn)力、識別力和感知理解能力,能在不同行業(yè)的多種業(yè)務場景下做到“聽得清、聽得懂、會表達”;而3D超寫實、3D寫實、3D半寫實、2D真人、2D卡通五種數(shù)智人的風格,搭配可定制形象和騰訊海量IP形象授權,能讓數(shù)智人擁有豐富多樣的人物形象,以滿足不同場景下的服務需求。

騰訊李學朝:推動交互智能走向產業(yè)應用,打造有智能、有形象、可生動交互的“數(shù)智人”

(五款數(shù)智人亮相)

“云小微數(shù)智人應用服務的兩大場景,分別是企業(yè)服務和生活服務。”李學朝表示,目前數(shù)智人已經為金融、文教傳媒、公共服務等行業(yè)的體驗型業(yè)務場景提供解決方案,以坐席客服、審核面簽、理財顧問等形象為用戶提供智能交互的新體驗,幫助企業(yè)在提升服務體驗的同時實現(xiàn)降本增效的目的。

以金融行業(yè)為例,騰訊云小微數(shù)智人助力平安普惠打造了首個金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,兩年間已經為500萬個用戶提供7x24小時的自然可視化的人機智能交互服務,在提升用戶服務體驗的同時,將審核成本降低60%。

“我們希望的是,通過數(shù)智人,在生活服務中為用戶帶來更多陪伴、更多信息交互以及更深的情感鏈接。”李學朝表示,未來,騰訊云小微數(shù)智人希望能夠突破時間和空間的限制,打破虛擬和現(xiàn)實的邊界,在數(shù)字化進程中為各行各業(yè)提供有溫度的智能交互服務,助力各行各業(yè)的智慧化轉型。

  以下為演講實錄:

尊敬的各位嘉賓、媒體朋友和線上的觀眾朋友們:

大家好,我是騰訊李學朝,很高興能在騰訊一年一度的數(shù)字生態(tài)大會中與大家進行交流。

今天主要跟大家分享的是,騰訊云小微數(shù)智人的全新產品,并且從技術到服務,從內到外,從現(xiàn)在到未來,講一講我們“開啟有溫度的數(shù)智未來“的愿景是怎樣展開的。

隨著人工智能、大數(shù)據、物聯(lián)網等技術高速發(fā)展,各行業(yè)數(shù)字化進程加快,不同業(yè)務場景對線上用戶服務都提出了更高的要求,AI助手除了要提供更加智能的交互體驗,還需要通過自學習自適應等來提升對于行業(yè)、應用和用戶的理解能力、應變能力和表達能力。人機交互模式從文本客服升級為語音客服再到多模態(tài)人機交互系統(tǒng),也就是大家常說的數(shù)字人,溝通效率和服務溫度都得到了大幅提升。

而騰訊云小微通過整合語音交互、自然語言理解、圖像識別等AI能力,同時連接騰訊豐富的內容和服務生態(tài),面向使用場景打磨平臺能力,助力行業(yè)客戶打造有智能、有形象、可交互的數(shù)字分身,實現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級,也就是騰訊云小微與AI Lab聯(lián)合開發(fā)的新一代多模態(tài)人機交互系統(tǒng)——數(shù)智人。

最近搜狗正式并入騰訊,也為數(shù)智人能力提供了助力。數(shù)智人產品深度聯(lián)動了云小微、AI Lab、搜狗,匯聚云小微綜合AI能力,融合AI Lab前沿AI技術,以及搜狗數(shù)字人團隊豐富的業(yè)務模式、作為多模態(tài)能力的服務載體,便捷地服務于機構、企業(yè),持續(xù)賦能行業(yè)。

這些能力從內而外賦予了產品極大的優(yōu)勢。

首先,通過AI技術的加持,數(shù)智人產品目前已擁有強大的形象表現(xiàn)力、識別力和理解能力,并且能夠保證最優(yōu)服務性能,在很多場景中都能做到“聽得清、聽得懂、會表達”。

聽得清就是能夠把人的聲音精準轉化成文本。騰訊云小微在語音識別方面深耕建模、降噪、口音與領域適應等技術能力,讓數(shù)智人能夠適應各種復雜的噪聲環(huán)境。同時,可識別超過34種語種、方言,擁有超過46萬的垂直場景熱詞庫。

聽清后還需要聽得懂。騰訊云小微數(shù)智人結合知識圖譜能力和垂直領域庫,并充分運用全雙工的能力,通過語音(ASR)+語義(NLP)雙向判斷,降低錯誤響應概率,可進行超過11個語種的機器翻譯;同時,通過流式語義+語義VAD,在商用環(huán)境中,服務端推流渲染方案文本驅動首幀延遲已降低至600ms內,單臺服務器并發(fā)上限,半年內提升了60%,在保障交互體驗的同時,大幅提升了接待的效率。

在表達交流能力上,騰訊云小微數(shù)智人由個性化沉浸式TTS、有風格的語音合成技術、以及具備形象、情緒和動作的虛擬人合成,擁有超過28種語音合成音色,超過30個擬人化形象,在技術內測中實現(xiàn)了根據語義匹配肢體動作,把對話內容多模態(tài)多層次地表達出來。

此外,為了讓數(shù)智人有個性、有情感、更真實生動,我們提供了3D超寫實、3D寫實、3D半寫實、2D真人、2D卡通等5類數(shù)智人形象風格,擁有超細微面部情感表情以及數(shù)百種肢體動作,可以滿足各類場景需求。同時,擁有騰訊的海量IP形象授權,讓數(shù)智人的形象選擇更加豐富多樣。

每一位數(shù)智人都擁有著不同的形象和性格,可從事不同的職業(yè),并且,每一位都身懷絕技,與眾不同。這兩天,他們也參與到了數(shù)字生態(tài)大會多個專場的主持工作中,為所有與會觀眾帶來了他們的“職業(yè)首秀”。

云小微數(shù)智人一直在通過不斷的自學習、自適應,以求為用戶提供更主動、更專業(yè)的服務。目前,他們已經以不同的形象出現(xiàn)在金融、傳媒、文旅、出行等多個行業(yè)中,踐行著我們服務于人的理念。接下來讓我們看看,云小微數(shù)智人的落地應用情況。

云小微數(shù)智人應用服務的兩大場景,分別是企業(yè)服務和生活服務。

在企業(yè)服務方面,以往一直是以企業(yè)和服務提供者為中心,現(xiàn)在我們轉變?yōu)橐韵M者和使用者為中心,通過人機交互與協(xié)創(chuàng),提升服務體驗的同時實現(xiàn)降本增效。在生活服務方面,數(shù)智人以用戶體驗提升為中心,通過實現(xiàn)“軟硬結合”,給用戶提供智能交互的新體驗。

在企業(yè)服務場景中,數(shù)智人已優(yōu)先面向金融、文教傳媒、公共服務等行業(yè)的體驗型業(yè)務場景提供解決方案,可擔任坐席客服、審核面簽、理財顧問、資訊播報、會展主持、導游導覽等多種角色。

接下來大家可以通過幾個案例進行更深入的了解:

在金融領域,我們助力平安普惠落地了首個金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,針對企業(yè)面臨的人工成本攀升、人力缺乏、員工工作時間無法保障全時段服務等痛點,通過自然可視化的人機智能交互,打造金融數(shù)智人分身。目前已累計服務用戶500萬,審核成本降低60%,保障了2年間7x24h的在線服務,極大提升了用戶服務體驗。

在疫情期間,觀眾無法親臨展廳和現(xiàn)場,近距離參與各項活動,給很多展會活動的舉辦帶來了困難。我們?yōu)橹袊?深圳)國際文化產業(yè)博覽交易會打造了線上虛擬講解員,擁有講解服務能力、多種情緒表達能力,能夠對展廳、展館的相關問題對答如流,并配合場景作出生動的情緒動作反饋,讓用戶在疫情期間,突破空間限制,享受互動性極強的在線講解游覽體驗。

在新聞播報領域,我們與新華社合作推出了全球首個AI合成主播。依托少量音視頻數(shù)據即可快速、低成本生成主播形象,輸入文本即可AI合成播報實時音視頻流,主播的表情、唇動自然且專業(yè),基本與真人無異。到目前為止AI合成主播已經累計播報新聞超過1萬條,保證播報零誤差,可實現(xiàn)對日常和突發(fā)事件的實時響應。

可以說,數(shù)智人具備降本、增效、提升服務體驗、增強服務靈活性等優(yōu)勢,比如數(shù)字坐席不但可提供7*24小時全時段、大體量服務,成本也僅為真人坐席的1/5,可真正做到多維度提升企業(yè)服務能力。隨著數(shù)智人技術的不斷迭代升級,我們相信科技創(chuàng)新的力量也將為企業(yè)服務創(chuàng)造更大的價值和可能。

在生活服務場景,騰訊云小微數(shù)智人也有著很大的應用空間。數(shù)智人以交互智能增強人機互動,在智能車載、智能交通、智能家居、智能硬件等智能服務場景,為用戶提供更便捷、智能的服務。

我們的核心思路是:讓數(shù)智人與智能設備結合,打造以用戶為中心的生活服務。

一方面,數(shù)智人可以助力提升公眾服務效率。比如,數(shù)智人可及時、高效地處理用戶在公共交通場景中的票務等問題,可代替人力進行政策問答,提升政策辦事問答效率。同時,憑借語音交互能力優(yōu)勢,加強對中老年人等群體的服務關懷。

另一方面,數(shù)智人可憑借全新的視覺表達,為用戶提供自然、豐富的智能交互服務。比如在智能家居中,用戶通過語音指令即可隨時隨地與數(shù)智人交流;個性化的形象表現(xiàn)和動作表達能力,也能打造出更優(yōu)的虛擬偶像服務。未來,數(shù)智人技術將重點向融合文字、聽覺、視覺、觸覺、肢體動作等多維度感知的多模態(tài)交互方式演進。

我們希望的是,通過數(shù)智人,在生活服務中為用戶帶來更多陪伴、更多信息交互以及更深的情感鏈接。首先,全天陪伴可隨時呼喚,提升交互效率;其次,有問題直接問,讓中老年人也可簡單方便地使用,打破數(shù)字化中的科技鴻溝,高度還原人與人之間的交流,打造有溫度的交流體驗,拉近個人與技術的距離。

同時,數(shù)智人支持個性化自定義設置,讓企業(yè)和用戶都可打造屬于自己獨一無二的數(shù)智人。

前面說的都是我們的過去,我們過往的成就,接下來讓我們說一說未來。未來,我們的數(shù)智人會向什么方向發(fā)展,又將為社會創(chuàng)造哪些價值呢?

正如我今天分享的主題“溝通有溫度,服務新高度”,未來,騰訊云小微數(shù)智人希望能夠突破時間和空間的限制,打破虛擬和現(xiàn)實的邊界,在數(shù)字化進程中,為各行各業(yè)提供有溫度的智能交互服務。

我們將不斷提升平臺能力,輸出更優(yōu)質的AI應用解決方案,與更多行業(yè)實現(xiàn)場景共建,以定制化的服務,助力各行各業(yè)的智慧化轉型。同時,在不斷進行科技創(chuàng)新、產品創(chuàng)新、模式創(chuàng)新的過程中,更好地服務社會,服務于人,為社會創(chuàng)造更大的價值,從而全面開啟全新的有溫度的數(shù)智未來!謝謝大家!

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )