在過去的十幾年,人機交互的方式從鍵盤升級成按鍵,從按鍵又變成手指觸摸,下一個次變革,人類將回歸最自然的交互方式——對話。對話方式讓機器幫助人直接完成工作。智能客服作為最早的應用智能對話系統(tǒng)的落地產品,對于智能對話系統(tǒng)的工業(yè)化應用的探索貢獻頗多。
京東一直堅持以技術驅動公司成長,致力于將人工智能技術與商業(yè)場景應用相結合,給消費者提供更優(yōu)質的體驗。在今年11.11全球好物節(jié)中,京東智能客服與用戶發(fā)生超1630萬次對話,獨立解決了90% 用戶反饋的問題。此外,智能客服也擁有了情感智能,能夠精準識別出七種不同的用戶情感,為消費者提供更貼心溫暖的幫助。在近期的產品迭代實踐中,針對一系列的技術難點,京東AI團隊對此進行了突破性的探索,這些嘗試,既讓普通用戶與智能客服的對話體驗實現極致提升,又讓人工客服享受AI智能輔助帶來的便利,更讓所有使用智能客服的京東商家在構建機器人知識大腦時更容易,真正地讓所有參與客服服務的人都感受到AI賦能的力量。
在經典的智能對話交互架構中,自然語言理解是整個流程中的核心模塊,直接影響整體的對話效果。京東智能客服作為任務導向型機器人,此前較為關注對話中的業(yè)務處理邏輯。為了完善整體對話體驗,勢必需要對閑聊對話與FAQ對話給予更多的關注。因此,在近期,京東AI的算法團隊重點對自然語言理解模塊與閑聊對話、FAQ對話兩類對話模式這三部分進行了一系列全新的探索。
常見的智能對話交互框架
首先,在自然語言理解領域,上下文理解一直是智能對話系統(tǒng)重點關注的問題。最簡單的上下文理解方法,是將歷史問題拼接起來整體進行預測,但是這種策略無法區(qū)分每一句的側重點,往往出現因為結合上文反而導致識別錯誤的情況。
下圖是基于Hierachical Attention Networks(HAN)改進的Sentence Attention Hybrid Networks模型,能夠較好的解決上面提到的問題,在結合上下文的同時,結合attention機制能夠有效的區(qū)分每句話的重要程度。
Sentence Attention Hybrid Networks模型算法結構
改進后的HAN模型做了以下優(yōu)化:先將第一層雙向LSTM模型替換為捕捉局部特征能力更強的CNN模型;再將第二層雙向LSTM改為單向LSTM,這也與實際情況中越靠近最后的話越重要保持一致。每個層級具體內容如下:第一層CNN輸入為詞向量拼接成的句字向量矩陣;經CNN處理后的輸出直接作為第二層LSTM的輸入,其中LSTM的節(jié)點數與句子個數保持一致,LSTM的輸出作為每句話的句向量;經過最終attention后獲取最終文檔的向量表示,并經過softmax進行最終的分類。新模型在多個場景上線后,準確率有5-10個點的提升。因上下文識別錯誤導致的應答問題占比降低5個點,上下文應答效果提升明顯。
除此之外,在人工客服智能輔助領域,我們還嘗試了另一種解決上下文意圖識別的方案。由于上述模型更多適用于關聯(lián)少量上文語句的場景,對于需要全文關聯(lián)的情況效果不夠優(yōu)秀,因此我們提出了Hierarchical Attention Dilated Convolutional Networks(以下簡稱HADCN)算法。
傳統(tǒng)RNN類的模型在捕獲全局的句子語義時有優(yōu)勢,但速度較慢。CNN類的模型在運算速度上有優(yōu)勢,但很難獲取上文信息。而HADCN模型參考了WaveNet/Bytenet按照Dilated Convolutional Networks(以下簡稱“DCN”)擴展到語音和翻譯結果的產生的思路,是一種兼顧精度和速度的框架。這一框架的引入,提供了幾乎業(yè)界最好的精確度,靈活度,適應不同的上下文輸入,訓練和推理速度亦在同類型算法里最快,可以讓工業(yè)實踐在一個穩(wěn)定的框架下,不需要完全跟隨學界各種神經網絡分類算法,解決業(yè)務范圍內大多數應用問題,減少重復開發(fā)。
這一算法采用句子間先分句編碼再合并編碼的方式;每一個DCN網絡可以堆疊若干層,加大深度,如下圖綠色虛線框所示;每個句子用DCN堆疊S1層,產生編碼,句子之間也采用DCN堆疊S2層,產生整體多句的編碼,然后產生最后的分類輸出;下圖中以3句為例展示結構;每個DCN內采用Dilated CNN,在每個時刻都計算對應每個詞的編碼表達;相鄰兩個DCN堆疊之間采用Self Attention連接,規(guī)整不同位置的詞之間的句法和語義關系;DCN內的每一個運算塊簡化為單層CNN,加快運算速度。
HADCN模型算法結構
這一新算法主要應用于人工客服會話的前文智能總結中:基于人工客服會話數據建模,打破了傳統(tǒng)針對單句的意圖識別,采用用戶問題+客服答案的會話維度訓練數據,對整通會話進行識別,模型返回分類結果。模型上線后,對線上30分類的會話意圖,準確率能達到80%。另外,實驗發(fā)現,HADCN在少數DCN堆疊的情況下,對上下文意圖識別任務可以比改進后的HAN模型有約2%的準確度提升。
除此之外,我們還將多層次意圖的思想引入自然語言理解領域。傳統(tǒng)的意圖識別僅僅Domain – intent的單一維度的識別,而本質上人的任何表達必然具備多種不同維度的信息。而一旦將句子的信息進行多維投射,人的思維就難以通過經驗對多維信息進行意圖定義。此時便需要引入聚類的思想進行分類構建。為了適應聚類這一數據處理方式在邏輯上的不清晰,則需要引入層級的概念,對聚類結果進行容錯。層級的概念也與客服領域將用戶訴求進行分級歸類的慣例不謀而合,更便于運營工作開展進行。
因此,我們利用聚類的方式,把意義較為接近的分類分成兩層或者多層,每個模型之間不能沖突,下層節(jié)點具有容錯性。層次聚類算法分成凝聚式和分裂式兩種,取決于層次分解是以自底向上(合并)還是以自頂向下(分裂)方式形成。
凝聚式層次聚類使用自底向上的策略,開始時每個對象自己是獨立的類(N個),然后不斷合并成越來越大的類,直到所有的對象都在一個類中,或者滿足某個終止條件。在合并過程中需找出兩個最近的類讓他們合并形成一個類,所以最多進行N次迭代就能將所有對象合并到一起。分裂式層次聚類使用自頂向下的策略,開始時所有對象都在一個類中(1個),然后不斷的劃分成更小的類,直到最小的類都足夠凝聚或者只包含一個對象??紤]到分類語料本身的多維特征以及含義交叉性,我們主要采用層次凝聚的方式構建層級。方案上線后,末端分類有6%的上升。
業(yè)務分類在二維空間聚類分布圖
說完了意圖識別,在FAQ對話領域,我們同樣達成了一定的技術突破。由于客服對話場景中,對于答案質量的要求較高,因此在匹配時我們一般側重于準確率,這就導致FAQ的召回受限,效果難以發(fā)揮。
因此,我們應用了QA SWEM算法方案來解決此問題。該算法綜合考慮了算法的準確率和運行效率,使用了Word Embedding和Pooling兩種結構,采用了四種SWEM模型,包括:
SWEM-AVG:基于word embeddings 的 average pooling,作為hidden state
SWEM-MAX:基于word embeddings 的 max pooling,作為hidden state。
SWEM-CONCAT:將SWEM-AVG和SWEM-MAX concat后,作為hidden state。
SWEM-HIER:將word embeddings分窗口進行avg pool,之后再整體的max pooling,作為hidden state
以SWEM-MAX為例,整個模型的核心算法表示為:
我們針對整個算法,進行了進一步的迭代和優(yōu)化,創(chuàng)新地提出將Attention以及GBDT與SWEM結合的方案。
Attention按照如下的算法進行構建:
fatt(hi,sj)=h?iWasj。
雙向的Attention,對待匹配的兩個句子分別進行二次編碼。
考慮到SWEM主要是深度學習的特征,而且模型比較簡單,特征表達能力有限,我們使用GBDT把一些非深度學習的特征(比如編輯距離、詞語重合度等)和SWEM進行融合,在保證運行性能的同事,進一步提升QA匹配模型的效果。
得到句子之間的Attention編碼,再整合上SWEM模型,比現有的BiLSTM算法提升2-3%,模型的訓練和運行性能上都取得了更好的效果。
最后再談一下閑聊對話領域,之前智能客服仍采用傳統(tǒng)檢索方式。傳統(tǒng)檢索方式主要包括三個模塊,query解析,問答檢索和答案重排序。query解析是對用戶query進行理解,提取出重要部分;問答檢索是從問答庫中檢索出query相關的問答對;答案重排序是對檢索出來的問答對進行重新排序。該方法簡單易操作,答案易理解,缺點是答案受限于問答庫,缺乏多樣性。
為了解決缺乏多樣性帶來的效果欠佳與維護成本高的問題,我們著力將深度生成方式引入該場景。深度生成方式采用經典的encoder-decoder框架,并結合了注意力機制,能根據用戶query,來直接生成答案。生成方式主要有三個部分,編碼,解碼和注意力。編碼就是將輸入的query編碼成一個向量,解碼則是將生成的向量再轉化成輸出的答案,注意力指在輸出的時候需要重點關注輸入的哪些部分。通過對生成答案與原有檢索式方案產出的答案的標注對比,生成答案較檢索式答案質量提升約20%,應答效果顯著提升。
深度生成式閑聊框架
過去一段時間,結合業(yè)務需求,我們在智能對話領域展開了多項探索,取得了一定成效。我們的技術探索之路還在繼續(xù),未來還要在堅持用戶體驗為先的基礎上,不斷擴展AI技術的應用領域,并打造數據閉環(huán),通過數據反哺算法效果的持續(xù)提升,為打造業(yè)內首個具備情感智能個性化的解決型智能客服,為用戶提供極致體驗而努力。相信隨著AI技術的不斷發(fā)展,未來智能客服對話系統(tǒng)還將有持續(xù)提升,我們也將和業(yè)界一道推動這一領域的創(chuàng)新實踐。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )