Siri將會說上海話 但你知道蘋果是怎么教會它的嗎?

上周,谷歌將Google Assistant下放到Android 6.0,而蘋果的Siri、微軟的Cortana、亞馬遜的Alexa最近也動作頻頻,一場圍繞下智能語音助手的大戰(zhàn)正在全面展開。

西雅圖艾倫人工智能研究所CEO Oren Etzioni表示,Siri作為最早入場的選手,其語音理解和回答問題的能力并不突出,白白浪費(fèi)了先發(fā)優(yōu)勢。

但Siri并不是一無是處,它仍然有其他語音助手目前無法匹敵的優(yōu)勢:支持36個國家的21種本地語言。由于大多數(shù)的智能手機(jī)都是在非英語國家銷售,對本地語言的支持將是非常重要的一個能力。

相比之下,微軟的Cortana能夠識別13個國家的8種語言,Google Aissitant則支持4種語言,而亞馬遜的Alexa目前只支持英語和德語。

但是Siri并沒有停下,據(jù)外媒報道,iOS 10.3即將支持上海話。

如果語音助手想要成為智能手機(jī)和其他智能設(shè)備標(biāo)配的工具,那么語言問題將是其必須克服的障礙。但是語言本身對任何助手來說都是復(fù)雜的。比如在英國,當(dāng)談?wù)撟闱虮确謺r,“2:0”要說成“two-nil”,而不是“two-nothing”。

蘋果語音團(tuán)隊(duì)負(fù)責(zé)人Alex Acero在接受路透社采訪時解釋了如何教Siri學(xué)習(xí)一門全新的語言。

Alex Acero說,在蘋果公司,當(dāng)研究人員開始教Siri一門新的語言時,會讓真人用各種方言和口音來閱讀文本段落,然后由聽譯人員轉(zhuǎn)錄成文本,這樣計(jì)算機(jī)就可以擁有準(zhǔn)確的樣本用來練習(xí)。此外,蘋果還會從不同的聲音中捕捉各種語音。然后,蘋果會建立起一個聲學(xué)模型,并通過這個模型開始嘗試預(yù)測字符序列。

Acero稱,蘋果隨后會在新語言中部署“聽寫模式”,這是一種文本和語音之間的翻譯器。當(dāng)用戶使用聽寫模式時,蘋果會捕獲音頻錄音中的一小部分,然后對其匿名處理。由于這些錄音有背景噪音以及模糊不清的詞語,將會由專人轉(zhuǎn)錄,這一過程可以將語音識別的錯誤率降低一半。

在收集了足夠的數(shù)據(jù),并讓配音演員為新語言錄制了聲音之后,蘋果就會向公眾開放這一語言版本的Siri。不過,發(fā)布之初Siri只能回答蘋果認(rèn)為最常見的問題。發(fā)布之后,Siri將會從用戶的實(shí)際問題中學(xué)習(xí),并且會每兩周更新一次,作出一些調(diào)整。

不過,智能助理Ozlo的創(chuàng)始人Chales Jolley表示,為語音助手撰寫腳本無法做到規(guī)模化,“你不可能聘請足夠多的作者為每一種語言撰寫需要的腳本,你必須將答案綜合起來。“他認(rèn)為,這還需要多年的時間。

三星去年收購了“Siri之父”創(chuàng)建的人工智能公司Viv Labs,這家初創(chuàng)公司就正在著手解決這個問題。Viv的聯(lián)合創(chuàng)始人兼CEO Dag Kittlaus說:“Viv旨在專門解決智能助理的規(guī)?;瘑栴},要想跨過目前版本的功能局限,唯一的方法就是開放系統(tǒng),讓世界來教它們。“

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-03-13
Siri將會說上海話 但你知道蘋果是怎么教會它的嗎?
上周,谷歌將Google Assistant下放到Android 6 0,而蘋果的Siri、微軟的Cortana、亞馬遜的Alexa最近也動作頻頻,一場圍繞下智

長按掃碼 閱讀全文