蘋(píng)果利用AI讀取文檔,讓預(yù)測(cè)鍵盤(pán)學(xué)會(huì)“思考”

蘋(píng)果公司名下的博客《機(jī)器學(xué)習(xí)雜志》的最近更新內(nèi)容暗示了蘋(píng)果QuickType預(yù)測(cè)鍵盤(pán)在未來(lái)可能會(huì)有進(jìn)一步的改進(jìn),現(xiàn)階段最大的挑戰(zhàn)在于:如何讓機(jī)器利用文檔內(nèi)容來(lái)猜測(cè)用戶(hù)接下來(lái)要輸入的詞語(yǔ)。

目前,預(yù)測(cè)鍵盤(pán)利用狹窄的局部語(yǔ)境和用戶(hù)的輸入歷史來(lái)猜測(cè)用戶(hù)接下來(lái)可能會(huì)輸入的內(nèi)容,比如,當(dāng)用戶(hù)將光標(biāo)定位在“I”和“you”兩個(gè)詞語(yǔ)中間并輸入“L”時(shí),鍵盤(pán)就會(huì)合理猜測(cè)用戶(hù)接下來(lái)要輸入的這個(gè)單詞為“l(fā)ove”。

蘋(píng)果的框架自然語(yǔ)言處理團(tuán)隊(duì)指出,增添額外的“整體語(yǔ)義語(yǔ)境”可以產(chǎn)生更好的效果:當(dāng)機(jī)器查閱文檔的全部?jī)?nèi)容后,可能會(huì)發(fā)現(xiàn)“l(fā)ove”與文檔的整體語(yǔ)境沒(méi)有聯(lián)系,于是創(chuàng)建像“l(fā)isten to”這樣更加合理的選項(xiàng)。

然而事實(shí)上,全文檔處理并不容易實(shí)現(xiàn),蘋(píng)果公司正在探索利用神經(jīng)網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí)的潛在解決方案。原型系統(tǒng)可以查閱給定詞匯的左邊和右邊的全部?jī)?nèi)容,分析文本每個(gè)部分的潛在相關(guān)性并進(jìn)行比較,最終創(chuàng)建最合理的內(nèi)容作為參考選項(xiàng)。用以做機(jī)器訓(xùn)練的目錄字?jǐn)?shù)多達(dá)1千萬(wàn)到50億,不過(guò)研究人員發(fā)現(xiàn)最小目錄與最大目錄起到的訓(xùn)練效果并無(wú)明顯差異。

目前該項(xiàng)目不斷取得進(jìn)展,尚在進(jìn)行當(dāng)中,因?yàn)樘O(píng)果還要訓(xùn)練機(jī)器學(xué)會(huì)在更大的整體語(yǔ)境中處理單詞與短語(yǔ)。預(yù)計(jì)在未來(lái),蘋(píng)果的預(yù)測(cè)鍵盤(pán)不管在局部語(yǔ)境還是整體語(yǔ)境中都能完成對(duì)文本輸入的預(yù)測(cè),如此一來(lái),機(jī)器將更有效地根據(jù)用戶(hù)已經(jīng)輸入的內(nèi)容而“思考”用戶(hù)的想法,猜測(cè)下一個(gè)將被輸入的詞語(yǔ)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2018-09-29
蘋(píng)果利用AI讀取文檔,讓預(yù)測(cè)鍵盤(pán)學(xué)會(huì)“思考”
蘋(píng)果公司名下的博客《機(jī)器學(xué)習(xí)雜志》的最近更新內(nèi)容暗示了蘋(píng)果QuickType預(yù)測(cè)鍵盤(pán)在未來(lái)可能會(huì)有進(jìn)一步的改進(jìn),現(xiàn)階段最大的挑戰(zhàn)在于:如何讓機(jī)器利用文檔內(nèi)容來(lái)猜測(cè)用戶(hù)接下來(lái)要輸入的詞語(yǔ)。

長(zhǎng)按掃碼 閱讀全文