原標題:五年前,是什么讓李彥宏相信了AI?
大部分人的思考習慣,是看到一個東西成功了,就感嘆成功者的運氣。卻很少人愿意去回溯,到底一件事從想法到現(xiàn)實,經(jīng)歷了怎么樣的思考和判斷,以及自我完善的過程。
把時間倒回過去來思考,其實是件很有意思的事情。比如今天我們已經(jīng)知道押注AI,可以說是百度做的最正確選擇之一。如今AI已經(jīng)和百度融為一體,甚至成為中國科技界的一張名片,這都應該沒有什么人反對。
而與廣大科技企業(yè)近兩年突然轉型AI不同,李彥宏和百度早早就選擇了相信AI,甚至很早就判斷清楚了AI即將在哪些具體領域爆發(fā)。
比如2013年的時候,李彥宏表示“語音技術會根本性地改變人們使用互聯(lián)網(wǎng)和手機的方式”;同年,他還認為“人機對話的問題,最近幾年會很快進入實用階段?!痹?014年,他又提出“5年后語音搜索會超文字搜索”,隨后2015年百度推出了度秘。
顯而易見,今天來看這些判斷都實現(xiàn)了。但在五年前,似乎還沒有多少人關注智能語音交互。這里我們可以做個有意思的游戲:回到五年前李彥宏的視角,看看有哪些因素讓他選擇相信AI。尤其是相信AI能夠帶來商業(yè)價值,并判斷AI將以何種形態(tài)帶來商業(yè)價值。
不難看出,當時的李彥宏,至少可以發(fā)現(xiàn)智能語音正在改變三件事。
一、效率2013-2015,是中文語音識別率快速攀升的三年。這一段時間里AI的中文語音識別成功率,成功超過了人類語言交互效率。另一方面,NLP和語義理解技術開始因深度學習而成熟,AI能夠“聽懂”人類,出現(xiàn)了可能性。
這樣的技術指數(shù),雖然對于普通人來說在當時并不意味著什么,但就產(chǎn)業(yè)發(fā)展趨勢而言,意味著三件事必然在未來發(fā)生:
1、鍵盤可以被取代。打字輸入固然也很方便,但其存在的核心價值在于效率。在語音識別率大幅攀升,可以彈性識別人類語言的情況下,鍵盤輸入的必要性也將受到挑戰(zhàn)。尤其在手機端,語音輸入優(yōu)勢空前。
2、按鈕將逐漸被取代。生活、生產(chǎn)中有無數(shù)的按鈕,這些按鈕存在的價值是因為人需要操縱某個機器,比如說電視遙控器。但在語音識別與語句理解能力攀升后,按鈕的地位可以被動搖。當然從而產(chǎn)生的經(jīng)濟價值也是難以估量的。
3、冗務被替代。今天社會中的很多工作,無非就是聽、記錄和反饋。尤其其中相當大一部分是效率低下的冗務,在AI識別說話的準確度達標后,大量類似工作將被取代,人類獲取服務的效率將大幅提升。
這些互聯(lián)網(wǎng)生活中的基礎效率改變,意味著巨大的市場調節(jié)和生產(chǎn)力升級。智能語音交互作為這一切的基礎,其根基來自于技術升級。這對于技術立身的百度來說是比其他風口更好的機會。去年李彥宏談論AI時提出AI時代更適合百度這樣的技術公司,他認為“僅僅兩年的時間,大家就知道了深度學習,算法在迅速地發(fā)生變化。外界既然都認識到了AI的重要性,那么對于百度來說,成功的機會自然變大”。
AI的技術積累來自百度更早的投入,而在此之前,則是企業(yè)家對于“技術到底能換取什么價值”這件事的預判,這或許也是DuerOS最初的思考邏輯。
二、“搜索-答案”的關系百度的核心業(yè)務是搜索,那么在上述邏輯中,智能語音帶來輸入效率提升和長句理解能力后,搜索業(yè)務勢必面臨巨大的迭代。這或許帶給思考“搜索的未來”的李彥宏,另一種可能的發(fā)展方向。加上一門叫做知識圖譜的AI技術,已經(jīng)開始廣泛投入應用,搜索的變革也就自然而然孕育在了AI之中。
智能語音的進場,最直接的改變是用戶從習慣于搜索關鍵詞,開始向習慣于輸入大容量語句,也就是向搜索引擎進行提問過渡。那么隨之而來的,也就是用戶期待的不僅是帶有關鍵詞的搜索結果和百科,還有對問題的解答,甚至對問題的再提問。
所謂搜索,核心價值是連接了人與信息,但信息不僅是關鍵詞,更多時候信息隱藏在問題背后。這樣的搜索習慣必須以用戶能夠提出復雜問題為開始,而智能語音正好帶給用戶以培養(yǎng)提問習慣的機會。
此外,用語言對事物進行描述,更符合人類習慣。進行抽象的、非關鍵詞的搜索服務,也難以離開語音交互的支持。
而從問答式搜索去到更遠一點的地方,很多時候我們需要的甚至不僅是答案,而是建議,甚至是反問和辯論。這樣的搜索效果有可能實現(xiàn)嗎?假如可以的話,核心當然需要更智能的系統(tǒng)。但高度純熟的自然語言理解與自然語言處理,帶來人機對話的完整性,當然是另一項基礎工程。
按照搜索的進化來思考,我們很容易發(fā)現(xiàn)搜索業(yè)務是離不開語音交互的。那么智能語音為什么對百度如此重要,當然也就不難理解了。用李彥宏自己的說法,在移動互聯(lián)網(wǎng)普及之后,“要么think AI,要么 say goodbye”。
三、人機關系更大的機會,在于人機關系正在因為“人機對話”模式的到來而改變,這也是李彥宏早在幾年前就做出的判斷。AI可以讓人類與系統(tǒng)交談,系統(tǒng)的理解可以轉化為命令,命令是機器執(zhí)行的根源——那么人機交互必須以手觸發(fā)的現(xiàn)狀,也就很可能成為歷史。
我們很難低估以語音操控機器的潛力。在最普通的家居環(huán)境中,有個說法是你不換智能家居的時候不會多想它,可一旦換了就再也回不了頭。這是因為操作的簡便性和準確度來說,語言遠遠超過一個個開關。尤其是能夠在空間中行使命令,這是天然更符合人性的人機交互方式。
家居之外,人機交互的價值迭代還發(fā)生在近乎每一個生活中的核心場景:工廠中很多工作可以由工人指揮機器完成,帶來巨大的效率提升;辦公場景里語音交互可以升級為助手,取代海量的協(xié)同工作;駕駛場景中,如果能說話控制方向盤以外的一切,那么對使用體驗是巨大的解放,更遑論無人駕駛場景里,人機交互只能靠語音來完成。
在語音識別和理解能力成熟后,這些市場自然會顯現(xiàn)出價值。這對當時的百度來說是一個巨大的機會。于是我們看到了百度并沒有慌忙搶占音箱風口,而是搭建底層平臺,逐步完善對人機交互種類的覆蓋。這是因為在百度的優(yōu)勢中,設備不是核心,技術帶來的人機關系改變才是。
結論退回到五年前,我們站在李彥宏的視角中可以發(fā)現(xiàn)有三個準確出現(xiàn)的現(xiàn)象:智能語音技術正在成熟、智能語音對于百度的核心業(yè)務影響巨大、語音交互背后隱藏著巨大的新市場。這三件事支撐百度準確找到了AI時代的核心方向。今天DuerOS連接的設備已經(jīng)過億,智能語音也成為了核心基礎技術。
但或許我們應該問的是:智能語音已經(jīng)來到頂峰了嗎?退回去看百度與李彥宏當年的判斷,或許答案應該是:還沒有。
無論是搜索、信息流、內容,還是人機協(xié)作與泛社會應用,智能語音在今天只是打開了市場,搭建了更牢靠的基礎。語言的魔力與紅利,都還沒有完整來到商業(yè)世界。百度的對話式AI之戰(zhàn),可能也還要跨過更遠的山梁。
同時我們也可以發(fā)現(xiàn),計算機視覺在這兩年也正在爆發(fā)。而李彥宏恰好在2016年曾預言過,計算機視覺將是無人駕駛的最后一公里。因此我們也可以判斷,在Apollo平臺的搭建中,計算機視覺將成為其中的重要部分。而種種跡象表明,這一預測或許不再需要另一個5年,正在快速向我們駛來。
退回原點,往往可以看到更多。在我們今天猜測AI未來的時候,這個方法或許格外有用。今天,又有哪些技術原點,可以幫我們透視未來呢?
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。