專訪洪小文:人和當前AI的智能有什么區(qū)別?

雷鋒網(wǎng) AI科技評論按:作為國際公認的語音識別專家,洪小文于1995年加入微軟,在1998年曾參與微軟亞洲研究院的創(chuàng)立。隨后洪小文又被調(diào)回西雅圖總部,成為微軟公司自然交互服務部門的創(chuàng)始成員,并擔任架構師。2004年他重回北京,擔任微軟亞洲研究院副院長;2007年,擔任院長。2014年,繼張亞勤之后兼任微軟亞太研發(fā)集團主席。2015年,擔任微軟公司全球資深副總裁。

專訪洪小文:人和當前AI的智能有什么區(qū)別?以簡制繁 v.s. 以繁制繁

而在這些職位的背后,洪小文博士在學術領域也影響頗大。洪小文博士是IEEE Fellow,微軟杰出首席科學家和國際公認的語音識別專家,且在國際著名學術刊物及大會發(fā)表百余篇學術論文,著作《語音技術處理》一書被全世界多所大學采用為語音技術教學課本。此外,他在多個技術領域還擁有36項專利發(fā)明。

一面是微軟的高層管理人員,另一面是學術界的巨擘,洪小文博士無論在AI的哲學層面、技術層面還是應用層面,都有很深刻的思考。

近日,在微軟亞洲研究院與哈工大共同舉辦的第十九屆“二十一世紀的計算”國際學術研討會(21CCC)上,洪小文博士出席該會議并做了特邀演講。雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))AI科技評論記者有幸采訪了洪小文博士,并探討了包括人工智能的缺點、AI技術落地所需考慮的四個方面,微軟在AI的方向、中國與美國在人工智能上的異同以及語音方面未來發(fā)展方向。以下為洪小文就這幾個問題的觀點,分享給大家:

內(nèi)容速覽:

1、當前人工智能的發(fā)展主要基于大數(shù)據(jù),這是一種以繁制繁的方式,未來發(fā)展會趨向于小數(shù)據(jù),甚至無數(shù)據(jù)的人工智能。

2、人工智能研究成果的落地能夠給企業(yè)帶來的價值主要體現(xiàn)在四個方面:能否讓你的產(chǎn)品更好、能否增進你與客戶之間的聯(lián)系、能否提高企業(yè)內(nèi)部運行的效率以及能否改善員工的工作激情。

3、微軟在AI領域主要有兩個方向。首先是對AI技術的基礎研究、開發(fā)和應用,其次是作為一個有情懷和社會責任感的公司去關注AI可能帶來的安全、倫理等問題。

4、中國與美國相比,在移動互聯(lián)網(wǎng)行業(yè)已經(jīng)走在前面,但在基礎研究方面與美國相比還有一定差距。除此之外,中國在對人工智能的思考上也有很大的欠缺。

5、語音識別準確率的提升需要多個領域(包括視覺等)的綜合。人的智能是全部智能的總和,這也是人工智能發(fā)展的一個方向。

注:雷鋒網(wǎng)根據(jù)采訪內(nèi)容作了不改變原意的精簡和編輯。

雷鋒網(wǎng):人的智能和當前AI的智能有什么區(qū)別?

洪小文:機器的智能我把它稱為以繁制繁,這是機器的強項。我們所謂的深度學習,從廣義上來講,其實就是一種模式識別。機器的這種模式識別,不管是記十個電話號碼,還是AlphaGo的下棋,都是一樣的,就是死記硬背。

而人的智能則是以簡制繁,就是在復雜中找到規(guī)律,根據(jù)規(guī)律來解決問題。如果十個電話號碼沒有規(guī)律,別說十個,一個可能都不記得;但如果找到了規(guī)律就很容易了。

我們?nèi)艘恢痹谥v智慧,最高境界其實就是化繁為簡。“吾道一以貫之”,這不就是化繁為簡嗎,我只要一個道理就可以破所有的功。人的智慧是這個,而不是以繁制繁。以繁制繁是一種智慧,但不是最高智慧。

愛因斯坦當年幾乎是從零數(shù)據(jù)提出了引力波,一百年后我們才勉勉強強測到。我們今天所謂的AI都是要大數(shù)據(jù),至少目前還看不出AI能做到基于小數(shù)據(jù)或者零數(shù)據(jù)的預測。未來可能會有,但從應用的角度來看,短時間之內(nèi)是很難做出很了不起的應用的,反而是大數(shù)據(jù)的應用會很快。

雷鋒網(wǎng):現(xiàn)在AI的實際落地給企業(yè)帶來的價值體現(xiàn)在哪些方面?

洪小文:在微軟我們把它叫做數(shù)字化轉(zhuǎn)型。為什么這樣說呢?因為今天有用的AI一定要和數(shù)據(jù)、計算綁在一起的。你就想從有計算機到現(xiàn)在,哪樣東西變成數(shù)字化了?支付數(shù)字化,我們跟人的社交網(wǎng)絡數(shù)字化,買賣行為、電子商務所有這些都是數(shù)字化,更不要說物聯(lián)網(wǎng)了,它把以前沒有數(shù)字化的東西全部數(shù)字化了進來。數(shù)字化以后就可以做分析,所以我們把它叫做數(shù)字化轉(zhuǎn)型。

這里面的落地對企業(yè)(也包括任何單位,下面統(tǒng)一用“組織”),我們認為至少有下面四點:

第一、每個組織一定有個產(chǎn)品,怎樣用AI(+大數(shù)據(jù))迭代讓你的產(chǎn)品越來越好。這里產(chǎn)品是廣義的,例如學校的產(chǎn)品就是教育,政府的產(chǎn)品就是服務市民。

第二、每個組織一定有用戶,怎樣用AI(+大數(shù)據(jù))促進組織和組織的用戶進行連接。這里的用戶也是廣義的,例如學校的用戶就是學生,政府的用戶就是市民。不管你是2B還是2C都會有用戶。和用戶進行連接,從消極的角度來講,當你的用戶有各種問題的時候,你要及時服務他們;從積極的角度來講,怎么讓你的用戶自愿地幫你們得到更大的影響。

第三、怎樣利用AI(+大數(shù)據(jù))提高組織內(nèi)部運營的效率、效能。

第四、怎樣利用AI(+大數(shù)據(jù))提高員工的生活質(zhì)量、激發(fā)員工的創(chuàng)造力。我覺得任何一個公司到最后最大的資產(chǎn)就是員工,所以如何用這個東西幫助你的員工將事業(yè)和家庭都照顧好,并能夠激發(fā)員工的創(chuàng)造力,非常重要。

雷鋒網(wǎng):微軟未來關注的AI的研究方向是哪些?

洪小文:分幾塊。

一塊是現(xiàn)在既有的AI的理論、系統(tǒng)和重要的AI的技術。比如說感知,感知里面有語音、自然語言、視覺,這些東西都是現(xiàn)在兵家必爭之地,我們繼續(xù)在做;當然還有跟各種應用的結(jié)合,這些都是今天在做的東西了。

另一個就是做AI的研究單位。例如今天的AI都是大數(shù)據(jù),那么小數(shù)據(jù)怎么做,甚至無數(shù)據(jù)怎么做?我們研究院在這些方面有一些新的想法,也在做。

還有一塊不是純技術的,我們在美國有一個Partnership on AI。現(xiàn)在我們的數(shù)據(jù)變得非常重要,一個人如果有了內(nèi)線交易的數(shù)據(jù),他不管用什么笨方法都一定是賺錢的,但有可能他是非法的,所以數(shù)據(jù)的監(jiān)管就變得非常重要?,F(xiàn)在越來越多的人重視這方面。尤其是今天所謂的大頭(企業(yè))們,我覺得不是他們擁有什么AI的技術,而是他們擁有的數(shù)據(jù)。所以你有什么樣的數(shù)據(jù),你要負什么責任,什么東西可以做,什么東西不可以做,這個都必須規(guī)定清楚,成立Partnership on AI就是來探討這些問題的,到底什么是AI for Good。我覺得這個東西在未來我們必須要認真探討的,而且這個問題可能比技術問題更難,因為它牽扯到人,牽扯到政策的制定、政府、社會學、心理學、人類學、經(jīng)濟,它對我們的影響是全方面的。

雷鋒網(wǎng):您如何看人工智能在美國和中國的差異?

洪小文:從應用上來看,我認為差異上不大。唯一的差別是中國在移動互聯(lián)網(wǎng)上有一些方面的確是領先世界的,像移動支付以及微信里面一些很新的社交網(wǎng)絡的用法。大體上來講,尤其是現(xiàn)在世界又是通的,大家看到這些應用,總是會想想怎么把它用過去,所以說這方面的差別不一定大。

研究上來講,我覺得應用型的創(chuàng)新、應用型的研究中國不缺,但是中國對基礎的研究比起美國還是相對少一點的。這個是好壞兼有的。畢竟中國的發(fā)展多半做很多事情背后是有經(jīng)濟動機的,在這些方面也影響到了我們對于基礎研究的投入可能不夠。現(xiàn)在很多人在講這個,但只是在講,我希望他們真正去解決這個現(xiàn)狀,包括公司和個人。

此外,高科技對社會的影響方面,我覺得在中國討論得還不夠多。這一方面是好,因為中國對高科技非常向往,而且非常正面,所以對高科技公司的發(fā)展非常有利。但如果你留意西方的話,很多關于高科技負面的聲音都出來了,最近有一個本書,一個教授很深度地在討論這方面的問題。他擔心我們這些所謂的高科技公司什么東西都強調(diào)算法,而算法本身是機械化的東西,你喜歡一條新聞,我就專門給你推送類似的新聞,到最后我們就失去了靈魂。

雷鋒網(wǎng):現(xiàn)在語音技術面對的還有哪些比較大的挑戰(zhàn)?未來會怎么發(fā)展?

洪小文:語音的挑戰(zhàn)永遠存在,因為真正要做到百分之百的語音識別,我認為是個AI complete問題,就是只有解決了其他AI的問題才有可能解決語音的問題。

一個明顯的例子,在語音里面有個叫做“雞尾酒效應”。你去參加一個雞尾酒會,周圍非常嘈雜,每個人都在講話,即使我離你很近,可能很多時候還是聽不清你在講什么,你講的話里面十個字有九個字我都沒有聽清,可是因為你講的內(nèi)容我大概知道,所以即使我連音都聽不清楚,我還是能夠猜出你講的是什么。

但今天用任何語音識別的方法一定失敗。在上面的例子中我們?nèi)擞昧颂嗨^的常識,以及對對方的了解,有時候甚至會比手畫腳。這其實就類似于把所有的AI都用上了。所以,人的智能事實上是全部智能的總和。我們?nèi)苏娴臎]有只靠耳朵。

所以如何將各個方面的東西,包括視覺的、文字的、知識的智能綜合起來使用,不僅僅是語音的挑戰(zhàn),也是人工智能未來的挑戰(zhàn),這也是大家在講的通用人工智能。目前這個很難做。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2017-11-10
專訪洪小文:人和當前AI的智能有什么區(qū)別?
作為國際公認的語音識別專家,洪小文于1995年加入微軟,在1998年曾參與微軟亞洲研究院的創(chuàng)立。隨后洪小文又被調(diào)回西雅圖總部,成為微軟公司自然交互服務部門的創(chuàng)始

長按掃碼 閱讀全文