欧美男人亚洲天堂,免费AV一区二区三区无码,欧美自偷精品视频自拍漫画

調(diào)皮的話：

你有多久沒玩文心一言了？掐指一算，百度的文心一言發(fā)布還不到一個(gè)月，但總覺得是去年的事情一樣。

ChatGPT火了之后，中國的科技行業(yè)陸陸續(xù)續(xù)發(fā)布了多個(gè)大語言模型，但真正落地應(yīng)用的，還是沒有幾個(gè)，最早發(fā)布的文心一言，已經(jīng)快被大家忘了，倒是被賣課的先割走了幾百萬。

今天，商湯科技也發(fā)布了多個(gè)行業(yè)應(yīng)用的ChatGPT類產(chǎn)品，前搜狗創(chuàng)始人王小川也宣布創(chuàng)辦“百川智能”，已經(jīng)融資了5000萬；王慧文的光年之外，也已經(jīng)進(jìn)入了第二輪融資。

ChatGPT類產(chǎn)品的創(chuàng)業(yè)和開發(fā)，在中國還如火如荼，但是資本市場(chǎng)不給面子，包括周鴻祎的三六零在內(nèi)的多個(gè)ChatGPT概念股，今天大跌。

前兩天，著名科技作家吳軍在一次分享時(shí)提供了一個(gè)觀點(diǎn)：ChatGPT的原理是語言模型，而語言模型不是什么新科技革命，早在1972年就由他的老師創(chuàng)辦，期間經(jīng)歷了很多次迭代，直到2000年深度學(xué)習(xí)技術(shù)的進(jìn)步，才把語言模型推向了新的階段；如今在大算力和數(shù)據(jù)量的基礎(chǔ)上，語言模型又更進(jìn)了一步，但是對(duì)現(xiàn)實(shí)世界的沖擊，沒大家想像的那么夸張，大家不必活在恐懼中，要防止被給韭菜。

不過，不讓大家恐懼，還是有點(diǎn)難度，畢竟百度谷歌阿里京東等巨頭都在進(jìn)入這個(gè)領(lǐng)域，專家們對(duì)此也意見不同。

以下是吳軍老師的分享，給大家講述了語言模型的歷史，提供了另一個(gè)視角，請(qǐng)大家自行斟酌，我們持中立態(tài)度：

ChatGPT的出現(xiàn)，為什么會(huì)引起恐慌？

我知道，最近ChatGPT這事兒在中國很火，很多人在討論，但很有意思的是，其實(shí)這件事在美國，已經(jīng)沒有太多人去談?wù)撨@個(gè)話題了。其實(shí)不光是ChatGPT，往前看十年，當(dāng)時(shí)很多新技術(shù)出現(xiàn)的時(shí)候，我就發(fā)現(xiàn)在中國媒體上討論的熱度要遠(yuǎn)遠(yuǎn)高于美國。雖然那個(gè)技術(shù)其實(shí)主要出現(xiàn)在美國，但是中國人老百姓對(duì)此更關(guān)心。我認(rèn)為這是一件好事，但也是一件壞事。

這個(gè)“壞”在于，這些技術(shù)實(shí)際上是被過度的炒作了，在這個(gè)過程中，有很多渾水摸魚的人從中賺錢。就比如說區(qū)塊鏈，當(dāng)時(shí)炒得那么熱，但如今這個(gè)事已經(jīng)很少有人討論了，對(duì)吧？這是第一個(gè)。第二個(gè)就是元宇宙，目前美國只有 Facebook一家還在堅(jiān)持做。那到了中國，很多人就在討論說，我們是不是將來會(huì)生活在一個(gè)完全虛擬的世界。最后，大概去年底到今年初，F(xiàn)acebook在這個(gè)領(lǐng)域幾百億美元投下去，一個(gè)響也沒聽著，最后開始了大規(guī)模的裁員。到了現(xiàn)在，被熱炒的一個(gè)話題就是ChatGPT，有的人興奮，有的人恐懼，還有我現(xiàn)在也看到在中國還有很多人在渾水摸魚，試圖再割大家一次韭菜。

ChatGPT的技術(shù)基礎(chǔ)是什么？

從歷史回到現(xiàn)在，其實(shí)ChatGPT的情況也差不多，背后是一個(gè)叫做語言模型的一個(gè)數(shù)學(xué)模型在發(fā)揮作用。換句話說，ChatGPT的背后是一個(gè)數(shù)學(xué)模型。在今天，這項(xiàng)技術(shù)顯得很強(qiáng)大的原因主要是三個(gè)：

第一，它用到的計(jì)算量很大；

第二，它的數(shù)據(jù)量很大；

第三，今天訓(xùn)練語言模型的方法比以前要好很多。

那么，語言模型是什么呢？或者說它是一個(gè)什么時(shí)代的產(chǎn)物？

它是1972 年，由我的導(dǎo)師賈里尼克(Fred Jelinek)帶領(lǐng)團(tuán)隊(duì)研發(fā)的一項(xiàng)技術(shù)。具體地講，是他當(dāng)時(shí)在IBM帶著人來完成的一項(xiàng)技術(shù)，是用來衡量一句話或者一個(gè)語言現(xiàn)象有多么的可能產(chǎn)生。那它有什么用？它最初的用處是做的語音識(shí)別，后來是做機(jī)器翻譯，再后來是做計(jì)算機(jī)問答，也就是我們今天熟悉的回答問題。

當(dāng)時(shí)它就可以做摘要，比如舉一個(gè)例子，有一篇一萬字的文章，那么你怎么摘要出十句話能概括這一篇文章的內(nèi)容，這對(duì)于做這個(gè)自然語言處理的人來講，就是一個(gè)數(shù)學(xué)問題。也就是說，你的條件是什么？條件是這一萬個(gè)字，然后你想得到的結(jié)果是什么？結(jié)果可能就是十句話，一百個(gè)字。然后這里頭有很多種組合，你可以隨便挑幾個(gè)句子，也可以把有的句子拆成兩段，把后面那些不太重要的修飾或者形容的部分去掉。然后，你也可以把兩個(gè)句子合成一個(gè)句子，那么你在合成一段文本的時(shí)候，這個(gè)計(jì)算機(jī)就會(huì)計(jì)算一個(gè)概率，哪些句子合成在一起的概率比較大，它會(huì)按照概率幫你合成。

而我們今天看到的ChatGPT，就是這個(gè)大的語言模型，它就是會(huì)挑一個(gè)概率最大的、最有可能發(fā)生的這樣一個(gè)文本來給你看。所以總體來講，ChatGPT生成結(jié)果的過程，是一個(gè)用大量的計(jì)算資源來計(jì)算的過程。它需要非常龐大的數(shù)據(jù)量來支撐，有很多很多的GPU（電腦處理器）。沒有這些東西的話，ChatGPT是做不起來的。

而且今天這個(gè)ChatGPT，其實(shí)不光是技術(shù)，還有很多人工在背后。他們還雇了一家公司，專門負(fù)責(zé)審核ChatGPT產(chǎn)生的結(jié)果。比如說，ChatGPT產(chǎn)生了一百篇摘要，都挺好，我已經(jīng)分辨不出來了，那么這些人就負(fù)責(zé)幫我分辨一下，到底哪一篇更像是準(zhǔn)確的摘要。

那實(shí)際上，你可以看到，ChatGPT背后就是一個(gè)語言模型，而這一語言模型的技術(shù)是1972年就已經(jīng)有了的。到現(xiàn)在，經(jīng)過了五十年，現(xiàn)在行業(yè)內(nèi)其實(shí)大家并不覺得它是一個(gè)什么了不得的東西。在此以前，這個(gè)語言模型其實(shí)已經(jīng)做了很多的事情。

你可以這樣理解，“語言模型”之于ChatGPT，就相當(dāng)于開普勒的這個(gè)行星三定律之于月食。

“語言模型”誕生之初是什么情況？

那么在發(fā)明的當(dāng)時(shí)，語言模型是一個(gè)什么情況？

其實(shí)，在20世紀(jì)90年代的時(shí)候，用簡(jiǎn)單統(tǒng)計(jì)方法得到的模型很不準(zhǔn)確。這就相當(dāng)于，我打個(gè)比方，你觀察行星，但用的是托勒密的地心說來預(yù)測(cè)，是很不準(zhǔn)確的。所以，那時(shí)候我們開始引入了語法、主題、語義的很多信息。然后，這個(gè)語言模型就變得很復(fù)雜了。復(fù)雜之后就又帶來了一個(gè)很大的問題。

什么問題？

比如，做一個(gè)很復(fù)雜的語言模型，這個(gè)語言模型當(dāng)時(shí)有多少參數(shù)？600萬個(gè)參數(shù)，就是說，這個(gè)語言模型大小基本上按這個(gè)參數(shù)來定。我那時(shí)候做的已經(jīng)是那個(gè)時(shí)代能做的最大、最復(fù)雜的語言模型了。我當(dāng)時(shí)用的還不是PC機(jī)，而是20臺(tái)超級(jí)服務(wù)器，然后大概算了三個(gè)月才訓(xùn)練出這樣一個(gè)語言模型。所以你看，它的計(jì)算量是非常大的。那么，第一版ChatGPT，它用的語言模型參數(shù)是多少呢？大概是 2000 億個(gè)參數(shù)，大家可以看到這些年的變化。

所以，今天很多人問，ChatGPT在美國出現(xiàn)了，中國研究機(jī)構(gòu)什么時(shí)候能做ChatGPT？其實(shí)，中國的大部分研究機(jī)構(gòu)是做不了的，不是說研究水平的問題，而是因?yàn)镃hatGPT太耗資源。今天的ChatGPT，可能光硬件的成本就要差不多10億美元，這還沒算電錢，所以成本和耗資是非常巨大的。所以，如果開完玩笑，問ChatGPT的最大貢獻(xiàn)是什么，我倒覺得它對(duì)全球變暖是有很大貢獻(xiàn)的。

所以，我想說的是，ChatGPT這件事，它的原理很簡(jiǎn)單，但是在工程上要想做到，其實(shí)是蠻困難的一件事。

計(jì)算機(jī)擅長(zhǎng)回答什么問題？

到了大概2010年前后，也就是13年前，語言模型能做到什么程度？我給大家看兩個(gè)例子。這兩個(gè)例子都是我在2014年離開Google以前做的。當(dāng)時(shí)我負(fù)責(zé)的是Google的自動(dòng)問答系統(tǒng)，就是讓計(jì)算機(jī)回答問題。不過因?yàn)檫@個(gè)產(chǎn)品是英文的，所以在中文世界基本上沒有太露臉。

我給你看一下谷歌回答的一個(gè)問題——為什么天是藍(lán)色的，why is the sky blue？

它的回答是這樣的：太陽光透過大氣層到達(dá)地球時(shí)會(huì)發(fā)生折射，空氣中的氣體會(huì)讓不同顏色的光散射到各個(gè)地方，藍(lán)光波長(zhǎng)短，比其他顏色折射率高，所以看上去天是藍(lán)色的。

這是當(dāng)時(shí)計(jì)算機(jī)產(chǎn)生的一個(gè)答案。公平地講，這個(gè)答案比我自己寫一段答案寫得要更好，因?yàn)橐忉屵@現(xiàn)象，你要知道不少物理學(xué)知識(shí)，而且這個(gè)句子看上去也挺合情合理的。而今天人們使用ChatGPT的一個(gè)目的，就是讓他回答問題。

這里面，我給大家做個(gè)拆分。

其實(shí)，我們問計(jì)算機(jī)的問題可以分為兩類，第一類叫做簡(jiǎn)單問題，第二類叫做復(fù)雜問題。簡(jiǎn)單問題就是關(guān)于事實(shí)的問題，比如某某明星是哪兒人，哪一年生的。這都是一些容易的問題，因?yàn)樗鞘聦?shí)，有明確答案。

第二類是復(fù)雜問題，這也是大家覺得 ChatGPT 非常驚艷的地方。它能整合信息，回答天為什么是藍(lán)色的，好像它自己有邏輯一樣。再有一個(gè)，就是問過程的問題，比如說我怎么烤蛋糕，你能不把一步步寫下來？今天我們問ChatGPT怎么烤蛋糕，它可以把這個(gè)過程給你寫得很詳細(xì)，多少杯水，加多少個(gè)雞蛋，加多少面粉等等，它都可以告訴你。然后你根據(jù)它提供的答案，就真能烤出蛋糕，而且烤得可能還挺不錯(cuò)。

這是大家覺得很了不得的地方。但是你要知道，這件事，在2014年其實(shí)計(jì)算機(jī)已經(jīng)做到了，而且做得很好。所以，這項(xiàng)技術(shù)本身并沒有太多神秘的地方。

計(jì)算機(jī)和人，誰更擅長(zhǎng)寫作？

現(xiàn)在，大家熱議ChatGPT，還有一個(gè)原因就是覺得它能寫作。比如說寫一個(gè)工作簡(jiǎn)報(bào)，這是今天美國人用ChatGPT用得最多的地方。我這周干了1234567，這七件事，哎，你看我就不用自己費(fèi)勁地寫了，我讓ChatGPT生成一個(gè)，然后再編輯一下子就可以了。

但是，計(jì)算機(jī)寫作這件事，其實(shí)你說難也難，說容易也容易，我可以給你舉個(gè)例子。

用計(jì)算機(jī)寫了兩首詩，大家可以讀一下這兩首詩。

第一首詩是個(gè)五言詩，這是用我的話說，叫做李白風(fēng)格的一首詩，大家可以讀一下。這首詩就是計(jì)算機(jī)自己寫的。實(shí)際上，你如果讀一讀，這個(gè)詩里還真有一些李白的這個(gè)特點(diǎn)。

那第二首詩，我也把圖片放在下面了，你可以看一下。

先說一下，因?yàn)楣旁姸加衅截埔徽f，但是我們現(xiàn)在的讀音和當(dāng)時(shí)的讀音不一樣，所以我們也沒去管這個(gè)平仄到底合不合古，但是這個(gè)我們單從它的內(nèi)容意境來講，你讀的會(huì)覺得很順暢。

好，那么話說回來。第一首詩怎么做的？

其實(shí)再簡(jiǎn)單不過了，你就把李白的詩放到計(jì)算機(jī)里。李白詩一共1000 多首，也就一萬來句話，這個(gè)對(duì)計(jì)算機(jī)來講太簡(jiǎn)單了。它寫的時(shí)候，就是把句子分拆開來，拆成兩個(gè)字、三個(gè)字一組，比如“空愁”這是一組，“憶長(zhǎng)安”這三個(gè)字一組。然后它就去拼剛才我講的語言模型，算概率，哪個(gè)概率最大；拆完了以后，我就跟他提一個(gè)要求，說要寫一首憶長(zhǎng)安的詩，它就排列組合，生成出這個(gè)《憶長(zhǎng)安》，實(shí)際上就是這么拼湊出來的。第二首詩稍微復(fù)雜一點(diǎn)。

但你知道這兩個(gè)程序我寫了多長(zhǎng)時(shí)間？?jī)商臁＿@說明什么呢？說明你讓計(jì)算機(jī)寫出一些還挺像樣的東西，其實(shí)不是一件很困難的事情，它沒有你想得這么神秘，或者說計(jì)算機(jī)寫作本身沒有這你想得這么神秘。

那為什么這兩首詩看起來特別好？因?yàn)檫@是唐詩，唐詩的格式是固定的。同樣的道理，為什么用ChatGPT寫周報(bào)寫得好？因?yàn)橹軋?bào)的格式基本上是拉清單，那也是個(gè)固定的格式。包括，如果你讀《華爾街日?qǐng)?bào)》中文版，這里頭我跟你講，90%的內(nèi)容都是計(jì)算機(jī)寫的，只是你不知道。寫完了以后人當(dāng)然要給它一個(gè)主題，然后給它寫的第一段話寫個(gè)引子，然后給一個(gè)總結(jié)，起個(gè)標(biāo)題，這是人要做的。

為什么寫財(cái)經(jīng)文章比較好？因?yàn)樗泻枚嗟氖聦?shí)在里頭，格式也是固定的，所以這件事它做起來就很好。

我花這么長(zhǎng)時(shí)間來講ChatGPT的背景，實(shí)際上就是想說它并不神秘，不是一個(gè)什么很高深的機(jī)器在背后。一方面，ChatGPT依靠的是一個(gè)數(shù)學(xué)模型，而這個(gè)數(shù)學(xué)模型1972年就有了，只是今天它的計(jì)算能力非常強(qiáng)，靠蠻力計(jì)算。

那么，ChatGPT訓(xùn)練一次要耗多少電？大概可能是3000輛特斯拉的電動(dòng)汽車，每輛跑到20萬英里，把它跑死，這么大的耗電量，才夠訓(xùn)練一次，這個(gè)非?；ㄥX的一件事。

ChatGPT對(duì)我們到底有什么影響？

那么接下來講講，ChatGPT對(duì)人有什么影響。

這就要回到歷史上來看了，每一次技術(shù)革命，其實(shí)它對(duì)人都會(huì)有一些影響。不過，ChatGPT它不算是一項(xiàng)新的技術(shù)革命，因?yàn)檫@我剛才講了，這個(gè)過程很長(zhǎng)，從20世紀(jì)70年代到90年代，我們做了很多事，90 年代到現(xiàn)在又有很多人做了很多事。這里頭最大進(jìn)步其實(shí)不是這個(gè)語言模型本身，實(shí)際上是后來2000年左右產(chǎn)生的深度學(xué)習(xí)，使得訓(xùn)練語言模型能比以前準(zhǔn)確了，不是簡(jiǎn)單的做統(tǒng)計(jì)。

今天訓(xùn)練語言模型早已經(jīng)不是簡(jiǎn)單做統(tǒng)計(jì)了，這才是ChatGPT能產(chǎn)生比較好的結(jié)果的一個(gè)原因。

至于說ChatGPT對(duì)人能產(chǎn)生什么樣影響，這個(gè)問題我先不直接回答你，我先問你，剛才給大家看這兩首唐詩，你有沒有發(fā)現(xiàn)一個(gè)什么特點(diǎn)？對(duì)了，這兩首詩寫得不錯(cuò)，但是你原來對(duì)唐朝了解，不會(huì)因?yàn)槎嗔诉@兩首詩會(huì)有更新的了解。因?yàn)?，ChatGPT它某種程度上有點(diǎn)像鸚鵡學(xué)舌，你先要說一段話，它才能跟著學(xué)。它說出來的聲音可能很好聽，但是它并不提供更多的信息。

今天互聯(lián)網(wǎng)上90%的內(nèi)容都屬于這一類——不提供更多的新信息，也不是原創(chuàng)內(nèi)容，也不是自己的感悟，無非是東抄抄，西湊湊。目前，抖音、快手這類短視頻，我覺得99%的內(nèi)容都屬于這一類，沒有營養(yǎng)，你讀完以后可能覺得挺有意思，但實(shí)際上你在上面讀了再多，其實(shí)對(duì)你沒有任何幫助。

如果說ChatGPT真的威脅到了誰，我覺得威脅到的就是這一類人的工作，就是說這個(gè)抖音上頭那個(gè)做短視頻的，或者發(fā)布一些內(nèi)容的，ChatGPT會(huì)做得比他們好很多。你就想這樣一件事兒，假設(shè)說，有一群人天天把那唐詩三百首里頭的句子翻來覆去的捯飭，也能捯飭出一些詩，那么ChatGPT捯飭起來肯定比人快得多，所以這項(xiàng)技術(shù)會(huì)對(duì)這一批人會(huì)有影響。

那么，什么人不會(huì)受到影響？就是內(nèi)容創(chuàng)造的人不會(huì)受影響。

為什么我會(huì)這么講？還記得剛才我說的“為什么是天是藍(lán)色的”這個(gè)問題嗎？Google為什么能回答這個(gè)問題？

因?yàn)樵贕oogle進(jìn)行回答的時(shí)候，它大概把當(dāng)時(shí)英語幾乎所有的像樣的句子都做了分析，大概有1000 億句英語句子。那么實(shí)際上你會(huì)發(fā)現(xiàn)，在一些大學(xué)的網(wǎng)站上和NASA的網(wǎng)站上，它就有這個(gè)答案，只是我們把它拼拼湊湊，刪刪減減，就把它挑出來了。但是最早的物理學(xué)家做這項(xiàng)研究，把這個(gè)道理搞清楚，這個(gè)工作是有意義的，也是ChatCPT取代不了的。

所以我認(rèn)為，從歷史上看ChatGPT其實(shí)不算是一次技術(shù)革命，它影響到的都是那個(gè)比較懶的人，懶得動(dòng)腦筋，創(chuàng)造新東西的人。真正探索人類知識(shí)奧秘的人，是不會(huì)被取代的。

ChatGPT能帶來什么新的機(jī)會(huì)？

好了，講完了這個(gè)ChatGPT的歷史，我給你做一個(gè)簡(jiǎn)單的總結(jié)。

第一，不要恐懼。

今天是很多人恐懼ChatGPT，就如同不要像當(dāng)年哥倫布遇到的牙買加土著人恐懼月食，一樣的道理。

第二，不要勉強(qiáng)去找所謂的機(jī)會(huì)，該怎么工作就是怎么工作。

我看有同學(xué)問我，說蘋果為什么這個(gè)不做ChatGPT，我說這就對(duì)了！這就是為什么蘋果是世界上最有錢的公司，利潤最高，市值最多。目前，很多所謂做這種人工智能的公司到現(xiàn)在都在虧錢。所以，這也是為什么很多同學(xué)有時(shí)候問很多太不著調(diào)的問題的時(shí)候，我就開玩笑地問他說，你的房貸還清了嗎？你要沒還清，你就好好回去工作，把工作做好，這才是對(duì)大家最有意義的事情，從歷史上看也是如此。

第三，你要識(shí)破這些所謂的陰謀家或者想割你韭菜的人的那些把戲。

就是說，如果再來一個(gè)人假裝哥倫布說他是神的代表，然后他能祈禱上天讓這月亮出來，你不要信。所以你需要了解ChatGPT背后的一些科學(xué)原理。最簡(jiǎn)單的一些原理，像今天我講的這些，你還是需要有所了解。

本文來源：學(xué)人Scholar 作者：吳軍（吳老師在得到上正在開設(shè)<人類文明史>課程）

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個(gè)人觀點(diǎn)，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

ChatGPT被過度炒作了？美國人已經(jīng)不討論了？

下一篇

ChatGPT被過度炒作了？美國人已經(jīng)不討論了？

下一篇

ChatGPT被過度炒作了？美國人已經(jīng)不討論了？