雙十一的背后,投入這場狂歡的AI計(jì)算有多暴力

導(dǎo)語:雙十一來了,全國上億的“剁手黨”通宵血拼,很多人都覺出來,電商推送的商品和以圖搜圖的準(zhǔn)確度同以往相比都有了質(zhì)的提高,我們再也不用翻屏幾十頁去找心儀的東西,這很大程度上是因?yàn)殡娚檀笠?guī)模采用了AI技術(shù),通過計(jì)算力不斷優(yōu)化后臺算法。

一張圖片勝過千言萬語,在網(wǎng)紅、KOL、明星帶貨越來越火的今天,以圖搜圖成為我們迅速“種草”的必備技能。

機(jī)器如何快速精準(zhǔn)地找到圖片對應(yīng)的商品的呢?想想我們小時(shí)候怎么查字典?拆偏旁,算筆畫,或者拼拼音、找聲母,然后就是翻頁。

圖片搜索的基本原理類似于查字典,也需要圖片庫(字典)以及對應(yīng)的索引庫(相當(dāng)于拼音、偏旁的索引);然后把一個圖片進(jìn)行特征提取(算筆畫或者拼拼音);接著把特征值輸入到索引庫,通過搜索匹配得到結(jié)果,搜索結(jié)果會進(jìn)入商品庫,商品庫會根據(jù)搜索結(jié)果自動彈出一系列的推薦商品(不用翻頁了,感謝計(jì)算機(jī))。

我們知道這種技術(shù)在多年前就被電商普遍采用了,但一直比較低調(diào),因?yàn)轶w驗(yàn)實(shí)在是……,好在今天的以圖搜圖早就甩昨天800條大馬路了。

雙十一的背后,投入這場狂歡的AI計(jì)算有多暴力

以圖搜圖,輕松搜到同款

為什么會有這樣的提升?一方面,得益于程序猿/媛加班加點(diǎn)對于系統(tǒng)的不斷改進(jìn),另一方面則得益于AI,以圖搜圖大量采用了AI技術(shù),AI技術(shù)可以通過大量計(jì)算自我優(yōu)化,提高模型準(zhǔn)確度,也就是說,以圖搜圖的準(zhǔn)確度也是計(jì)算力暴力提升的結(jié)果。

AI是什么?計(jì)算機(jī)可以像人一樣計(jì)算,AI可以讓計(jì)算機(jī)可以像人一樣學(xué)習(xí)和思考。怎么實(shí)現(xiàn)呢?我們都知道任何一個計(jì)算機(jī)軟件都有著大量的函數(shù)參數(shù),而且是不可變的,但是AI系統(tǒng)中函數(shù)的參數(shù)是可變的,甚至軟件結(jié)構(gòu)也是可以調(diào)整的,程序猿/媛、攻城獅們先要做出一組標(biāo)記數(shù)據(jù),比如程序猿/媛和攻城獅們最愛的喵星人和它的死敵汪星人就被拿來做訓(xùn)練了。喵星人的照片就標(biāo)記為貓,汪星人的照片標(biāo)記為狗,然后把這些數(shù)據(jù)輸入到模型中,模型就會根據(jù)自己的計(jì)算結(jié)果對比數(shù)據(jù)的標(biāo)記結(jié)果,進(jìn)行自我調(diào)整,從而提高輸出的準(zhǔn)確率。更多頻次的訓(xùn)練、更大的標(biāo)記數(shù)據(jù)集都會讓模型的準(zhǔn)確度不斷提高。這個過程是線下的,被稱為訓(xùn)練,經(jīng)過訓(xùn)練的模型就可以上線提供服務(wù),提供服務(wù)的過程被稱為推理,也就是我們用到的以圖搜圖。

近年來,很多程序猿/媛、攻城獅們的年薪已經(jīng)跨過百萬大關(guān),互聯(lián)網(wǎng)公司的人力成本是噌噌的漲,相比之下,計(jì)算力的單價(jià)卻一直按照摩爾定律在降低…不!在超越摩爾定律的速度降低(GPU、FPGA性能的飆升是另一個技術(shù)話題了),所以,互聯(lián)網(wǎng)大佬們敞開了買AI服務(wù)器,來提升算法。我們躺在床上購物的時(shí)候,真不要忘了小浪,要知道中國一半以上的AI服務(wù)器都是浪潮做的,沒有浪潮,請回憶800條街外的以圖搜圖吧。

好,最后幾個問題,快問快答,讓你知道在以圖搜圖中,計(jì)算力有多暴力。

-請問最最最復(fù)雜的AI模型有多復(fù)雜?

-怎么也要幾萬個參數(shù)吧?訓(xùn)練數(shù)據(jù)集估計(jì)要幾個億?

-什么?!那是幾年前,現(xiàn)在稍微像點(diǎn)樣子的AI模型都是千億級別數(shù)量的參數(shù)、萬億級別數(shù)量的訓(xùn)練數(shù)據(jù)集,少年,這些參數(shù)光是數(shù)完,估計(jì)人類都滅亡了。這么大規(guī)模的AI模型需要多少服務(wù)器?

-我覺得怎么也要幾萬臺吧?

-又錯了,多的幾百臺就夠了,少的幾十臺就行,因?yàn)锳I服務(wù)器的性能就是這么逆天!浪潮AGX-5每秒可以完成訓(xùn)練2000萬億次。

-等等,這個速度有多快?

- 這么來說吧,2018年全球超算TOP500排行榜的狀元美國Summit超級計(jì)算機(jī)的時(shí)候,計(jì)算性能是2億億次,雖然是多了一個0,但是Summit是用3400臺服務(wù)器堆起來的。當(dāng)然AI訓(xùn)練是4位或是8位計(jì)算精度,Summit是64位計(jì)算精度。

雙十一的背后,投入這場狂歡的AI計(jì)算有多暴力

浪潮服務(wù)器AGX-5

我們知道不僅是電商,還有很多的企業(yè)、政府等傳統(tǒng)用戶也要部署AI,沒關(guān)系,不管是什么需求,只要您提,小浪都能滿足,對于傳統(tǒng)用戶,小浪首先推薦NF5468M5。

高度4U,可支持8顆最高性能的Tesla V100以PCI-E或NVLink高速互聯(lián),可以提供高達(dá)300GB/s的互連帶寬,并提供極低的延遲;面向在線推理對高能效比的需求,其可支持16顆高能效比的TeslaP4、T4。適合于互聯(lián)網(wǎng)批量部署,也適合剛?cè)階I圈子的技術(shù)小白。

雙十一的背后,投入這場狂歡的AI計(jì)算有多暴力

浪潮服務(wù)器NF5468M5

最后,扯遠(yuǎn)一句。

我們正在步入AI的時(shí)代,不知不覺中AI已經(jīng)包圍了我們。買杯咖啡,掃碼支付背后有AI;進(jìn)超市買東西,商品陳列背后有AI;開車,集成了AI技術(shù)的攝像頭,讓你規(guī)規(guī)矩矩,你網(wǎng)購、瀏覽網(wǎng)頁、電話……背后全是AI。有了AI,天氣預(yù)報(bào)預(yù)報(bào)時(shí)長從3天提高到1周,貸款審核周期從以周為單位變成以分鐘為單位……

AI能夠走入我們的生活,主要是算法、數(shù)據(jù)和計(jì)算力的推動,程序猿/媛成為高光群體、AI創(chuàng)業(yè)公司成為資本寵兒后,算法的價(jià)值已經(jīng)廣為人知,相比而言,計(jì)算力的價(jià)值卻一直被忽視。計(jì)算力對于AI就像水、電和煤氣對于我們的生活一樣,因?yàn)樘匾耍员缓鲆暋?/p>

你能夠歲月靜好,是因?yàn)橛腥嗽跒槟阖?fù)重前行。翻譯過來就是“你能夠血拼雙十一,是因?yàn)橛蠥I服務(wù)器在不停的計(jì)算”。

浪潮是中國最大的AI服務(wù)器提供商,愿意為你負(fù)重前行,愿意用計(jì)算守護(hù)你的狂歡。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-11-11
雙十一的背后,投入這場狂歡的AI計(jì)算有多暴力
導(dǎo)語:雙十一來了,全國上億的“剁手黨”通宵血拼,很多人都覺出來,電商推送的商品和以圖搜圖的準(zhǔn)確度同以往相比都有了質(zhì)的提高,我們再也不用翻

長按掃碼 閱讀全文