揭秘線稿自動上色,喵圖科技突破GPU模型壓縮技術

人工智能進軍動漫產(chǎn)業(yè),可以助力整個行業(yè),讓動漫日更、優(yōu)化動漫視效?

來自喵圖科技的算法研發(fā)團隊給出了深度學習在動漫領域的研究進展,開發(fā)了一套在壓縮GPU顯存的情況下,通過人工智能給漫畫線稿優(yōu)化線條、自動上色的技術。

訓練機器自動上色,生成效果“以假亂真”!

研究團隊使用生成對抗網(wǎng)絡(GAN)完成上色任務,達到與人工作畫相近的效果。GAN 使用了兩個以博弈論的方式協(xié)同工作的網(wǎng)絡,以相互競賽的方式來訓練彼此。構成 GAN 的兩個網(wǎng)絡分別是鑒別器和生成器,神經(jīng)網(wǎng)絡自行從輸入圖片中學習到上色的方法,由生成器創(chuàng)建偽造的樣本,同時鑒別器接收[input, training data]和[input, fake output]對來鑒別哪些樣本是真實的,哪些樣本是偽造的。網(wǎng)絡G的目標就是盡量生成真實的圖片去欺騙判別網(wǎng)絡D,隨著其中一個網(wǎng)絡變得更強大,另一個網(wǎng)絡也必須適應和提升。最后博弈的結果是什么?在最理想的狀態(tài)下,G可以生成足以“以假亂真”的圖片?;贕AN 的生成器,研發(fā)團隊還針對不同的業(yè)務場景設計了解耦模型,通過校正輸出、輸入圖片之間的關系,減弱甚至消除這種相互關聯(lián),將不同場景區(qū)別開來。如此訓練后得到的模型,能夠找到最接近輸入圖片畫面風格的參數(shù),實現(xiàn)自動上色。

揭秘線稿自動上色,喵圖科技突破GPU模型壓縮技術

喵圖科技自動上色多種渲染,一鍵完成只需0.5秒

攻克技術難題,GPU模型壓縮技術很優(yōu)秀

傳統(tǒng)的自動上色算法對GPU的資源消耗極大,很難做到大規(guī)模的對應上色處理請求。舉個例子來講,具有50個卷積層的ResNet-50需要超過95MB的存儲器以及38億次浮點運算。喵圖科技研發(fā)團隊基于通道減枝,試圖去除冗余和不重要的項來降低存儲和計算復雜度,訓練一個更緊湊的神經(jīng)網(wǎng)絡來重現(xiàn)一個更大的網(wǎng)絡的輸出。此外,他們還將神經(jīng)網(wǎng)絡二值化,讓計算主要在正1或負1間進行,幾十倍地降低了網(wǎng)絡大小和計算量,保證預測準確率。經(jīng)過他們的努力,AI自動上色仍能照常工作,但GPU 顯存占用降低至原模型的5%,速度提升為10倍。

此項研究的成功,代表著自動上色技術不僅可以用于娛樂面向用戶,也可以形成低成本工業(yè)規(guī)模服務于整個動漫行業(yè),可以為動漫行業(yè)提供“工業(yè)級”畫面輸出,大大壓縮動漫制作的生產(chǎn)時間,節(jié)約生產(chǎn)成本。在未來,動漫制作組只需要幾個人為作品制作劇情方向、繪制部分分鏡,剩下的可以都交給AI自動上色來搞定。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2018-05-24
揭秘線稿自動上色,喵圖科技突破GPU模型壓縮技術
人工智能進軍動漫產(chǎn)業(yè),可以助力整個行業(yè),讓動漫日更、優(yōu)化動漫視效?來自喵圖科技的算法研發(fā)團隊給出了深度學習在動漫領域的研究進展,開發(fā)了一套在壓縮GPU顯存的情況

長按掃碼 閱讀全文