兩秒鐘,就能將你的想象變成“現(xiàn)實(shí)”。
在商湯技術(shù)日上,商湯“日日新SenseNova”大模型體系正式問(wèn)世,基于該體系的AI內(nèi)容創(chuàng)作社區(qū)平臺(tái)“商湯秒畫(huà)SenseMirage”也一并亮相。
商湯科技董事長(zhǎng)兼CEO徐立現(xiàn)場(chǎng)演示了“商湯秒畫(huà)SenseMirage”基于商湯自研AIGC模型的作畫(huà)能力;也介紹了秒畫(huà)平臺(tái)基于商湯大裝置的GPU算力支撐,可幫助用戶(hù)免除本地化部署流程,既能使用商湯自研作畫(huà)模型高效地生成高質(zhì)量?jī)?nèi)容,也可以將本地模型及其他第三方開(kāi)源模型一鍵導(dǎo)入,生成更多樣的內(nèi)容。
秒畫(huà)還提供特異性推理優(yōu)化服務(wù),開(kāi)源模型導(dǎo)入后會(huì)自動(dòng)采用秒畫(huà)底層的模型編譯技術(shù)進(jìn)行加速,實(shí)測(cè)在本地RTX3070顯卡需要10秒生成的圖片通過(guò)秒畫(huà)加速技術(shù)只需要2秒就可以生成。
此外,秒畫(huà)還支持用戶(hù)上傳本地圖像,結(jié)合商湯自研作畫(huà)模型或者開(kāi)源模型來(lái)訓(xùn)練定制化LoRA模型,來(lái)高效地生成個(gè)性化內(nèi)容。(LoRA, 用于通過(guò)小數(shù)據(jù)繼續(xù)訓(xùn)練,將大模型的能力適應(yīng)到某個(gè)垂類(lèi)領(lǐng)域,但會(huì)影響大模型的泛化能力)
·MHTeam: MiaoHua Team,商湯秒畫(huà)團(tuán)隊(duì)創(chuàng)作模型
·最近創(chuàng)作:用戶(hù)使用商湯自研作畫(huà)模型最新創(chuàng)作并分享到廣場(chǎng)的圖畫(huà)作品
·精選模型:用戶(hù)可通過(guò)收藏,將商湯自研模型或開(kāi)源模型添加至用戶(hù)“精選模型”列表中,方便需要時(shí)訪(fǎng)問(wèn)和調(diào)用
·Civitai:是社區(qū)開(kāi)源模型分享網(wǎng)站
·Hugging Face:為AI開(kāi)源軟件公司,主要提供模型托管及GPU算力支持服務(wù)
“商湯秒畫(huà)SenseMirage”平臺(tái),為各類(lèi)創(chuàng)作者帶來(lái)便利,同時(shí)也能充分借助社區(qū)力量,集結(jié)內(nèi)容創(chuàng)意,通過(guò)內(nèi)容共創(chuàng),推動(dòng)AI文生圖技術(shù)與應(yīng)用的生態(tài)構(gòu)建。
超10億參數(shù),多種風(fēng)格秒生成
商湯自研的AIGC文生圖大模型擁有超10億參數(shù),支持二次元、三次元等多種生成風(fēng)格。用戶(hù)無(wú)需復(fù)雜的編程知識(shí),只需給定提示詞,即可生成相應(yīng)圖像,最高可實(shí)現(xiàn)6K高清圖。
無(wú)論是寫(xiě)實(shí)照片、腦洞大開(kāi)的藝術(shù)畫(huà)作,還是未來(lái)科幻場(chǎng)景,模型生成的圖像都能根據(jù)用戶(hù)需求,帶來(lái)真實(shí)的光影效果以及豐富的細(xì)節(jié)內(nèi)容。憑借超快的推理性能,商湯自研作畫(huà)模型的文生圖能力,每2秒就能生成1張512*512分辨率的圖片。
自研AIGC模型,高效釋放圖像生成“巧實(shí)力”
相比于Stable Diffusion,商湯作畫(huà)大模型基于19年開(kāi)始研發(fā)的通用大模型設(shè)計(jì)體系,采用更先進(jìn)的大模型結(jié)構(gòu)設(shè)計(jì)與大batch訓(xùn)練優(yōu)化算法,模型參數(shù)量大小為前者數(shù)倍。
核心技術(shù)包含了自研的 hierarchical inference experts, mixture of token experts, image quality-aware distributed training, texture-guided cross-attention learning等算法,使其具備更優(yōu)的文本理解泛化性、圖像生成風(fēng)格廣度以及圖像高質(zhì)量生成細(xì)節(jié)。
此外,目前市面上所有的LoRA模型都是基于Stable Diffusion或者其變體訓(xùn)練的,依托商湯基模型本身強(qiáng)大的泛化能力,使用其替代Stable Diffusion模型可以基于更少量數(shù)據(jù)快速訓(xùn)練出質(zhì)量更高的LoRA模型,實(shí)現(xiàn)更優(yōu)的風(fēng)格定制化圖像生成,這樣的功能在秒畫(huà)平臺(tái)通過(guò)5分鐘即可實(shí)現(xiàn)。
模型導(dǎo)入+訓(xùn)練,擺脫算力掣肘滿(mǎn)足進(jìn)階創(chuàng)意需求
對(duì)于有進(jìn)階需求的模型創(chuàng)作者, “商湯秒畫(huà)SenseMirage” 平臺(tái)也可支持自行上傳數(shù)據(jù)集進(jìn)行finetune、自訓(xùn)練等功能,定制訓(xùn)練屬于自己風(fēng)格的LoRA模型,通過(guò)拖拽20張圖片訓(xùn)練集,僅需5分鐘就能完成訓(xùn)練,顯著降低模型的訓(xùn)練門(mén)檻。
同時(shí),用戶(hù)也可以一鍵導(dǎo)入 Hugging Face, Civitai, GitHub 等第三方社區(qū)的開(kāi)源模型進(jìn)行體驗(yàn),讓用戶(hù)免除本地化部署的繁瑣流程,通過(guò)商湯AI大裝置SenseCore強(qiáng)大的GPU算力集群、推理加速功能,即可高效生成更多樣的內(nèi)容,創(chuàng)作更便利。
不僅如此,商湯還將面向B端開(kāi)放API接口,結(jié)合商湯AI大裝置SenseCore提供的算力,為客戶(hù)提供便利、高效的服務(wù),打造多樣性的平臺(tái)和社區(qū)生態(tài)。
在大模型的驅(qū)動(dòng)下,AI文生圖技術(shù)快速發(fā)展,可以廣泛應(yīng)用于設(shè)計(jì)、營(yíng)銷(xiāo)、游戲動(dòng)畫(huà)、工程建筑、醫(yī)學(xué)、教育科普等領(lǐng)域,幫助人們提高創(chuàng)造力。
“商湯秒畫(huà)SenseMirage”平臺(tái)的推出,在為創(chuàng)作者打造低門(mén)檻、高效率的創(chuàng)作服務(wù)的同時(shí),還能夠充分整合社區(qū)力量連接更多資源,帶來(lái)更加便利、完善的內(nèi)容生產(chǎn)創(chuàng)作工具,讓每一位創(chuàng)作者都能輕松地將想象變?yōu)楝F(xiàn)實(shí)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )