伯俊CTO洞察:AI模特?fù)Q裝背后的隱憂和挑戰(zhàn)有哪些?

今年伊始,ChatGPT的東風(fēng)不僅吹向了國(guó)內(nèi)科技圈,也吹向了包括零售電商在內(nèi)的許多細(xì)分領(lǐng)域。

ChatGPT是AI行業(yè)發(fā)展的一個(gè)里程碑,正在引發(fā)一場(chǎng)生產(chǎn)力變革。它在市場(chǎng)營(yíng)銷等方面已多有應(yīng)用:設(shè)計(jì)師用它快速生成圖像和視頻,文案人員用它幫助自己寫文章、寫文案、寫腳本……甚至已經(jīng)有不少領(lǐng)域在用ChatGPT“搞錢”了。

我們也從各種新聞報(bào)道中可以看到,曾經(jīng)數(shù)萬(wàn)元成本才能拿下的假發(fā)模特實(shí)拍,如今依靠ChatGPT和Midjourney,僅用10分鐘就能生成好幾版,而且實(shí)測(cè)模擬顯示,AI繪圖會(huì)比實(shí)拍更加真人化,渲染完成之后絕對(duì)要比人工拍的好。

AI模特?fù)Q裝真的有這么好嗎?現(xiàn)在遇到的問題有哪些?

AI模特?fù)Q裝帶來的隱憂

正所謂“外行看熱鬧、內(nèi)行看門道”。作為CTO,我認(rèn)為把一項(xiàng)新技術(shù)注入產(chǎn)品,去賦能業(yè)務(wù)的時(shí)候,要考慮很多因素。當(dāng)前這個(gè)階段,大模型進(jìn)步非常快,但還是有很多問題沒有解決。

另外,用戶場(chǎng)景的需求本身也不完全一樣,應(yīng)用程序的運(yùn)行環(huán)境也不一樣。比如知識(shí)更新需要重新訓(xùn)練大模型,費(fèi)時(shí)費(fèi)力,所以它的時(shí)效性有缺陷,無法做到對(duì)最新消息的知曉,對(duì)信息時(shí)效性要求高的場(chǎng)景并不適合。大模型是千億級(jí)參數(shù)的,需要設(shè)備端和云端實(shí)時(shí)連接,所以對(duì)于網(wǎng)絡(luò)通訊能力較弱、低功耗的設(shè)備不太適用。

因此,大模型雖然在很多地方適用,但也有一些場(chǎng)景不適用,作為企業(yè),要去考慮如何調(diào)整,如何去抓住機(jī)會(huì)。

區(qū)別于以往的人工智能產(chǎn)品,ChatGPT不單單是文本生產(chǎn)的工具,其強(qiáng)大的語(yǔ)言處理和生存能力也增加了很多的用戶體驗(yàn),同時(shí)也為我們降低了生產(chǎn)經(jīng)營(yíng)、交易的成本,同時(shí)也提高了企業(yè)的經(jīng)營(yíng)效率,而這種大規(guī)模的適配器以及迭代的能力也是ChatGPT的特點(diǎn),它在特定的領(lǐng)域、專業(yè)語(yǔ)言以及自動(dòng)化的客戶服務(wù)等各方面都做出了巨大的成就。

我個(gè)人認(rèn)為ChatGPT在零售行業(yè),未來有非常廣闊的發(fā)展空間。

隨著數(shù)字化、智能化時(shí)代的到來,消費(fèi)者對(duì)于購(gòu)物體驗(yàn)和個(gè)性化需求的要求越來越高。尤其在服裝電商領(lǐng)域,消費(fèi)者更加注重對(duì)服裝的直觀了解和購(gòu)買體驗(yàn)。因此,對(duì)于電商商家來說,如何降低營(yíng)銷成本、提高營(yíng)銷質(zhì)量,成為亟待解決的問題。

以模特?fù)Q裝為例,目前市場(chǎng)上服務(wù)的商家均表示,通過AI模特?fù)Q裝,能夠?yàn)殡娚躺碳姨峁└玫臓I(yíng)銷解決方案,可以降低商家的營(yíng)銷成本,還可以提高商家的競(jìng)爭(zhēng)力和展示效果,讓消費(fèi)者更直觀地了解服裝。

我們了解到目前AI模特?fù)Q裝從技術(shù)和實(shí)際情況都帶來一些問題和隱憂。

我了解到,一位電商從業(yè)者在AI技術(shù)上投入了約200多萬(wàn),打算從此不再雇用真人模特;一位淘寶服裝店主正在培訓(xùn)技術(shù)人員,等夏季上新時(shí)就換上AI模特;一位模特經(jīng)紀(jì)公司老板正在學(xué)習(xí)AI繪畫工具,打算不再聘用簽約模特。

種種做法,讓很多人覺得真人模特會(huì)失業(yè)。事實(shí)上,這種擔(dān)憂目前還是多慮,以現(xiàn)在的技術(shù)而言,AI模特?fù)Q裝還不能做到完全自動(dòng)化。

目前AI生成的人物圖已經(jīng)較為成熟,海量的人物照片已經(jīng)被喂進(jìn)AI的大模型中,在此基礎(chǔ)上,可以通過自定義訓(xùn)練集對(duì)模型進(jìn)行微調(diào),比如臉、衣服的部分。據(jù)了解,目前做AI模特的同行,大多是直接使用已訓(xùn)練好的模型。

一般來說,只要輸入相應(yīng)的文本關(guān)鍵字,AI就能生成相應(yīng)圖片。如果商家想要一位棕色長(zhǎng)發(fā)的女性模特形象,那么輸入“棕色”“長(zhǎng)頭發(fā)”“女性”的關(guān)鍵詞,AI就會(huì)生成不同樣貌的棕色長(zhǎng)發(fā)女性。在此基礎(chǔ)上,如果商家偏好其中某一個(gè),可以固定參數(shù),在之后的換衣步驟中使用同一位AI模特。

不過AI圖看多了之后,還是能分辨出不是真人,比如AI的臉都長(zhǎng)得差不多、身材也類似,有些腰細(xì)得不太合理。目前,許多訓(xùn)練好的AI模特模型都使用了來自日本、韓國(guó)的數(shù)據(jù),長(zhǎng)相帶有明顯的日韓風(fēng)。這也是為什么很多用AI做模型的小公司,訓(xùn)練了數(shù)個(gè)自定義模型,再混到原先的模型里,生成的臉還是帶有原來模型的感覺。

其實(shí),很難去校準(zhǔn)一個(gè)完全脫離AI味的東西。這個(gè)局限性當(dāng)然可以解決,比如你再去訓(xùn)練,但是每一次訓(xùn)練,成本又上去了。

再比如,即便使用AI生成的圖片可以多達(dá)每秒30余張,甚至更多,但是從真人視角去看,可以使用的可能一張都沒有。

對(duì)于使用AI模特的商家而言,換裝試衣的技術(shù)非常關(guān)鍵。目前商家的做法主要有兩種方式可以實(shí)現(xiàn):一種是拍攝衣服各個(gè)角度的照片,借助LoRA模式訓(xùn)練這些照片,生成模特穿上這條裙子后的各個(gè)姿勢(shì)圖像;另一種方式是重繪,需要把衣服套在石膏假人上并拍照,將衣服部分固定下來,再生成AI模特和仿真背景。

不過這樣還是存在很多問題。前者生成的圖像不能保證百分之百地還原衣服,可能有10%的細(xì)節(jié)會(huì)丟失。比如,原本衣服上的一朵小花,生成后可能會(huì)變成一個(gè)圓點(diǎn),這種情況下,需要再進(jìn)行細(xì)調(diào)或人工后期。而后者,每次將衣服套上模型并拍照,也會(huì)增加時(shí)間成本。從你拍下來的照片,到直接一張成品的圖,沒有那么自動(dòng)。

機(jī)遇和挑戰(zhàn)

實(shí)際上,AI模特仍有局限,目前AI模特的繁瑣之處在于生成之后仍需人工篩圖,比如AI生成10張圖,其中可能有幾張質(zhì)量不高,或細(xì)節(jié)畫錯(cuò),這時(shí)候就需要人工篩選出更好的圖,再進(jìn)行后續(xù)操作。

據(jù)我觀察,AI模特的技術(shù)已經(jīng)具備,但能否大規(guī)模商用,取決于成本和效率。假如說成本還不夠,或者成本不合算,即使有技術(shù)也沒用,但是大家都看到這個(gè)前景了。

圍繞著ChatGPT和AI,國(guó)內(nèi)已經(jīng)有不少?gòu)S商早已開始投入研發(fā)和進(jìn)行相關(guān)業(yè)務(wù)場(chǎng)景的布局,這也是當(dāng)下最火熱的賽道。

以科大訊飛為例,前不久,科大訊飛星火認(rèn)知大模型正式上線,這也意味著科大訊飛正式加入類ChatGPT模型的競(jìng)爭(zhēng)。

眾所周知,科大訊飛可以說是智能語(yǔ)音領(lǐng)域的王者。雖然已經(jīng)有多家平臺(tái)推出了類ChatGPT模型,但是主打“AI+行業(yè)”模式的科大訊飛可以更好的將人工智能運(yùn)用在各個(gè)行業(yè)之中。這在目前國(guó)內(nèi)的人工智能市場(chǎng)中,是獨(dú)特的存在。

科大訊飛的星火AI可以很好的將企業(yè)結(jié)合在一起,圍繞著知識(shí)問答、代碼編程、數(shù)理推算、創(chuàng)意聯(lián)想、言翻譯等多個(gè)使用場(chǎng)景,通過海量的文本代碼和知識(shí)學(xué)習(xí),通過自然對(duì)話的方式,理解用戶需求,并有效執(zhí)行任務(wù)。

這一切的背后都是服務(wù)用戶和消費(fèi)者。

事實(shí)上,早在2021年,科大訊飛便與我們伯俊科技進(jìn)行了合作,共同探索私域經(jīng)營(yíng)。

作為伯俊的戰(zhàn)略客戶,科大訊飛和伯俊科技再次聯(lián)手,伯俊科技將通過構(gòu)建商品統(tǒng)一服務(wù)能力、一方數(shù)據(jù)沉淀能力、全渠道聯(lián)合庫(kù)存能力、全渠道訂單服務(wù)能力、全渠道信息敏捷響應(yīng)能力、數(shù)智化分析評(píng)估能力,助力科大訊飛實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。

在星火AI加持下,伯俊科技將為科大訊飛提供可靠支持,為其消費(fèi)者業(yè)務(wù)的數(shù)字化轉(zhuǎn)型打下堅(jiān)實(shí)基礎(chǔ),共同推動(dòng)零售行業(yè)技術(shù)進(jìn)步和業(yè)務(wù)協(xié)同發(fā)展。

(作者系伯俊CTO陳雨陸)

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )