時代涌現(xiàn)茅旭超:AIGC讓我們一天生產(chǎn)10萬條視頻

6月8日消息,在“韌性”2023服裝產(chǎn)業(yè)數(shù)字化創(chuàng)新峰會上,時代涌現(xiàn)聯(lián)合創(chuàng)始人茅旭超發(fā)表了題為《助力智能商業(yè)落地,引領(lǐng)消費場景變革》的演講。他指出,隨著AI技術(shù)的快速迭代,整個商業(yè)場景和商業(yè)應用都發(fā)生了巨大的變化。

茅旭超指出,傳統(tǒng)商業(yè)和智能商業(yè)的最主要區(qū)別在于數(shù)字化營銷,而內(nèi)容為王是其核心之一。傳統(tǒng)商業(yè)場景里,大量內(nèi)容生產(chǎn)的痛點在于預算低、成本高,而AIGC工具可以突破人力產(chǎn)能限制,同時針對不同層級的品牌內(nèi)容,產(chǎn)出對應類型的視頻,改變內(nèi)容生產(chǎn)模式。

(溫馨提示:本文為速記初審稿,在不影響原意的基礎上,由億邦動力編輯整理。)

以下為演講實錄:

感謝大家,我是時代涌現(xiàn)聯(lián)合創(chuàng)始人茅旭超,今天非常高興來和大家分享一下,我們在AIGC領(lǐng)域的思考和見解。今天分享主題是“助力智能商業(yè)落地,引領(lǐng)消費場景變革”。

我選取這個主題的主要目的是,因為現(xiàn)在AI技術(shù)在非常快速地迭代,而隨著技術(shù)的快速迭代,整個商業(yè)場景和商業(yè)應用其實發(fā)生了非常巨大的變化。相信在座的各位,無論是品牌方,還是服務商,應該都有非常深切的感受。相信大家也是跟我們一樣的心情,又緊張又非常激動。

技術(shù)一定會帶來很多變革,但是它會把大家的生意帶到什么樣的方向,其實充滿了很多未知數(shù)。我們目前在泛商業(yè)領(lǐng)域的AIGC應用做了非常多的嘗試,今天會給大家做一個比較具體的分享。

01 場域無限時代到來,數(shù)字化營銷加速轉(zhuǎn)化

首先講一下什么叫消費場景的變革,它本質(zhì)上是因為通信技術(shù)的變化。從2000年開始通信處于3G時代,那時候發(fā)彩信都很貴,基本上處于文字時代。在那個時候門戶網(wǎng)站和博客都是非?;鸬脑诰€渠道。2013年進入4G時代,開始以圖文方式來進行內(nèi)容創(chuàng)作,這個時候微信公眾號和小紅書,陸陸續(xù)續(xù)開始進入到大家的視野。2018年進入5G時代,我們進入全面短視頻的時代,包括之前很多做傳統(tǒng)電商的都進行了快速轉(zhuǎn)型,開始切入直播賽道,短視頻賽道,本質(zhì)上還是通信技術(shù)變革帶來消費場景的變化。

我們一直在說智能商業(yè)。那智能商業(yè)的核心是什么呢?首先對比一下傳統(tǒng)商業(yè)和智能商業(yè)的變化。

傳統(tǒng)商業(yè)大家比較清楚,就是傳統(tǒng)的人貨場,但是人貨場之間有非常明顯的隔離,簡單來講叫人貨分離,場域連接。人要買到貨,必須在一個非常清晰的場域里面進行挑選、支付,再有發(fā)貨、供貨到收貨,這個鏈路是非常非常固定的。

進入到所謂的智能商業(yè),首先已經(jīng)沒有場的概念了,場是無處不在的,人和貨可以快速進行匹配。我們這次來常熟非常深刻的一個感受,我們?nèi)チ司€下很多檔口,看到很多檔口老板娘直接在店鋪上做廣告,最簡單的就是把抖音賬號、快手賬號貼出來。這個就是我們說的場域無限,在線下會有一個檔口,但是我在線上可以無限觸達消費者。

傳統(tǒng)商業(yè)和智能商業(yè)之間最主要的區(qū)別或者說進化的連接是什么?其實就是數(shù)字化的營銷。

數(shù)字化營銷的核心首先是數(shù)據(jù)驅(qū)動,第二是內(nèi)容為王。我們可以快速產(chǎn)出一些優(yōu)質(zhì)的內(nèi)容,在無限場域里觸達到消費者。無論是傳統(tǒng)的貨架電商,消費者通過搜索去找到商品,還是現(xiàn)在最新的興趣電商,通過算法匹配商品找到消費者,本質(zhì)上是要通過內(nèi)容去吸引到消費者,最終促成消費的轉(zhuǎn)化。

這就帶來一個非常大的痛點,如果在傳統(tǒng)的模式下,內(nèi)容創(chuàng)作這件事情,首先需要大量的人力,其次會耗費大量的成本。我們一直在說內(nèi)容創(chuàng)作是有三個方式,最早是文本創(chuàng)作,然后是圖文,但圖文創(chuàng)作的成本其實是文字創(chuàng)作的十倍。第三階段是視頻,視頻創(chuàng)作成本是圖文的十倍。這個其實也很好理解,因為它不是割裂的三種方式,它是一個進化,文字是最基礎的,圖文里面是文字加上圖片。什么是視頻?視頻的核心是把各種內(nèi)容要素通過變化的方式組合起來。

我們簡單來理解,任何一段視頻一定會包含哪些要素呢?包含文本賣點描述或者商品描述,還會包含產(chǎn)品本身。今天如果我拍一段長篇廣告片,我一定會要展現(xiàn)商品本身。這個商品不能在一個完全空白場景里面做展示,這不能吸引人。我需要它有一個場景,室內(nèi)的場景或者室外的場景,甚至說需要有一些素材跟它進行匹配。比如說產(chǎn)品放在一個桌上,人是在沙灘邊走的,這些素材也是構(gòu)成視頻非常重要的元素。

如果最終要生成視頻的話還涉及到什么?今天傳統(tǒng)的拍攝會有一個導演,導演最重要的事情是什么?基于他的創(chuàng)意,要寫出一個腳本。在我們看來,一個腳本,首先鏡頭的變化,近景,遠景,切一些快慢鏡頭,產(chǎn)品本身要做各個角度不同的展示,還要配以不同的動效。最后要把這條片子渲染出來。其實它是一個非常長的業(yè)務流。對應到商業(yè)落地要做視頻,就存在內(nèi)容供給的痛點。

今天我們做一個品牌,基本上商品是正向金字塔的矩陣,基本上大邏輯大家都會有一些爆款,但一定會有大量的長尾款,它的動銷沒有那么足,但要完整整個貨品矩陣,中間會有所謂的核心款,它是可以賣的,但并沒有爆款賣的那么好。

但是在傳統(tǒng)商業(yè)模式下,傳統(tǒng)的內(nèi)容供給其實是一個倒金字塔,跟我們貨品供給是反的。什么意思呢?我們一定會有大量的預算去打爆品,我們會產(chǎn)出一些高質(zhì)量的內(nèi)容。傳統(tǒng)意義上,這些高質(zhì)量內(nèi)容叫做品宣的創(chuàng)意大片,這部分通常會有視頻方式去做呈現(xiàn),制作方一般來說都是廣告公司或者4A創(chuàng)意機構(gòu),基本上是高預算、高質(zhì)量,這是對爆品產(chǎn)生內(nèi)容的要求。

針對中心的核心款,這中間的痛點是什么?預算有限,如果今天針對一個爆款,可以有100萬預算拍廣告片,但針對次一級十個款,我不可能全部花預算去拍,中間一定會有ROI的指標,這就是一個痛點。我們總結(jié)出來它的特點是,相對來說是低預算的,但同時要產(chǎn)出高質(zhì)量的內(nèi)容。這些內(nèi)容產(chǎn)出的形式,視頻也有,圖文也有,承接機構(gòu)基本上是制作公司或者影棚。

再往下就是所謂的長尾款,基本上是沒有素材的。如果今天做電商,客戶有一些最基本的電商素材,就是白底圖和描述,僅此而已。這部分工作我們理解叫低質(zhì)量、低預算,基本上會有傳統(tǒng)的電商代運營公司或者品牌內(nèi)部團隊去完成。相對來說,它是比較重復性的工作。

這是目前的現(xiàn)狀,兩個完全倒立的金字塔,需求和實際產(chǎn)出并不完全匹配。

02 AIGC驅(qū)動數(shù)字化營銷,再造內(nèi)容生產(chǎn)金字塔

在智能商業(yè)領(lǐng)域,隨著AIGC技術(shù)逐漸成熟,我們有機會實現(xiàn)的是什么?針對品牌不同層級的內(nèi)容都可以有不同類型的內(nèi)容供給,并且通過AI的方式進行賦能,降本增效。

我們總結(jié)了一下現(xiàn)在AIGC可以產(chǎn)出的視頻內(nèi)容,針對品牌不同級別的產(chǎn)品,分別可以做什么樣的解決方案。

針對爆款,對標如果是今天品牌的品宣大片,我們可以幫品牌進行高精度的3D模型,獲得虛擬數(shù)字資產(chǎn)。同時像做創(chuàng)意導演一樣,幫他合成一段高質(zhì)量的3D創(chuàng)意視頻。

針對中間核心款,我們可以基于品牌現(xiàn)有素材,包括在電商渠道已有的詳情圖,它的標題和描述,品牌自有的直播錄像、直播切片,還有品牌在站外進行種草的達人和KOC的素材。這些素材經(jīng)過一定范式的重組,就可以把它生成智能混剪視頻,比如說虛擬人的評測和講解視頻,比如說3D表達的視頻。

同樣針對底層的長尾款,平時沒有內(nèi)容的,我們要實現(xiàn)的是什么呢?可以非常快速地實現(xiàn)讓品牌所有圖片都動起來。我們可以做2D表達視頻,商品本身可能不是360度做展示,但是可以通過一些動效讓它的產(chǎn)品動起來。我們還可以幫大家獲得平臺流量紅利的視頻,比如說在淘寶渠道有些公域流量紅利,像微詳情、頭圖視頻,如果可以通過AIGC方式快速實現(xiàn),就可以直接幫品牌獲得一些流量紅利。

當然還可以再加上最新的AI技術(shù),比如說通過AI方式添加一些旁白,基于品牌現(xiàn)有的素材,將文案進行重組,通過旁白的方式去串聯(lián)視頻。我們還可以通過模特換裝,在服裝行業(yè)大家會非常感興趣這樣的應用。我們通過AI模特進行服裝換裝,把本來在假模身上的一件衣服可以快速換到模特身上生成基礎素材?;谶@些基礎素材,我們再進行混剪,商品展示,虛擬人講解,就可以生成一段比較長的視頻。

總結(jié)一下我們在做的事情,我們想要做的AIGC跟大部分提供AI工具的不太一樣,我們做這件事情要全自動,我來講解一下什么叫全自動。

今天如果我們來拆解AIGC,相信大家的第一印象肯定是從ChatGPT開始的,ChatGPT是一個文本模型,是一個應用工具,基本上可以通過你輸入一段文本,跟你進行對話。今天市面上有大量工具是在通過對話的方式獲得文本,已經(jīng)有辦法快速地提效,我要幫商品寫一段文案,可以求助于ChatGPT,它可以給我寫一段文案,國內(nèi)有很多新的文本模型可以做的很好。

但在這中間會有兩個痛點。我們給ChatGPT一個非常精準的總結(jié)叫“一本正經(jīng)地胡說八道”,如果用過的人相信會有這個感知。它看上去講的內(nèi)容邏輯是非常嚴密的,但如果你去查一下,內(nèi)容通常是不準確的。這中間核心的原因是什么?ChatGPT是美國一個不開源的大模型,它的數(shù)據(jù)更新到現(xiàn)在為止還是2021年底。如果今天作為個人對話類工具沒有關(guān)系,你跟它聊,它可以回復你,它說得不準,大家哈哈一笑就可以了。

但想象一下,如果今天這一段內(nèi)容是用于電商平臺,我要做視頻或者我要寫一段文案的,大家最怕的是什么?一定是怕職業(yè)打假人,首先你不能出違禁詞,其次你不能胡說八道,一旦被抓到將會產(chǎn)生風險,所以ChatGPT就不能直接進行應用,那我們要進行新的模型訓練。

還有一個工具相信大家應該也比較熟悉,是圖像生成類工具叫Midjourney,國內(nèi)也有類似的圖像生成工具。這些工具特點是什么?它非常好玩,輸入一段文本文案就可以快速把圖片做出來,這是一個很有趣的能力。但是如果今天我們要用于商業(yè)領(lǐng)域,它就會遇到問題。如果今天我做的是商業(yè)素材和內(nèi)容,我不能完全讓AI去生成一段圖片,因為這里面的商品表達很可能是不準確的,它可以幫助我們生成素材,生成背景,但如果今天賣的是一個水瓶,我描述一下生成一個水瓶,它一定不會跟品牌本身的商品是一模一樣的,這種準確度是達不到的。

通過現(xiàn)有圖片工具也好,文本工具也好,哪怕重新開發(fā)出這樣的工具也好,它一定是可以去用。但是如果最終端給到商家去做商業(yè)使用,中間會有很大的門檻,準確度是不高的,而且會產(chǎn)生風險。

我們現(xiàn)在在做這件事情叫全自動,核心能力是可以調(diào)用市面上所有公開的模型能力,比如說圖形生成能力,比如說文本能力,比如說軟件可以合成視頻的能力,所有這些能力都會集合到基于我們自己的語言大模型,將它生成為代碼。

03商業(yè)應用全自動,變革內(nèi)容生產(chǎn)模式

我再來解釋一下什么叫全自動。我們做視頻,就是文案、素材、背景、鏡頭、動效、渲染、混剪,這是做視頻所有的動作。如果今天沒有我們的工具,大家會怎么做呢?傳統(tǒng)意義上可能是一個剪輯師或者一個美工,他會用一些工具,比如Photoshop或者他做視頻的CCD或者Blender,然后通過自己找到各種素材去做一條視頻?,F(xiàn)在市面上有大量的工具,這些工具可以給到專業(yè)人士進行提效。

我們一直在說,現(xiàn)在3D動畫師很幸福,他可以通過大量工具,根據(jù)他的想象快速生成一些素材,再結(jié)合他的創(chuàng)意把這些素材整合到工具里面,最后做出這個視頻。這里面的核心能力是什么?核心是3D動畫師或者剪輯師。但是我們覺得它其實沒有真正體現(xiàn)商業(yè)價值的改變。

我們再來舉個例子,傳統(tǒng)意義上今天一個美工或者創(chuàng)意師,每天可以做兩段視頻,這個視頻可以做到100分。我們通過提效的工具可以實現(xiàn)一個人一天可以做10條視頻,提效了5倍。這個已經(jīng)非常驚人了,老板非常開心。因為這些視頻是通過AI的方式去做的,可能不能達到100分的效果,只能達到90分,但其實完全OK了。

那我們在做什么事情呢?首先這個人沒有了,并不存在一個人每天做多少片子。在沒有人的情況下,我們每天可以做1000條,甚至一萬條。我們現(xiàn)在對視頻數(shù)量是沒有限制的。我們可以做到多少分呢?我們起始可以做到80分、85分,然后通過不斷訓練腳本模型可以達到90分,所以它根本上解決的不光是效率問題,而是產(chǎn)出模式的問題。如果今天是人做的,還是每天有一個產(chǎn)能的限制,如果讓AI全自動做,這個限制就沒有了,可以每天產(chǎn)出無限的視頻,核心能力就是全自動。

同時還有一點好處,隨著不斷有新的技術(shù)出來,假設有一天AI生成的元素已經(jīng)非常高級,可以生成視頻的素材,我們可以整合進FancyGPT的自動化能力。如果今天有另外一個文本比ChatGPT寫的還要好,那我們可以外加一個FancyGPT的能力,這是我們想要做的。我們核心是做AI視頻自動化生成的工具。

那我們怎么實現(xiàn)了呢?我們叫FancyGPT,這個是我們自主研發(fā)的,基于LLaMA模型進行自己調(diào)參,調(diào)參600億參數(shù)做的大語言模型。這個模型目前是國內(nèi)唯一泛商業(yè)領(lǐng)域的通用語言大模型。這個模型只能做一件事情。你問它別的問題,它不能回答你,但可以回答你一件事情,就是你只要輸入一個商品的鏈接地址,它會自動去解析,生成一段代碼。這里面會涉及到第一秒調(diào)用這個鏡頭,我要生成這段文本,第二秒我的產(chǎn)品要進行左移,調(diào)用第二個鏡頭生成第二個文案。這是FancyGPT現(xiàn)在的核心能力,它可以快速生成一段代碼,在我們自己的視頻渲染軟件里面,通過代碼實現(xiàn)的方式自動把視頻做出來。

它是怎么做到的呢?首先進行了大量的數(shù)據(jù)訓練,我們本身積累了過去三年中國品牌在電商渠道,淘寶、京東和抖音,還有在社交渠道,小紅書、微博和微信公眾號里面大量的商品表達信息,包含了圖片、視頻、標題、評論。這是非常好的數(shù)據(jù)集,我們對它進行了完整的訓練,最終得到了FancyGPT。

這個訓練過程只是解決兩個問題——準確性和時效性。我們的模型可以輸出的文本,輸出這些素材,首先準確度極高,基本上不會讓品牌來挑戰(zhàn)我們內(nèi)容的準確度,同時時效性非常高。現(xiàn)在每天要生成10萬條視頻,然而我們并沒有一個售后團隊來對應品牌,意味著我們產(chǎn)出視頻的質(zhì)量非常高,否則我們會有大量的人要去應對品牌的訴求。通過這一點實現(xiàn)了全自動之后,接下去要做的就是內(nèi)容的輸入和輸出,最終形成視頻。

看一下輸入端需要的是什么?從最基礎的店鋪商品鏈接的素材,我們目前已經(jīng)可以實現(xiàn)品牌把商品店鋪ID 給到我們,進行綁定之后,我們自動解析品牌電商店鋪里面所有素材的信息、圖片、視頻、文本描述。通過全自動方式調(diào)用素材,重新做整合,自動生成視頻。因為我們有全自動能力,所以也接受品牌的定制化需求。再加一個工作就是品牌需要把產(chǎn)品寄給我們,進行3D模型的建立,我們幫他獲得了虛擬商品資產(chǎn)之后,就可以幫他做進階的高級3D視頻。同時,我們也接受基于品牌的內(nèi)容素材,現(xiàn)在可以通過獲得品牌的直播錄像、客服聊天記錄,包括品牌自己的培訓資料給到AI,我們會幫他做二次的數(shù)據(jù)調(diào)優(yōu),因為底層模型是我們自己開發(fā)的,完全具備這個能力。

目前可以實現(xiàn)的是,只要基于差不多200條品牌信息,就可以幫品牌調(diào)一個基于品牌自己的商品信息進行精準表達的小模型。

具備了這些能力,獲得這些輸入之后,我們的輸出是什么呢?

有兩套解決方案,一套叫超麥視頻,主打的就是金字塔的底層部分,大量的長尾款。因為現(xiàn)在平臺是有電商流量紅利的,視頻紅利的,所以通過超麥視頻SaaS化的年費服務,可以快速幫品牌把電商所有的內(nèi)容全部視頻化,獲得平臺的流量紅利。這一步是完全不需要人工介入,只要品牌把店鋪綁定給我,我這邊視頻就可以輸出,而且我可以直接同步到品牌的視頻投放渠道,做內(nèi)容監(jiān)控,并且做自動優(yōu)化。

第二步,品牌一定會有進階的內(nèi)容要求,做一些比較高級的創(chuàng)意視頻。我們通過獲得他的3D建模之后,提供另一套解決方案叫得體營銷。簡單來講就是一個內(nèi)部的AI創(chuàng)新廣告公司,我們可以把品牌的創(chuàng)意進行AI自動化。今天品牌給我一條創(chuàng)意視頻,或者他希望可以實現(xiàn)某一個創(chuàng)意的想法,任何一段視頻都會拆解出鏡頭、腳本、元素、動效,拆完之后把它變成代碼,品牌如果還有別的產(chǎn)品,我可以按照品牌現(xiàn)有的視頻范式去生成視頻。

接下去有大量的視頻案例給大家看一下,大家如果有問題,可以隨時來討論。

這是最典型的某一個商家的淘寶的商詳頁,里面有五張圖,正面、反面、細節(jié)的模特圖。下面有一個標題,再往下是詳細的描述。我們跟這家店鋪合作之后,自動獲得所有的信息,然后就開始輸出視頻,在后臺,商家什么都不需要操作,直接可以看到視頻。

大家可能會覺得這段視頻沒有什么亮眼。我來告訴大家,這個視頻的核心能力是什么?首先在后臺是沒有模板的,視頻里面所有的鏡頭,比如這個產(chǎn)品圖片是這樣切出來的,中間要混剪一段模特走秀,所有動作合成的決定并不是人,是我們的AI。

我們會做到什么呢?今天同樣一個商詳頁,我們可以生成無數(shù)視頻。因為每一次AI 調(diào)用的鏡頭和生成視頻是不一樣的,所以我們在這樣的服務框架下,可以幫品牌生成無限量的基礎視頻。這些視頻的應用場景基本上是公域視頻獲得流量的渠道,比如在淘寶的微詳情,包括京東、淘寶和抖音所有整個商詳頁的視頻,我們都可以獲得。

我再快速講一下我們公司,公司成立三年,目前差不多有200個員工,有差不多500個合作伙伴。最重要的是每天產(chǎn)出的視頻量在飛速地增加,現(xiàn)在每天產(chǎn)出差不多10萬條視頻量。

好的,今天我的分享就到這邊,我們有一個微信視頻號,里面有非常多的案例。大家如果有興趣的話也可以來關(guān)注一下,獲得更多關(guān)于我們的信息,謝謝大家。

關(guān)于本次會議

7月13日,2023服裝產(chǎn)業(yè)數(shù)字化創(chuàng)新峰會暨長三角產(chǎn)業(yè)數(shù)字化創(chuàng)新峰會在常熟舉辦。本屆峰會由中共常熟市委人才工作領(lǐng)導小組辦公室、常熟市人力資源和社會保障局主辦,常熟市工業(yè)和信息化局、常熟市商務局支持,江蘇常熟服裝城管委會、億邦動力承辦,常熟市紡織服裝協(xié)會、常熟市電子商務協(xié)會協(xié)辦。

作為紡織服裝產(chǎn)業(yè)的年度盛會,本屆峰會以“韌性”為主題,邀請了服裝領(lǐng)域頭部企業(yè)和知名品牌、優(yōu)秀技術(shù)服務商、供應鏈平臺代表等嘉賓,圍繞“品牌創(chuàng)新之韌”、“數(shù)字營銷之韌”、“研發(fā)設計之韌”和“數(shù)字供應鏈之韌”等四大角度依次展開討論,共話紡織服裝行業(yè)的數(shù)字化前景。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-07-14
時代涌現(xiàn)茅旭超:AIGC讓我們一天生產(chǎn)10萬條視頻
6月8日消息,在“韌性”2023服裝產(chǎn)業(yè)數(shù)字化創(chuàng)新峰會上,時代涌現(xiàn)聯(lián)合創(chuàng)始人茅旭超發(fā)表了題為《助力智能商業(yè)落地,引領(lǐng)消費場景變革》的演講。

長按掃碼 閱讀全文