理性認(rèn)識(shí)百度研究院“新品”:VidPress給出了視頻生產(chǎn)新方向

擁抱短視頻,可能是最近自媒體圈中最為流行的關(guān)鍵詞。

單是微信視頻號(hào)的灰度測(cè)試,就讓媒體圈重度地震,原本隱藏在文字背后的“中年大叔”們勇敢出鏡,試圖抓住新生的機(jī)會(huì)窗口。和媒體朋友們?nèi)粘A奶斓脑掝},也不自覺(jué)地拐向了短視頻,有人購(gòu)置了專(zhuān)業(yè)的影像設(shè)備,有人連忙招聘熟悉視頻剪輯的助理……

于是當(dāng)百度研究院推出AI合成短視頻平臺(tái)VidPress的消息傳出后,媒體圈里再次炸開(kāi)了鍋,排著隊(duì)通過(guò)百度創(chuàng)作大腦進(jìn)行測(cè)試申請(qǐng),爭(zhēng)先將自己剛剛寫(xiě)就的深度文轉(zhuǎn)化為有聲有色的短視頻。畢竟VidPress的“果子”不可謂不誘人,只要輸入一個(gè)圖文內(nèi)容的鏈接,就能自動(dòng)生成相應(yīng)的視頻內(nèi)容,極大地節(jié)約了成本和心力。

一番嘗鮮后,有人給了VidPress高分評(píng)價(jià),也有人對(duì)效果的不滿意而詬病。鑒于兩種或贊或罵的態(tài)度,這里分享一下個(gè)人對(duì)VidPress的思考,到底是理想又一次敗給了現(xiàn)實(shí),還是一開(kāi)始就期許過(guò)高?

01 智能化內(nèi)容生產(chǎn)的原理

VidPress詮釋的視頻生產(chǎn)方式,足以用“智能”一詞來(lái)形容。

用戶輸入圖文內(nèi)容的鏈接后,VidPress將在9分鐘的時(shí)間內(nèi)完成視頻素材的聚合、解說(shuō)詞生成、語(yǔ)音合成、音視頻對(duì)齊和渲染導(dǎo)出等一連串的“騷操作”,平均每天可以生產(chǎn)500到1000條視頻,妥妥秒殺了整條街的“剪刀手”。

這樣的內(nèi)容生產(chǎn)方式夸張嗎?不妨先來(lái)看看“黑魔法”背后的技術(shù)原理。

整個(gè)內(nèi)容生產(chǎn)過(guò)程可以分為三個(gè)環(huán)節(jié):

第一個(gè)環(huán)節(jié)是音頻內(nèi)容的生成,平臺(tái)基于多種語(yǔ)言模型對(duì)圖文內(nèi)容的文字部分進(jìn)行處理,然后自動(dòng)生成一篇字?jǐn)?shù)符合要求且適合視頻呈現(xiàn)的解說(shuō)詞,再通過(guò)文字轉(zhuǎn)音頻服務(wù)(TTS)合成解說(shuō)詞語(yǔ)音;

同步進(jìn)行的環(huán)節(jié)是視頻內(nèi)容的生成,平臺(tái)會(huì)對(duì)圖文內(nèi)容進(jìn)行語(yǔ)義理解,根據(jù)文章內(nèi)容自動(dòng)搜索相關(guān)素材,再通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)對(duì)素材進(jìn)行分析和理解,然后精選出合適的素材進(jìn)行智能剪輯合成;

最后一個(gè)環(huán)節(jié)是音視頻的對(duì)齊,這就涉及到百度的第二代時(shí)間軸對(duì)齊算法,選取文本中的興趣點(diǎn),再將視頻片段與興趣點(diǎn)的相關(guān)度進(jìn)行打分,優(yōu)質(zhì)的視頻片段將優(yōu)先放入時(shí)間軸,最終進(jìn)行渲染輸出。

對(duì)于熟悉百度技術(shù)體系或產(chǎn)品體系的朋友來(lái)說(shuō),恐怕不會(huì)驚訝VidPress的存在邏輯。單是百度大腦已經(jīng)對(duì)外開(kāi)放的技能中,諸如自然語(yǔ)言理解、語(yǔ)音合成、計(jì)算機(jī)視覺(jué)相關(guān)的技能就占了不小的比重。聚焦到產(chǎn)品上,小度智能音箱的語(yǔ)音問(wèn)答、動(dòng)態(tài)播報(bào)、人臉識(shí)別等等,都不難在VidPress找到相似的技術(shù)。

只是短視頻內(nèi)容的生產(chǎn)從來(lái)都不是純粹的技術(shù)工作,素材、創(chuàng)意、選題等都影響著最后的視頻質(zhì)量。VidPress的價(jià)值在于利用算法和模型降低了素材搜集、整理、匹配、剪輯的時(shí)間成本,與當(dāng)下大多數(shù)落地應(yīng)用的人工智能產(chǎn)品相似,尚未實(shí)現(xiàn)取代人工甚至完勝人工的智能化程度。

也就是說(shuō),現(xiàn)階段的VidPress還只是輔助人工合成視頻,降低了短視頻剪輯的門(mén)檻和成本,本質(zhì)上是為內(nèi)容生產(chǎn)提供了新的思路。

02 視頻合成中的制約因素

有些遺憾的是,不少媒體朋友看到新聞后對(duì)VidPress進(jìn)行了測(cè)試,然后出現(xiàn)了一些負(fù)面的過(guò)度解讀。

為什么會(huì)出現(xiàn)視頻合成效果不盡如意的現(xiàn)象?還是要回到視頻內(nèi)容生成的環(huán)節(jié)。就技術(shù)層面來(lái)說(shuō),素材的智能識(shí)別、匹配、剪輯等過(guò)程已經(jīng)沒(méi)有太大的技術(shù)瓶頸,問(wèn)題恰恰出在了內(nèi)容素材的廣度上。

畢竟現(xiàn)階段的人工智能遠(yuǎn)未達(dá)到自主生產(chǎn)視頻內(nèi)容的程度,VidPress也需要對(duì)網(wǎng)上的內(nèi)容進(jìn)行搜索匹配,扮演了內(nèi)容“搬運(yùn)工”的角色。對(duì)應(yīng)的一幕就是:在科技、娛樂(lè)、軍事等內(nèi)容素材豐富的領(lǐng)域,VidPress的表現(xiàn)不乏可圈可點(diǎn)之處,也不難看到一些精彩的視頻案例;在一些新聞素材比較少的冷門(mén)領(lǐng)域,合成視頻的效果也就打了折扣。

舉兩個(gè)通俗易懂的例子。

倘若你上傳的是娛樂(lè)圈和某明星相關(guān)的內(nèi)容,不難在網(wǎng)上搜羅出豐富的素材,畢竟可以找到海量的電影、電視劇、綜藝等資源,VidPress可以在人臉識(shí)別算法、時(shí)間軸對(duì)齊算法的基礎(chǔ)上,對(duì)素材內(nèi)容進(jìn)行精準(zhǔn)識(shí)別、匹配、合成,內(nèi)容豐富度和流暢度上恐怕不輸于專(zhuān)業(yè)的視頻剪輯團(tuán)隊(duì)。

如果圖文內(nèi)容屬于情感、公益、社會(huì)相關(guān)的冷門(mén)內(nèi)容,話題本身就比較寬泛,其中還有較大比重的敏感內(nèi)容,可以使用的內(nèi)容素材也就相對(duì)有限,導(dǎo)致平臺(tái)可以聚合的內(nèi)容素材數(shù)量偏低,即便技術(shù)和算法進(jìn)一步優(yōu)化,也難逃“巧婦難為無(wú)米之炊”的困境。

歸根結(jié)底,內(nèi)容素材的豐富度才是VidPress場(chǎng)景應(yīng)用時(shí)的制約因素。

同時(shí)需要思考的恰恰是我們對(duì)內(nèi)容生產(chǎn)的態(tài)度,VidPress的基本價(jià)值在于工具,提供了一種有別于傳統(tǒng)人工的視頻合成思路,降低了視頻內(nèi)容生產(chǎn)的難度值??蓪?duì)于媒體人來(lái)說(shuō),仍然需要躬身打磨內(nèi)容輸出有價(jià)值的觀點(diǎn),繼而利用VidPress實(shí)現(xiàn)價(jià)值的最大化,畢竟視頻只是傳播的載體,優(yōu)質(zhì)內(nèi)容永遠(yuǎn)是話語(yǔ)權(quán)的關(guān)鍵。

或許對(duì)VidPress也是一種啟示,經(jīng)過(guò)了前期的試錯(cuò)后,還需要對(duì)產(chǎn)品的定位進(jìn)行調(diào)整,比如在定制化與垂直品類(lèi)上增加力度,在適用場(chǎng)景上進(jìn)行選擇,盡可能避開(kāi)小眾內(nèi)容在素材上的限制,打造通用的解決方案。

03 未來(lái)可能的產(chǎn)品方向

站在百度的立場(chǎng)上,在短視頻的風(fēng)口期推出AI合成短視頻平臺(tái),恐怕不是為了秀技術(shù)吸引眼球。

從圖文到短視頻再到直播,內(nèi)容的傳播方式越來(lái)越多元化,但在傳播載體不斷進(jìn)化的時(shí)候,內(nèi)容的生產(chǎn)方式似乎有些陳舊。從博客時(shí)代到公眾號(hào)時(shí)代,從長(zhǎng)視頻時(shí)代到短視頻時(shí)代,內(nèi)容的表達(dá)越來(lái)越個(gè)性化,可內(nèi)容生產(chǎn)一直是“笨拙”的人工。

內(nèi)容傳播載體的進(jìn)化制造了一個(gè)又一個(gè)風(fēng)口,當(dāng)內(nèi)容創(chuàng)作方式同步進(jìn)化時(shí),卻可能改變一個(gè)時(shí)代,所能創(chuàng)造的想象空間同樣不可小覷。截止到目前,VidPress還處于小批量免費(fèi)試用的階段,與百度內(nèi)部人士進(jìn)行溝通后發(fā)現(xiàn),等待VidPress可能會(huì)有工具和平臺(tái)兩種產(chǎn)品方向。

從工具的方向來(lái)看,VidPress大概率會(huì)以SaaS服務(wù)的形態(tài)存在,可以在百度智能云上部署運(yùn)營(yíng),也可以進(jìn)行私有化部署。前一種可以服務(wù)大部分內(nèi)容創(chuàng)作者,提供視頻快速剪輯合成的線上工具,并且可以與內(nèi)容版權(quán)方進(jìn)行跨界合作,為創(chuàng)作者提供一站式的視頻內(nèi)容生產(chǎn)服務(wù);后一種則是將能力賦予專(zhuān)業(yè)化的內(nèi)容團(tuán)隊(duì),以人工智能的技術(shù)優(yōu)勢(shì)幫助創(chuàng)作團(tuán)隊(duì)提升效率、降低成本。

從平臺(tái)的方向上看,VidPress將在現(xiàn)有工具屬性的基礎(chǔ)上,與百家號(hào)、好看視頻、百度聯(lián)盟等內(nèi)容生態(tài)打通,形成視頻內(nèi)容生產(chǎn)、分發(fā)、變現(xiàn)的完整產(chǎn)業(yè)鏈。只是生態(tài)化布局的前提是解決內(nèi)容版權(quán)的局限,當(dāng)前VidPress還僅是邀請(qǐng)測(cè)試,并不涉及商業(yè)用途,正式開(kāi)放后就需要百度提供免費(fèi)的版權(quán)視頻庫(kù),與一些第三方視頻版權(quán)庫(kù)合作,并設(shè)計(jì)出一套按需付費(fèi)的商業(yè)模式。

當(dāng)然,上述的種種可能只是猜測(cè),最終的產(chǎn)品演化方向還要靠百度的產(chǎn)品經(jīng)理們給出回答。但這樣的產(chǎn)品出現(xiàn),對(duì)媒體的影響要遠(yuǎn)大于某個(gè)內(nèi)容平臺(tái)的崛起,我們不僅要思考下一波流量在哪里,還需要深入思索自身的核心競(jìng)爭(zhēng)力在哪里,如何與人工智能進(jìn)行分工協(xié)同,在未來(lái)的內(nèi)容生態(tài)中準(zhǔn)確找到自身的定位。

幾乎可以篤定,傳統(tǒng)純消耗腦力和時(shí)間的內(nèi)容生產(chǎn)終將被被顛覆,卻也是VidPress的第二代或者第三代產(chǎn)品的使命,現(xiàn)階段還有些“稚嫩”。

04 寫(xiě)在最后

相較于被下一個(gè)風(fēng)口拋棄的焦慮,不妨多花點(diǎn)時(shí)間思考內(nèi)容消費(fèi)的內(nèi)在邏輯:當(dāng)一個(gè)熱點(diǎn)出現(xiàn)時(shí),需要多維度的觀察的報(bào)道,需要讓受眾客觀的了解事件的始末,也就需要多種不同的聲音。輸出有價(jià)值的信息,可以說(shuō)是內(nèi)容創(chuàng)作最基本的競(jìng)爭(zhēng)力,剩下的無(wú)非是基于成本、效率和用戶口味的權(quán)衡。

VidPress試圖呈現(xiàn)的正是降低“發(fā)聲”的門(mén)檻,推動(dòng)互聯(lián)網(wǎng)內(nèi)容的多樣性。只是現(xiàn)階段還要先延遲一些期待,靜待VidPress后續(xù)的能力輸出。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2020-04-23
理性認(rèn)識(shí)百度研究院“新品”:VidPress給出了視頻生產(chǎn)新方向
擁抱短視頻,可能是最近自媒體圈中最為流行的關(guān)鍵詞。

長(zhǎng)按掃碼 閱讀全文