《Global Talk》對話生數(shù)科技:國產(chǎn)視頻生成模型Vidu 2.0引領(lǐng)視頻生成進入"秒級時代"

近日,由鈦動科技特別打造的全球化訪談欄目《Global Talk》迎來了一位重量級嘉賓——生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝。他帶著最新升級的Vidu 2.0版本,與鈦動科技創(chuàng)始合伙人Eric展開了一場關(guān)于前沿視頻生成技術(shù)的深度對話,分享了生數(shù)科技在人工智能領(lǐng)域的前沿技術(shù)和未來展望。

《Global Talk》對話生數(shù)科技:國產(chǎn)視頻生成模型Vidu 2.0引領(lǐng)視頻生成進入

Vidu 2.0:AI視頻生成的里程碑

Vidu 2.0版本的推出,標志著AI視頻生成進入了一個全新的時代。唐家渝在訪談中提到,Vidu 2.0在生成速度上實現(xiàn)了質(zhì)的飛躍,4秒鐘的視頻生成時間縮短至10秒以內(nèi),推動視頻生成進入“秒級時代”。這一技術(shù)突破不僅提升了用戶體驗,還為未來的實時互動短劇、互動游戲等新型娛樂形式奠定了基礎(chǔ)。

除了生成速度的提升,Vidu 2.0還大幅降低了生成成本,生成1秒視頻僅需4分錢,視頻生成成本真正實現(xiàn)了“分”時代。唐家渝強調(diào),Vidu 2.0在參考生視頻的準確性、畫面穩(wěn)定性、精細度等方面也做了全面提升,使得生成的視頻更加逼真和穩(wěn)定。

多主體一致:引領(lǐng)行業(yè)標準

Vidu在多主體一致生成能力方面一直處于行業(yè)領(lǐng)先地位。唐家渝介紹,Vidu不僅能夠?qū)崿F(xiàn)人臉一致性生成,還能擴展到整個人體、物品以及虛擬CG角色。Vidu 1.5版本已經(jīng)能夠?qū)崿F(xiàn)“多主體一致”,例如輸入人臉、杯子、環(huán)境三張照片,Vidu可以自動化生成視頻。這一功能對于創(chuàng)作者來說非常重要,因為它解決了傳統(tǒng)AI視頻生成中主體不一致的問題。

唐家渝還提到,Vidu的底層模型采用了Diffusion+Transformer架構(gòu),這是生數(shù)科技在全球最早提出的,比Sora的底層架構(gòu)還要早幾個月。這一架構(gòu)創(chuàng)新使得Vidu在生成速度和準確性上遠超其他模型。

全球化布局:從中國走向世界

Vidu自2024年7月全球上線以來,20天用戶數(shù)突破百萬,100天用戶數(shù)突破千萬,目前全球超過200個國家和地區(qū)的用戶在Vidu平臺上生產(chǎn)了上億條視頻。唐家渝表示,Vidu在海外市場應(yīng)用廣泛,特別是在泛娛樂、視頻內(nèi)容創(chuàng)作、廣告營銷等領(lǐng)域。例如,海外的攝影、相冊相關(guān)應(yīng)用底層接入Vidu,亞馬遜等電商公司也利用Vidu生成網(wǎng)站商品圖。

為了更好地服務(wù)全球用戶,生數(shù)科技在本地化方面也做了大量工作。唐家渝提到,Vidu訓(xùn)練了通用的視頻模型,能夠?qū)W習(xí)世界各方面的知識,對于特定國家的文化和偏好,Vidu會特別學(xué)習(xí)相關(guān)文本、視頻、圖像等知識,以更好地理解和滿足當?shù)赜脩舻男枨蟆?/p>

未來展望:多模態(tài)模型的無限可能

唐家渝在訪談中展望了AI技術(shù)的未來發(fā)展方向。他表示,生數(shù)科技正在研發(fā)多模態(tài)通用模型,這一模型不僅能夠生成視頻,還能與物理世界進行交互,例如學(xué)習(xí)傳感器信息、理解世界、操控機械人等。多模態(tài)模型的未來非常廣闊,能夠打通數(shù)字世界和物理世界的界限。

在商業(yè)化方面,唐家渝強調(diào),生數(shù)科技聚焦視頻模態(tài),不僅因為技術(shù)上的優(yōu)勢,還因為視頻在信息表達上的主導(dǎo)性和多樣性。視頻生成能力的提升能夠覆蓋更多的應(yīng)用場景和行業(yè),生數(shù)科技將重點深耕兩到三個行業(yè),解決核心問題,真正扎根行業(yè)。

《Global Talk》對話生數(shù)科技:國產(chǎn)視頻生成模型Vidu 2.0引領(lǐng)視頻生成進入

《Global Talk》欄目通過與唐家渝的對話,不僅展示了生數(shù)科技在AI視頻技術(shù)上的領(lǐng)先地位,還為全球觀眾提供了寶貴的行業(yè)洞察?!禛lobal Talk》欄目負責(zé)人表示,此次對話彰顯中國原創(chuàng)科技力量的全球站位。作為鈦動科技打造的國際化交流平臺,該欄目持續(xù)聚焦前沿技術(shù)出海,通過鏈接全球產(chǎn)業(yè)資源,助力中國企業(yè)以技術(shù)創(chuàng)新實現(xiàn)高質(zhì)量全球化。在AI視頻技術(shù)爆發(fā)元年,Vidu 2.0的突破不僅標志著中國在全球AIGC競賽中占據(jù)關(guān)鍵席位,更預(yù)示著一個全民視頻創(chuàng)作時代的加速到來。唐家渝最后寄語《Global Talk》欄目越辦越好,希望鈦動科技能幫助更多中國創(chuàng)業(yè)者走向世界。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )