色综合视频一区二区,国产与进口X7X7X7槽比较

4月15日消息，今日，快手可靈AI宣布基座模型再次升級，面向全球正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。

與此同時，可靈2.0大師版正式發(fā)布，全新上線多模態(tài)視頻編輯功能，在語義響應、動態(tài)質量、畫面美學等方面顯著提升生成效果。

官方披露的數(shù)據(jù)顯示，自去年6月發(fā)布以來，可靈AI已累計完成超20次迭代，截至目前，全球用戶規(guī)模突破2200萬。

可靈2.0視頻生成模型

據(jù)快手高級副總裁、社區(qū)科學線負責人蓋坤介紹，可靈2.0視頻生成模型在動態(tài)質量、語義響應、畫面美學等維度，保持全球領先。

比如，在文生視頻領域，可靈2.0對比谷歌Veo2的勝負比為205%，對比Sora的勝負比達367%，在文字相關性、畫面質量、動態(tài)質量等維度上顯著超越對手。

3月27日，全球知名AI基準測試機構Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單，快手可靈1.6pro（高品質模式）以1000分的Arena ELO基準測試評分登陸圖生視頻（Image to Video）賽道榜首。

蓋坤披露的數(shù)據(jù)顯示，截至目前，可靈AI全球用戶規(guī)模已突破2200萬，累計生成1.68億個視頻及3.44億張圖片素材。自去年6月上線至今的10個月時間里，可靈AI的月活用戶數(shù)量增長25倍。

可圖2.0圖像生成模型

據(jù)快手副總裁、可靈AI負責人張迪介紹，在圖像生成大模型領域，快手的可圖2.0處于行業(yè)領先水平，擁有多項核心優(yōu)勢，諸如強大的復雜語義理解能力、電影級的畫面質感、多條件的可控風格化生成等。

在團隊內(nèi)部的多項勝負率評測中，相較于Midjourney V7、FLUX1.1 [pro]以及Reve等行業(yè)領先的圖像模型，均保持明顯優(yōu)勢。

可圖2.0文生圖能力迎來全面升級。包括大幅提升指令遵循能力、顯著增強電影美學表現(xiàn)力以及更多元的藝術風格。在風格化響應上，可圖2.0可支持60多種風格化的效果轉繪，模型出圖創(chuàng)意和想象力實現(xiàn)大幅躍升。

同時，可圖2.0也上線了實用的圖像可控編輯功能——局部重繪和擴圖，支持圖片的增加、修改和修復。在圖像的多模態(tài)可控生成中，可圖2.0還上線了全新的風格轉繪功能，只需要上傳一張圖片加上風格描述，就能一鍵切換圖片的藝術風格，同時精準保留原圖的語義內(nèi)容。

可靈2.0大師版

在本次2.0模型的迭代中，可靈AI正式發(fā)布AI視頻生成的全新交互理念Multi-modal Visual Language（MVL），讓用戶能夠結合圖像參考、視頻片段等多模態(tài)信息，將腦海中包含身份、外觀、風格、場景、動作、表情、運鏡在內(nèi)的多維度復雜創(chuàng)意，直接高效地傳達給AI。

“大家應該很自然地會感受到文字在表達影像信息時，是不完備的。我們需要有新的方式，能讓人真正精準地表達出心中所想?！鄙w坤指出，MVL由TXT（Pure Text，語義骨架）和MMW（Multi-modal-document as a Word，多模態(tài)描述子）組成，能從視頻生成設定的基礎方向以及精細控制這兩個層面，精準實現(xiàn)AI創(chuàng)作者們的創(chuàng)意表達。

基于MVL這一全新交互方式，快手可靈AI發(fā)布了全新的可靈2.0大師版。張迪表示，可靈2.0大師版全面升級視頻及圖像創(chuàng)作可控生成與編輯能力，上線全新的多模態(tài)視頻編輯功能，能靈活理解用戶意圖。

比如，可靈2.0大師版支持在一段視頻的基礎之上，通過輸入圖片或文字，對生成的視頻內(nèi)容實現(xiàn)元素的增加、刪減、替換，幫助創(chuàng)作者們實現(xiàn)更加靈活的二次編輯和處理。

張迪披露，當前，圖生視頻約占到可靈AI視頻創(chuàng)作量的85%，圖片質量也對視頻的生成效果產(chǎn)生重要作用。

面向B端商家提供API接入服務

據(jù)介紹，除了C端訂閱用戶，可靈AI也面向B端商家提供API接入等服務。

目前，可靈AI已與包括小米、亞馬遜云科技、阿里云、Freepik、藍色光標等在內(nèi)的數(shù)千家國內(nèi)外企業(yè)客戶建立了合作關系。

蓋坤披露，來自世界各地的超1.5萬開發(fā)者，已將可靈的API應用于不同的行業(yè)場景中，累計生成的圖像數(shù)量約1200萬個，生成的視頻素材超過4000萬個。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內(nèi)容或斷開相關鏈接。

可靈AI基礎模型重磅更新全球用戶數(shù)已突破2200萬

下一篇

可靈AI基礎模型重磅更新 全球用戶數(shù)已突破2200萬

下一篇

可靈AI基礎模型重磅更新全球用戶數(shù)已突破2200萬