亚洲精品无码Aⅴ人在线观看国产,欧美日韩视频在线成人

2月22日消息，OpenAI的文生視頻模型Sora案例視頻集一經(jīng)推出，就成為科技圈的熱門話題。

繼ChatGPT后，Sora的文生視頻能力再次驚艷AI圈子，大有不談Sora就out了的氛圍。

Sora文生視頻效果驚艷

根據(jù)OpenAI官方給出的介紹，Sora是一個通用的視覺數(shù)據(jù)模型，它可以生成不同持續(xù)時間、寬高比和分辨率的視頻和圖像，最高可達一分鐘的高清視頻。

OpenAI發(fā)布了48個視頻，這些均是由Sora模型（Creating video from text）通過對文字理解而生成的視頻。

第一個視頻就是根據(jù)文本：“一位時尚的女士走在東京的街道上，街道上充滿了溫暖的霓虹燈和生動的城市標志。她穿著黑色皮夾克、紅色長裙和黑色靴子，手里拿著一個黑色錢包。她戴著太陽鏡和紅色口紅。她走路自信而隨意。街道潮濕且反光，形成了彩色燈光的鏡面效果。許多行人走來走去?！保≒rompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.）生成的視頻。

Sora出現(xiàn)之前，在文生視頻領(lǐng)域，美國初創(chuàng)企業(yè)Runway和Pika被認為是視頻生成賽道的領(lǐng)先者。

然而，Sora的出現(xiàn)，瞬間秒殺了“領(lǐng)先者”們。

從公布的視頻來看，Sora通過文字生成的視頻表現(xiàn)明顯突出：

首先，時長更長。Sora生成60秒視頻，Pika是3秒，Runway是4秒；

第二，Sora的視頻有多角度鏡頭，分鏡切換符合邏輯，并且視頻主體移動時與背景保持高度穩(wěn)定和流暢；

第三，Sora的視頻對光影反射、運動方式、鏡頭移動等細節(jié)處理得更好。

總之，就是Sora生成的視頻極大地提升了視頻的“真實感”，讓人看了感覺像是真實拍攝的。

繼“有圖有真相”破碎后，視頻也不再等于真相了。

目前，OpenAI尚未向公眾開放Sora，僅對部分研究人員和學(xué)者開放測試資格。

國內(nèi)用戶無渠道參與試用Sora。

但這也不妨礙科技圈大牛們對Sora的研究興趣。

OpenAI 官網(wǎng)上公開的信息，48個Sora文生視頻案例、Sora的技術(shù)報告《Video generation models as world simulators》(中文譯《把視頻生成模型作為世界模擬器》)成為各方人士研究Sora的主要抓手和窗口。

多少有些隔岸旁觀、盲人摸象的感覺，短短幾天，對Sora的關(guān)注和討論就形成了多個“派別”。

技術(shù)派：挖掘Sora背后的技術(shù)邏輯

國外社交媒體上的AI大牛，國內(nèi)微博技術(shù)大V、知乎技術(shù)博主們紛紛發(fā)文分析Sora的核心技術(shù)。

這些分析主要根據(jù)OpenAI給的技術(shù)報告《Video generation models as world simulators》及報告中羅列的32篇技術(shù)文獻提及的技術(shù)而來。

技術(shù)大牛們挖掘出的Sora模型創(chuàng)新主要有2個關(guān)鍵：

一， Spacetime Patch（時空Patch）技術(shù)

技術(shù)報告原文：LLMs have text tokens, Sora has visual patches.

解放思想，從大型語言模型中獲得靈感。

如同LLM將各種類型的文本內(nèi)容轉(zhuǎn)化為Tokens后，實現(xiàn)對大規(guī)模文本內(nèi)容的訓(xùn)練；

用Spacetime Patch對所有類型的視頻內(nèi)容進行統(tǒng)一表示，進而能夠?qū)σ曨l生成模型進行大規(guī)模數(shù)據(jù)訓(xùn)練。

圖片來源于《Video generation models as world simulators》

值得注意的是，Spacetime Patch除了包括視頻信息元素的空間信息還有時間信息。

圖片就是單幀的視頻，把圖片按正確的發(fā)生時間順序顯示出來，就將是一個邏輯正確的視頻。

二， Diffusion Transformer（DiT，擴散型 Transformer）架構(gòu)。

技術(shù)報告原文：Sora is a diffusion transformer。

和其他文生視頻產(chǎn)品所用的底層架構(gòu)不同，Sora 使用的是Diffusion Transformer架構(gòu)。

Diffusion Transformer論文（26號論文）的作者之一William Peebles，現(xiàn)在是OpenAI工程師，負責(zé)開發(fā)Sora。

《Video generation models as world simulators》羅列的技術(shù)文獻

Sora能獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻，還能獲取現(xiàn)有視頻，進行擴展或填充缺失內(nèi)容。

技術(shù)大牛們認為，Transformer強在前后文的理解和保持連續(xù)性，這讓Sora在時間軸上的延伸性非常出色，可以生成開頭不同但結(jié)尾完全一致的視頻片段。

哲思派：人工智能的能力到了什么階段？

以周鴻祎為代表的國內(nèi)技術(shù)大佬們對AI能力進化的思考又進一步。

Sora生成的視頻發(fā)布后，周鴻祎就稱“Sora意味著AGI實現(xiàn)將從10年縮短到兩三年”。

此后，短短3天時間，周鴻祎已發(fā)布7個小視頻來闡述自己對Sora的思考。

周鴻祎認為，“Sora應(yīng)該還是模擬了人類去觀察世界、描繪世界和表現(xiàn)世界的方法?！?/p>

“Sora表面上是一個文生視頻的工具，實際上是一個現(xiàn)實世界模擬器。它也不僅僅是用來模擬現(xiàn)實世界，它意味著通用人工智能對這個世界的理解能力又一次得到了突破。GPT對人類語言和知識的理解達到了一個突破點，而除了人類的語言和這個世界的人類之間做交互的知識之外，這個世界還有很多規(guī)律，人工智能對物理世界的規(guī)律缺乏理解的話，那么它是殘缺的，不可能真正變成通用人工智能?！?/p>

“Sora做出的視頻之所以讓人感覺真是，不是畫面有多優(yōu)美，是因為讓人類看起來，所有的動作是符合這個世界的運行規(guī)律的。它對這個世界的規(guī)律有了一個比較更為完整的了解。這就說明人工智能的能力又上了一個臺階?！?/p>

搞錢派：售賣課程、追漲股票、投資建廠搞芯片

現(xiàn)在，針對Sora熱搜引發(fā)的“搞錢派”也分不同段位。

最基本的一類是，根據(jù)信息差來賣課、賣賬號的。

Sora根本還沒對外開放使用，現(xiàn)在就來這樣搞錢實在太無厘頭了。

然而，還真有人買單。

某電商平臺26.6元的學(xué)習(xí)包，居然已經(jīng)售出10多份。

第二類是追漲AI概念股搞錢的，人也不少。

春節(jié)后A股開門紅，AI相關(guān)概念股全線上揚，Sora板塊多模態(tài)模型概念、ChatGPT、虛擬人、AIGC、算力等相關(guān)概念均有所上漲，算是給A股的朋友們一個新年紅包。

最高段位的，還是直接針對大模型“核心能力”—— 算力出奇跡進行投資的富豪們。

上圖從左往右分別是Sora使用 1 倍資源、4 倍資源、16 倍資源訓(xùn)練時的生成效果。

圖片來自《Video generation models as world simulators》

可見，算力，仍然是卡住AI發(fā)展脖子的角色。

就在Sora發(fā)布后，軟銀創(chuàng)始人孫正義正尋求籌資1000億美元（約合人民幣7000億元），用于創(chuàng)立一家AI芯片企業(yè)，旨在挑戰(zhàn)英偉達的消息傳出。

OpenAI創(chuàng)始人 Sam Altman籌建7萬億打造AI芯片帝國的計劃也被曝出向美政府尋求政策支持。

找差距、威脅派

就在Sora露面后的2天，2月18日，國家互聯(lián)網(wǎng)信息辦公室關(guān)于發(fā)布第四批深度合成服務(wù)算法備案信息，該批共有266個算法通過備案。此前三批分別有41、110、129個算法通過備案。

這意味著截至目前，國內(nèi)總計已經(jīng)有546款深度合成服務(wù)算法獲得備案。

追問“國內(nèi)何時有自己的Sora？”“國內(nèi)企業(yè)距離趕上Sora還要多久？”的聲音毫無意外的再次響起。

當然，Sora生成視頻太逼真而引發(fā)犯罪不可控的擔(dān)憂聲也不少，生成的視頻是否會影響到人身安全、社會穩(wěn)定、企業(yè)安全等等。

迎接“Sora們”開放，法律、社會、技術(shù)等層面是否都做好了準備？

如IDC分析師所言，生成式AI產(chǎn)品不可預(yù)測的未來：具體哪些公司能在什么時間點推出與 Sora 類似的產(chǎn)品，不可預(yù)測。當前 Sora 生成的是1分鐘的視頻，下一步何時能生成2分鐘5分鐘以上的視頻，不可預(yù)測。

但是，對于個人而言，生成式AI產(chǎn)品已經(jīng)在潛移默化的改變我們的生活方式，每一個人都可以認真考慮該類產(chǎn)品如何能夠助力我們的生活與工作。

還是那句話，每一項新技術(shù)進入人們的生活時，總是伴隨著興奮和質(zhì)疑。那么就讓Sora們多飛一會兒！

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）