劉興亮 |AI生成,侵權橫行?

「如果AI生成的作品和你的作品很相似,你會怎么看?」 這是我在某次科技峰會上拋出的問題。

周圍人的眼神立刻變得嚴肅起來,好像我提起了他們的老相識——版權問題。在AI界,這是個老生常談,卻又困擾無數(shù)大腦和機器的大話題。

01

AIGC熱潮:瑞士軍刀還是數(shù)據(jù)小偷?

AIGC——也就是人工智能生成內(nèi)容,不知不覺中,已從科技小圈子走入大眾視野。

你是否還記得那些能寫小說、編程序、搭腔聊天的AI?他們就是AIGC的代表。

今年以來,AIGC爆火并迅速出圈。這一趨勢是由OpenAI、DeepMind等優(yōu)秀的科研機構引領的,巨頭也積極下場搶占風口,包括谷歌、Meta、微軟等知名科技公司先后布局,國內(nèi)的騰訊、百度、阿里、華為、商湯、360、科大訊飛等企業(yè)也紛紛參與其中。

ChatGPT等各類AIGC產(chǎn)品層出不窮,幫助用戶寫文章、寫代碼、搞創(chuàng)作、陪聊天……已經(jīng)成為包括我在內(nèi)的很多人的全能助手。

但AIGC「光鮮亮麗」的背后也存在著版權、隱私、數(shù)據(jù)安全等諸多問題,目前并沒有得到有效的解決。

02

糾紛頻發(fā):AI被告上法庭

海外這樣的糾紛很多——圖片供應商Getty Images起訴了一家推出圖片生成模型的機構Stability AI,聲稱該機構使用了他們網(wǎng)站上的圖片來訓練模型但沒有付費;就連業(yè)界大佬OpenAI也面臨「數(shù)據(jù)小偷」指控,深陷多場集體和作者個體訴訟。

目前國內(nèi)的AI繪畫、AI寫作、AI翻唱、AI換臉等也都可能存在侵權問題。

比如前段時間風靡全網(wǎng)絡的AI孫燕姿,是B站的UP主通過收集原版孫燕姿的聲音訓練AI,然后用AI版孫燕姿去翻唱其他人的歌曲并上傳。UP主生成AI孫燕姿并沒有取得孫燕姿本人的同意,沒有獲得孫燕姿的肖像和聲音有關人身權的使用權。

在AI寫作方面,筆神作文和學而思也產(chǎn)生過數(shù)據(jù)權益的糾紛,最后以雙方和解落幕。

整個行業(yè)都處于版權不明晰的混沌中。

03

AI訓練:大模型的「饑渴」

AI大模型(例如GPT)的訓練是一個復雜的過程,其第一個步驟也是不可避免的步驟就是數(shù)據(jù)的收集和準備——訓練大模型需要大量的文本數(shù)據(jù),包括互聯(lián)網(wǎng)上的文章、書籍、新聞、圖片、論壇帖子等。

AI版權問題的矛盾性在于,大模型想變得無所不知、無所不能,就需要在海量數(shù)據(jù)的基礎上訓練和學習。然而數(shù)據(jù)的來源是否合規(guī),網(wǎng)上公開的資源哪些能用哪些不能用或需要付費使用,目前沒有明確的法律法規(guī)界定,所以難免出現(xiàn)爭議。

版權是保護人類文學、藝術、科學領域內(nèi)有關智力成果創(chuàng)作的法律制度,AI技術對這方面的沖擊真的很大。但我在科技互聯(lián)網(wǎng)領域20多年,深知這是新技術發(fā)展的必經(jīng)過程。初期會有沖突和矛盾,但法律法規(guī)也在逐步完善、調(diào)整,只是會有一定滯后性。隨著問題的解決,新技術將使得全社會受益。

04

破局之道:法律加鹽,技術加糖

那么該如何解決AIGC的版權問題呢?

最重要的一定是制定清晰的法律法規(guī),明確界定哪些數(shù)據(jù)可用于AI模型訓練,以及AIGC生成內(nèi)容的版權歸屬、創(chuàng)造性歸屬和使用權限。法律應該考慮到AI生成內(nèi)容的特殊性質,確保創(chuàng)作者和使用者的權益得到保護。

目前,由國家互聯(lián)網(wǎng)信息辦公室等七部門聯(lián)合發(fā)布的《生成式人工智能服務管理暫行辦法》中指出,生成式人工智能服務提供者應當按照《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》對圖片、視頻等生成內(nèi)容進行標識。

也就是說,通過AI生成的內(nèi)容應當有一定的標識,使得用戶能夠辨別自己的「AI作品」是否運用了別人產(chǎn)出的圖片、視頻等內(nèi)容,避免濫用。這在很大程度能保護知識產(chǎn)權。

此外,AIGC技術平臺方應當不斷提高AI能力,使得創(chuàng)作出的內(nèi)容具備足夠的獨特性,并在AI生成內(nèi)容之前或之后進行一定的人工監(jiān)督和篩選,以確保生成的內(nèi)容符合法律法規(guī)和道德標準。

當然,如果想要對版權方更加有利,那么就需要相關部門建立一套新的行業(yè)規(guī)范和流程,使得版權方一開始就能夠知情,作品會被AI模型去學習,同時模型產(chǎn)生的后續(xù)基于自身作品的新創(chuàng)作,版權方同樣能夠從中獲利。

所以,解決這個問題,首先要制定清晰的法律,告訴AI:「這些可以吃,那些不行!」同時,AIGC平臺也要提高自己,不僅要生成高質量的內(nèi)容,還要保證內(nèi)容的原創(chuàng)性。不然的話,AI生成的東西很容易變成「山寨貨」。

05

AI未來:創(chuàng)新與共贏

相關報告預測,作為全球人工智能大模型市場的重要參與者——中國大模型產(chǎn)業(yè)市場規(guī)模2023年可達到147億元人民幣,并在2028年達到1179億元人民幣。

技術發(fā)展的速度很快,所以經(jīng)常會出現(xiàn)法律不適用、經(jīng)濟秩序受影響的情況,我們發(fā)現(xiàn)問題、提出問題都能夠一定程度上促進行業(yè)的發(fā)展。

國家政策也在進一步鼓勵生成式人工智能技術在各行業(yè)、各領域的創(chuàng)新應用,支持各類組織在生成式人工智能技術創(chuàng)新、數(shù)據(jù)資源建設、轉化應用、風險防范等方面開展協(xié)作,推動生成式人工智能基礎設施和公共訓練數(shù)據(jù)資源平臺建設。

相信未來隨著監(jiān)管和利益機制的完善,AIGC平臺、用戶、相關從業(yè)者可以謀求共生共榮。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2023-08-25
劉興亮 |AI生成,侵權橫行?
劉興亮|AI生成,侵權橫行?

長按掃碼 閱讀全文