毫無疑問,人工智能在2023年掀起了波瀾。下面我們將重點(diǎn)介紹今年最有影響力的一些新聞,它們注定會(huì)塑造這個(gè)顛覆性行業(yè)的未來:
人工智能的進(jìn)步
在今年的人工智能進(jìn)步景象中,有值得注意的進(jìn)展,已經(jīng)提煉出現(xiàn)有的技術(shù),而不是引入像前一年的ChatGPT或者圖片生成器那樣的突破創(chuàng)新。雖然沒有什么驚艷的效果,真正的通用人工智能(AGI)還很遙遠(yuǎn),但今年標(biāo)志著早期突破與更強(qiáng)大力量到來之間的中間階段。為了展示這種演變,我們制作了一個(gè)視覺時(shí)間線,突出今年最顯著的人工智能發(fā)展:
圖像生成
Adobe Firefly:Adobe的Firefly和Generative Fill賦能了多樣化的視覺內(nèi)容創(chuàng)造,包括插圖、藝術(shù)概念和照片處理。Adobe Firefly被整合到Photoshop中,使眾多用戶能夠一次性享受到AI的力量。文本效果特性的發(fā)布也算是一大進(jìn)步,它讓用戶可以將樣式或者紋理應(yīng)用到單詞和短語(yǔ)上。
Midjourney:Midjourney的V.5模型在圖像生成中設(shè)置了一個(gè)里程碑,展示了提高的效率,連貫性,和更高的分辨率。最新的alpha版本Midjourney V.6帶來了其他的優(yōu)化,比如更精確的提示跟蹤,增加的模型知識(shí),以及少量的文字繪圖能力。
DALL·E 3:基于ChatGPT構(gòu)建的DALL·E 3簡(jiǎn)化了圖像生成,消除了復(fù)雜的提示工程的需要。此外,ChatGPT引入了一個(gè)能夠幫助用戶根據(jù)反饋優(yōu)化升級(jí)圖像的特性。
Shutterstock.AI:這個(gè)圖片庫(kù)巨頭集成了人工智能功能,讓用戶能將提示變成可授權(quán)的圖象。Shutterstock走在了合理的AI應(yīng)用的最前沿,它辨識(shí)并且獎(jiǎng)勵(lì)了貢獻(xiàn)者。
視頻生成
Stability AI:Stability AI引入了Stable Video Diffusion,這是一種用于生成視頻的突破性模型,并在GitHub上開放了源代碼。借鑒AI圖像生成的趨勢(shì),Stable Video Diffusion模型很可能會(huì)在生成大部分AI視頻的過程中發(fā)揮關(guān)鍵作用。
HeyGen:AI初創(chuàng)公司發(fā)布了一個(gè)用于視頻中的語(yǔ)音克隆、嘴唇調(diào)整和語(yǔ)言翻譯的工具。
Runway Gen-2:Runway發(fā)布了Gen-2模型,使用戶可以只用文本提示、圖片,或者其它視頻,就能毫不費(fèi)力地生成全新的視頻。下面就是一個(gè)例子。
Pika和Pika 1.0:在初始版本發(fā)布之后,Pika獲得了五十萬用戶,每周生成數(shù)百萬視頻。然后升級(jí)的AI模型Pika 1.0賦能了用戶以各種風(fēng)格創(chuàng)建和編輯視頻,包括3D動(dòng)畫、日本動(dòng)漫、卡通、和電影畫面。
Codec avatars by Meta:Meta的Pixel Codec Avatars (PiCA)模型使我們離視覺感真實(shí)的遠(yuǎn)程存在更近一步。
文本生成
Bard和Gemini:谷歌的"Bard"賦予了聊天機(jī)器人一種像人一樣的情感和情緒。雙子星是在Bard聊天機(jī)器人中引入并且在多模態(tài)數(shù)據(jù)集上進(jìn)行訓(xùn)練的,谷歌稱其為“最有能力的”AI模型,也是OpenAI的ChatGPT的最接近的競(jìng)爭(zhēng)對(duì)手。
Grok:艾隆·馬斯克的創(chuàng)業(yè)公司xAI發(fā)布了“Grok”——一款擁有幽默感、反叛精神和通過X平臺(tái)實(shí)時(shí)獲取知識(shí)的聊天機(jī)器人,以此顯示出其對(duì)AI發(fā)展的承諾,可能會(huì)與OpenAI競(jìng)爭(zhēng)。xAI承諾格洛克設(shè)計(jì)用來回答其他AI系統(tǒng)拒絕的挑釁性問題。
OverflowAI:Stack Overflow的OverflowAI增強(qiáng)了知識(shí)策展的功能,啟用了AI驅(qū)動(dòng)的答案搜索,適用于Visual Studio代碼和Slack。
Lama 2:Meta發(fā)布了Lama 2,它的下一代開源的大型語(yǔ)言模型,展示出了增強(qiáng)的效率。Meta優(yōu)化過的LLM也適用于對(duì)話用例,而且在大多數(shù)基準(zhǔn)測(cè)試中勝出其他開源模型。
GPT-4:OpenAI的GPT-4現(xiàn)在可以處理圖像輸入,生成標(biāo)題,分類,聽取并在對(duì)話中進(jìn)行應(yīng)答,支持實(shí)時(shí)網(wǎng)頁(yè)瀏覽。OpenAI也擴(kuò)展了對(duì)插件的支持,從而使得開源競(jìng)爭(zhēng)者豐富的平臺(tái)景觀。GPT-4是OpenAI開發(fā)AGI路程的下一步。
Mistral 7B:今年估值約達(dá)20億美元的Mistral AI發(fā)布了Mistral 7B,這是一款大型語(yǔ)言模型,挑戰(zhàn)GPT-4和Claude 2。為了重申開放科技的路線,Mistral AI提供其模型免費(fèi)下載。
Mixtral 8x7B:Mistral AI也推出了Mixtral 8x7B,這是一款質(zhì)量上乘的稀疏混合專家模型(SMoE),含有公開的權(quán)重,總共有467億個(gè)參數(shù),這在增強(qiáng)真實(shí)度和減少偏見的模型中具有開創(chuàng)性。
Yi-34B llm:今年估值達(dá)10億美元的李開復(fù)的創(chuàng)業(yè)公司01.AI發(fā)布了Yi-34B——一款比具有明顯更高參數(shù)計(jì)數(shù)的競(jìng)爭(zhēng)模型表現(xiàn)更好的開源神經(jīng)網(wǎng)絡(luò),強(qiáng)調(diào)其成本效率。
其它進(jìn)步:
裁剪任何模型(SAM):Meta AI展示了SAM,這是一個(gè)"剪切"圖像中物體的裁剪模型,強(qiáng)調(diào)其適應(yīng)性,不需要額外的訓(xùn)練。SAM在大數(shù)據(jù)集上進(jìn)行訓(xùn)練,顯示出在對(duì)象分割中的強(qiáng)大表現(xiàn)。
直接偏好優(yōu)化(DPO):DPO成為對(duì)大規(guī)模無監(jiān)督語(yǔ)言模型進(jìn)行微調(diào)和教授文本到圖像模型的穩(wěn)定和高效的方法,實(shí)現(xiàn)了精確定制,無需復(fù)雜的人工反饋強(qiáng)化學(xué)習(xí)(RLHF)。
Zephyr直接餾分的LM對(duì)齊:由直接餾分偏好優(yōu)化(dDPO)制成的Zephyr-7B成為了帶有70億參數(shù)聊天模型的基準(zhǔn),增強(qiáng)了意圖對(duì)齊而無需大量訓(xùn)練。
自主AI代理:自主AI代理作為一個(gè)值得注意的趨勢(shì),展示了一個(gè)向高級(jí)和自主AI系統(tǒng)轉(zhuǎn)變的變革性轉(zhuǎn)變。AI代理被視為AGI的第一眼,因?yàn)樗麄兛梢曰谟脩舻哪繕?biāo)生成自我引導(dǎo)的任務(wù)和指令,并且在達(dá)成目標(biāo)之前自行工作。
EvoDiff:微軟的EvoDiff,這是一個(gè)用于快速和節(jié)省成本的蛋白質(zhì)生成的開源AI框架,承諾在治療和工業(yè)應(yīng)用上有所突破。
穩(wěn)定音頻:Stability AI發(fā)布了一個(gè)從簡(jiǎn)單文本提示生成短小高質(zhì)量音頻剪輯的工具。
GPT商店,版權(quán)保護(hù)盾,ChatGPT機(jī)器人構(gòu)造器:OpenAI推出了GPT商店以出售自定義的GPT機(jī)器人,版權(quán)保護(hù)盾來抵擋與版權(quán)侵權(quán)索賠有關(guān)的法律成本,以及一個(gè)用于自定義ChatGPT版本的無代碼平臺(tái)。
Stability AI開源其LLM:Stability AI已經(jīng)開源了其模型,StableLM-Alpha和Stable Vicuna,它們因在生成文本和代碼方面的出色表現(xiàn)而聞名。Stable Vicuna是第一個(gè)使用人工反饋強(qiáng)化學(xué)習(xí)(RLHF)訓(xùn)練的開源聊天機(jī)器人。此外,Stability AI還揭示了SDXL Turbo,這是一個(gè)實(shí)時(shí)的文本到圖像生成模型。
合作
在動(dòng)態(tài)的2023年,業(yè)界領(lǐng)袖之間有重大合作出現(xiàn),塑造了未來的軌跡。以下是定義了今年AI風(fēng)貌的頂級(jí)合并和合作:
Stability AI 和 Init ML
Stability AI進(jìn)行了一項(xiàng)重大動(dòng)作,收購(gòu)了熱門編輯應(yīng)用ClipDrop背后的Init ML。目標(biāo)明確:將Stability AI的先進(jìn)技術(shù)融入到ClipDrop的生態(tài)系統(tǒng)中。合作已經(jīng)帶來了SDXL Turbo的開發(fā)。
Runway 和 Getty Images
Runway與Getty Images達(dá)成了策略性合作,推出了新的視頻生成模型RGM(Runway和Getty Images模型)。該模型將Runway的AI能力與Getty Images的授權(quán)創(chuàng)作內(nèi)容庫(kù)結(jié)合在一起。合作旨在革新內(nèi)容創(chuàng)建工作流,使公司能夠生成高質(zhì)量,定制的符合品牌身份的視頻。
Snowflake 和 Neeva
數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)的巨頭Snowflake收購(gòu)了Neeva,這是一個(gè)以使用生成AI來增強(qiáng)搜索體驗(yàn)而知名的初創(chuàng)公司。Neeva最近關(guān)閉了其訂閱為基礎(chǔ)的、無廣告的搜索引擎。Neeva的創(chuàng)辦者們也承認(rèn),說服用戶嘗試一個(gè)新的搜索引擎是一項(xiàng)挑戰(zhàn)。
Shutterstock和OpenAI
Shutterstock和OpenAI承諾進(jìn)行為期六年的長(zhǎng)期合作。OpenAI獲取了來自Shutterstock的高質(zhì)量數(shù)據(jù),用各種圖像,視頻和音樂庫(kù)豐富其模型訓(xùn)練數(shù)據(jù)集。Shutterstock繼續(xù)利用OpenAI的技術(shù),推出了Shutterstock的AI圖像生成工具。
法律環(huán)境
在不斷發(fā)展的AI的法律領(lǐng)域,2023年頑固于一片充滿不確定性和持續(xù)辯論的環(huán)境。隨著新挑戰(zhàn)的出現(xiàn),有關(guān)版權(quán)、公司政策和更廣闊的監(jiān)管框架的討論繼續(xù),塑造著AI的法律環(huán)境的輪廓。以下是2023年最重要的法律問題:
歐洲AI法案
歐盟推出了世界上第一個(gè)全面的AI法案,對(duì)AI的使用進(jìn)行規(guī)范。該法案根據(jù)AI系統(tǒng)所帶來的風(fēng)險(xiǎn)進(jìn)行分類,并相應(yīng)地制定規(guī)定。雖然AI法案已經(jīng)得到了暫時(shí)的同意,但其實(shí)施面臨延期,執(zhí)行工作將在2025年開始。
美國(guó)版權(quán)局對(duì)AI生成內(nèi)容的注冊(cè)立場(chǎng)
美國(guó)版權(quán)局堅(jiān)決拒絕了AI算法Midjourney創(chuàng)作的圖像的版權(quán)注冊(cè)申請(qǐng)。該拒絕為未來設(shè)定了一個(gè)先例,即僅由AI創(chuàng)作且無人參與的AI藝術(shù)作品不符合版權(quán)保護(hù)的要求。與此同時(shí),美國(guó)版權(quán)局就AI輔助作品發(fā)出了指導(dǎo)意見,明確了使用AI工具的人類創(chuàng)作的作品可能符合版權(quán)保護(hù)的要求。該指導(dǎo)意見確認(rèn)了使用AI工具的人類創(chuàng)作的作品應(yīng)根據(jù)人類在這些作品的創(chuàng)作過程中的角色是否具有決定性進(jìn)行評(píng)估。
"在當(dāng)前的法律體系下,未準(zhǔn)備好承認(rèn)AI創(chuàng)作的作品的版權(quán),因?yàn)锳I是從屬于其他人的現(xiàn)有數(shù)據(jù)中學(xué)習(xí)的,這挑戰(zhàn)了所有權(quán)的歸屬。解決這個(gè)問題的做法預(yù)計(jì)將在明年通過國(guó)家進(jìn)行的調(diào)查中得以開展,需要公眾的參與?,F(xiàn)在獨(dú)立解決這個(gè)問題已經(jīng)很困難,需要有更廣泛的公眾參與。”
Everypixel公司的企業(yè)律師Daria Kuznetsova說。
麥肯錫還發(fā)布了一個(gè)全面的圖表,捕捉到了2023年與AI治理相關(guān)的政策和法規(guī)努力的最重要的方面。視覺呈現(xiàn)突顯了2023年在塑造AI的法律格局方面的重要貢獻(xiàn)。
爭(zhēng)議
2023年充滿了引人入勝的爭(zhēng)議和討論,對(duì)AI領(lǐng)域的不確定性和發(fā)展規(guī)則進(jìn)行了深入探討。隨著行業(yè)的發(fā)展,這些爭(zhēng)議變得不可避免,預(yù)示著更多的富有啟發(fā)性的對(duì)話和挑戰(zhàn)在地平線上。以下是一些定義了這一年的最值得注意的爭(zhēng)議:
對(duì)ChatGPT的公司限制
包括摩根大通、花旗集團(tuán)、美國(guó)銀行、德意志銀行、高盛和富國(guó)銀行等主要金融機(jī)構(gòu)已經(jīng)限制了ChatGPT的使用,因?yàn)樗麄儗?duì)安全和隱私問題感到擔(dān)憂。這反映了一個(gè)更廣泛的趨勢(shì),即公司正在向員工發(fā)出警告,關(guān)于在企業(yè)環(huán)境中應(yīng)用AI的法律考慮問題。
OpenAI使用低工資工人
《時(shí)代》雜志的調(diào)查揭露了OpenAI與Sama的合作,雇用肯尼亞的低工資工人為ChatGPT篩選敏感內(nèi)容。這一發(fā)現(xiàn)引發(fā)了有關(guān)對(duì)待工人的方式和內(nèi)容審查對(duì)心理健康影響的倫理問題。
OpenAI的領(lǐng)導(dǎo)層更迭
上個(gè)月,薩姆·奧爾特曼的離職和快速回歸成為了頭條新聞。OpenAI經(jīng)歷了一次領(lǐng)導(dǎo)層的變更,因?yàn)樗_姆·奧爾特曼在與董事會(huì)溝通不一致的情況下辭職。臨時(shí)CEO米拉·穆拉蒂以及大部分的員工支持奧爾特曼的回歸。這個(gè)前所未有的情況吸引了廣泛的關(guān)注,留下了關(guān)于更迭背后的真正原因和未來影響的問題。
Adobe和Figma
Adobe對(duì)Figma的200億美元收購(gòu)計(jì)劃遇到了監(jiān)管障礙,引發(fā)了歐盟委員會(huì)和英國(guó)競(jìng)爭(zhēng)和市場(chǎng)管理局對(duì)可能存在的反壟斷問題進(jìn)行的調(diào)查。提議的交易影響也超出了設(shè)計(jì)考慮,因?yàn)锳dobe在客戶數(shù)據(jù)平臺(tái)上的主導(dǎo)地位使首席信息官對(duì)其在云軟件開支上的潛在影響感到擔(dān)憂。然而,由于在歐洲和英國(guó)獲得反壟斷審批的挑戰(zhàn),Adobe放棄了交易,導(dǎo)致了向Figma支付了10億美元的終止費(fèi)。
攝影師黑客攻擊世界攝影大獎(jiǎng)
攝影師Boris Eldagsen在索尼世界攝影大獎(jiǎng)中提交了AI生成的藝術(shù)作品,引發(fā)了混亂。Eldagsen拒絕接受獎(jiǎng)項(xiàng)引發(fā)了對(duì)AI生成圖片在傳統(tǒng)攝影比賽中的位置的辯論,挑戰(zhàn)了人們對(duì)真實(shí)性和創(chuàng)造性的看法。
本文譯自 everypixel,由 超載雞 編輯發(fā)布。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )