2018在线av中文字幕,亚洲AV乱码一区二区三区林ゆな

開源AI并不透明？開源倡議組織給出新的定義

人閱讀

2024-08-27 15:59:20

相關(guān)關(guān)鍵詞

極客網(wǎng)·人工智能8月27日 長期以來，研究人員對(duì)開源人工智能（Open-source AI）的定義一直存在分歧。近期，自詡為開源仲裁者的開源倡議組織(OSI)日前發(fā)布開源AI的新定義，希望能幫助立法者制定法規(guī)，保護(hù)消費(fèi)者免受AI風(fēng)險(xiǎn)的影響。

OSI邀請(qǐng)了70名研究人員、律師、政策制定者、活動(dòng)家以及Meta、谷歌和亞馬遜等大型科技公司的代表，共同為開源AI提可行的定義。

OSI聲稱，“一個(gè)開源AI系統(tǒng)可以用于任何目的，而無需獲得許可，且研究人員應(yīng)該能夠檢查該AI系統(tǒng)的組件并研究其工作原理。同時(shí)，研究人員還可以出于任何目的修改系統(tǒng)，包括更改其輸出，并與他人共享，用于任何目的?！贝送?，該標(biāo)準(zhǔn)還試圖為給定模型的訓(xùn)練數(shù)據(jù)、源代碼和權(quán)重定義一個(gè)透明度級(jí)別。”

按此標(biāo)準(zhǔn)，OpenAI和Anthropic對(duì)它們的模型、數(shù)據(jù)集和算法保密，使它們成為明顯的AI閉源系統(tǒng)。同時(shí)，Meta Llama和谷歌的免費(fèi)訪問模型也不是真正的開源AI模型，因?yàn)樵S可證限制了用戶對(duì)模型的使用，而且訓(xùn)練數(shù)據(jù)集也沒有公開。

AI模型構(gòu)建和共享平臺(tái)Hugging Face的應(yīng)用政策研究員Avijit Ghosh說，“眾所周知，企業(yè)在推廣營銷他們的模型時(shí)會(huì)濫用這個(gè)術(shù)語?！彼硎荆瑢⒛Ｐ兔枋鰹殚_源可能會(huì)使它們被認(rèn)為更值得信賴，即使研究人員無法獨(dú)立調(diào)查它們是否真的開源。

Mozilla高級(jí)顧問、OSI進(jìn)程的參與者Ayah Bdeir表示，開源定義的某些部分相對(duì)容易達(dá)成一致，包括需要揭示模型權(quán)重(幫助確定AI模型如何產(chǎn)生輸出的參數(shù))。審議的其他部分爭議更大，尤其是訓(xùn)練數(shù)據(jù)應(yīng)該如何公開的問題。

訓(xùn)練數(shù)據(jù)的來源缺乏透明度，導(dǎo)致大型AI公司遭到大量訴訟。從OpenAI等大型語言模型提供商到Suno等音樂生成器，這些公司除了表示它們包含“可公開訪問的信息”之外，沒有透露太多關(guān)于訓(xùn)練集的信息。

一些開源支持者認(rèn)為開源模型應(yīng)該公開他們所有的訓(xùn)練集。Bdeir表示，由于版權(quán)和數(shù)據(jù)所有權(quán)等問題，這一標(biāo)準(zhǔn)很難執(zhí)行。

最終，OSI主導(dǎo)的新的定義要求開源模型提供有關(guān)訓(xùn)練數(shù)據(jù)的信息，以達(dá)到“熟練人員可以使用相同或類似的數(shù)據(jù)重新創(chuàng)建實(shí)質(zhì)上等同的系統(tǒng)”的程度。雖然這并不是一個(gè)全面共享所有訓(xùn)練數(shù)據(jù)集的籠統(tǒng)要求，但它也比當(dāng)今許多專有模型甚至表面上的開源模型更進(jìn)一步。

Bdeir說：“堅(jiān)持一種在意識(shí)形態(tài)上原始的金本位制，而實(shí)際上這種制度任何人都無法有效實(shí)現(xiàn)，最終會(huì)適得其反?！彼a(bǔ)充說，OSI正在計(jì)劃制定某種執(zhí)行機(jī)制，該機(jī)制將標(biāo)記那些被描述為開源但不符合其定義的模型。

該組織還計(jì)劃發(fā)布一份符合新定義的AI模型清單。雖然沒有得到證實(shí)，但Bdeir預(yù)計(jì)，一些規(guī)模相對(duì)較小的模型將會(huì)出現(xiàn)在名單上，包括Eleuther的Pythia、Ai2的OLMo，以及開源團(tuán)體LLM360的模型。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）