OpenAI是一家以追求通用人工智能為目標(biāo)的研究機(jī)構(gòu),為AI研究和社區(qū)提供了一系列高性能的研究成果和開源模型。其使命在于構(gòu)建出高度自主并在大多數(shù)工作崗位上達(dá)到或者超過人類的表現(xiàn),為人類提供安全、共贏的人工智能系統(tǒng)。
但純粹的研究理想也需要負(fù)擔(dān)龐大的科研開銷,為了平衡使命和現(xiàn)實(shí),OpenAI開始嘗試將研發(fā)出的高性能算法GPT-3構(gòu)建成API以實(shí)現(xiàn)商業(yè)化,以反哺消耗巨大的研究,同時(shí)促進(jìn)算法和研究的進(jìn)一步迭代改進(jìn)。
基于這一強(qiáng)大的自然語言模型,OpenAI發(fā)布了一款通用的文本處理接口,與先前為特定目標(biāo)設(shè)計(jì)的AI系統(tǒng)不同的是,此API可以允許用戶任務(wù)嘗試任意英文語言任務(wù)。研究人員和開發(fā)者可以利用它構(gòu)建更為優(yōu)秀的產(chǎn)品或者更具智能化水平的應(yīng)用,同時(shí)還能為探索這一技術(shù)的優(yōu)點(diǎn)和局限做出貢獻(xiàn)。目前已經(jīng)有十多個(gè)公司利用這一API在語義搜索、聊天機(jī)器人、客戶服務(wù)、文本生成、生產(chǎn)力工具和內(nèi)容補(bǔ)全等方面開發(fā)了一系列有效的產(chǎn)品。
在強(qiáng)大的語言模型下,API可以實(shí)現(xiàn)對于輸入文本信息模式的有效學(xué)習(xí)和處理。用戶可以用少數(shù)幾個(gè)樣本對模型進(jìn)行“編程”,使它按照你的方式來回答問題。下圖中顯示了調(diào)用API的一個(gè)樣例,可以看到在提供了一個(gè)問答樣本后(紅框中),模型可以根據(jù)問答樣例的語言模式回答新的問題(藍(lán)色)。模型不僅可以實(shí)現(xiàn)問答任務(wù),還顯示出了其中已經(jīng)涵蓋了非常豐富的語料和知識信息。
用戶可以按照這種方式對模型進(jìn)行定制化的打磨,一方面通過數(shù)據(jù)集(大數(shù)據(jù)或者是少量數(shù)據(jù))對模型進(jìn)行調(diào)優(yōu)訓(xùn)練,另一方面也可以通過人機(jī)交互的反饋來對模型的輸出進(jìn)行改進(jìn)。
此API同時(shí)兼顧了易用性和靈活性,一方面可以讓任何人都有接入最前沿人工智能技術(shù)的簡單方式,同時(shí)也為研究人員提供了增加生產(chǎn)力的靈活方式,使得團(tuán)隊(duì)可以集中精力處理機(jī)器學(xué)習(xí)的核心問題。目前支持該API的是最新的GPT-3模型,GPT-3是OpenAI最近發(fā)布的非常強(qiáng)大的自然語言處理模型,完整模型包含了175 billion的參數(shù)。下表顯示了GPT-3相關(guān)模型的架構(gòu)和參數(shù)量。
機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展一日千里,所以背后所支撐的處理流程和模型也在不斷迭代和更新。下面幾個(gè)小視頻展示了如何應(yīng)用這一API到用戶的日常工作生活中,以此來解決問題并提高生產(chǎn)力。
針對電子表格的制作,Tabulate插件提供了結(jié)構(gòu)化的表格生成方案。用戶僅僅需要輸入想要制表的主體,模型就能生成比較理想的表頭。在少量的修改后,選擇填充表格模型就能從已有知識中填充出內(nèi)容。這一例子中顯示了公司名稱、代碼和上市的年份。為了聚焦互聯(lián)網(wǎng)公司,只需要輸入兩個(gè)互聯(lián)網(wǎng)公司的名字,模型就能找到相關(guān)內(nèi)內(nèi)容進(jìn)行填充,還能按照創(chuàng)立年份排序。此外還能夠從非結(jié)構(gòu)文本中對文本信息進(jìn)行結(jié)構(gòu)化填充!突然感覺以后不用做excel了
第二個(gè)例子是利用模型對網(wǎng)頁內(nèi)容進(jìn)行語義搜索。比如你打開了一個(gè)wiki百科頁面來尋找答案,現(xiàn)在再也不需要一字一句讀完整篇文章了,只需要利用網(wǎng)頁插件輸出你想要問的問題,模型就能根據(jù)語義搜索到頁面中對應(yīng)的段落,不僅解答了你的疑問還能對文本位置進(jìn)行定位,大幅度地提高了資料檢索的效率。
下面的例子完整地展示了如何構(gòu)建個(gè)性化的應(yīng)用,通過簡單的linux指令和對應(yīng)含義的描述,就能構(gòu)建出一條語義操作模型。直接輸出各種口語化表達(dá)模型,就能生成對應(yīng)的命令和命令組合來實(shí)現(xiàn)你想要的結(jié)果。這個(gè)例子中,我們看到了API將人機(jī)交互簡化到了何種程度,極大地減少了初學(xué)者的學(xué)習(xí)成本、提高了使用者的利用效率,看來用自然語言和計(jì)算機(jī)交互的時(shí)代已經(jīng)非常近了。
但技術(shù)的進(jìn)步是一把雙刃劍,在大規(guī)模應(yīng)用的同時(shí)也需要避免惡意使用。API在源頭已經(jīng)切斷了一系列明顯的惡意應(yīng)用,包括騷擾、垃圾郵件、激進(jìn)言論和病毒營銷等,但想要窮盡所有可能的惡意應(yīng)用是不可能的,除了產(chǎn)品開發(fā)者的把控,更需要社區(qū)的努力。開發(fā)者可以探索控制API返回惡意內(nèi)容的工具,研究人員需要在語言模型的安全方面進(jìn)行更加深入的研究(包括對于有害偏見的分析檢測、緩和與阻斷等等)。
123下一頁>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )