零一萬(wàn)物:新增API開(kāi)放平臺(tái) 加速大模型應(yīng)用落地

2023被稱為大模型元年,2024則是大模型的應(yīng)用元年,如何用大模型構(gòu)建一個(gè)智能對(duì)話助手,如何將大模型整合進(jìn)工作流,如何用大模型構(gòu)建超長(zhǎng)上下文知識(shí)庫(kù)?這些問(wèn)題都亟待模型公司回答。

3月14日,大模型公司零一萬(wàn)物發(fā)布Yi大模型API開(kāi)放平臺(tái),提供三款模型,可用于識(shí)別圖片中存在的表格、文字,并進(jìn)行深層次的問(wèn)答,也可基于超長(zhǎng)上下文模型構(gòu)建知識(shí)庫(kù)問(wèn)答,用于客服、培訓(xùn)等特定知識(shí)的問(wèn)答場(chǎng)景,分別是:

1)Yi-34B-Chat-0205:支持通用聊天、問(wèn)答、對(duì)話、寫(xiě)作、翻譯等功能。

2)Yi-34B-Chat-200K:200K上下文,多文檔閱讀理解、超長(zhǎng)知識(shí)庫(kù)構(gòu)建小能手。

3)Yi-VL-Plus: 多模態(tài)模型,支持文本、視覺(jué)多模態(tài)輸入,中文圖表體驗(yàn)超過(guò)GPT-4V。

零一萬(wàn)物是我國(guó)大模型獨(dú)角獸之一,成立于2023年3月,李開(kāi)復(fù)博士為創(chuàng)始人兼CEO。2023年11月6日,零一萬(wàn)物發(fā)布了首款開(kāi)源中英雙語(yǔ)大模型“Yi”。

1、支持30萬(wàn)漢字輸入,快速構(gòu)建知識(shí)庫(kù)

大模型正在加速進(jìn)入長(zhǎng)文本時(shí)代。本次零一萬(wàn)物發(fā)布的Yi-34B-Chat-200K模型,支持處理約30萬(wàn)個(gè)中英文字符,適合用于多篇文檔內(nèi)容理解、海量數(shù)據(jù)分析挖掘和跨領(lǐng)域知識(shí)融合。

比如,Yi-34B-Chat-200K對(duì)經(jīng)典文學(xué)作品《呼嘯山莊》進(jìn)行復(fù)雜角色和角色關(guān)系的歸納總結(jié)。該小說(shuō)篇幅龐大(中文字?jǐn)?shù)約30萬(wàn)字),且人物關(guān)系錯(cuò)綜復(fù)雜,Yi-34B-Chat-200K仍能精準(zhǔn)地梳理和總結(jié)出人物之間的關(guān)系,理解并分析復(fù)雜的文本結(jié)構(gòu)。

2、中文圖表體驗(yàn)超過(guò)GPT-4V

本次開(kāi)放的多模態(tài)模型Yi-VL-Plus,可支持文本、視覺(jué)多模態(tài)輸入,面向?qū)嶋H應(yīng)用場(chǎng)景大幅增強(qiáng):

1)增強(qiáng)Charts、Table、Inforgraphics、Screenshot識(shí)別能力,支持復(fù)雜圖表理解、信息提取、問(wèn)答以及推理。中文圖表體驗(yàn)超過(guò)GPT4V。

2)在Yi-VL基礎(chǔ)上進(jìn)一步提高了圖片分辨率,模型支持1024*1024分辨率輸入,顯著提高生產(chǎn)力場(chǎng)景中的文字、數(shù)字OCR的準(zhǔn)確性。

3)保持了LLM通用語(yǔ)言、知識(shí)、推理、指令跟隨等能力。

比如,在中文圖表識(shí)別功能評(píng)測(cè)中,Yi-VL-Plus模型能準(zhǔn)確識(shí)別圖表對(duì)應(yīng)數(shù)據(jù),而GPT-4V則識(shí)別錯(cuò)3處數(shù)據(jù)。

Yi-VL-Plus模型在一些中文圖表理解場(chǎng)景,比GPT-4V準(zhǔn)確率更高

長(zhǎng)文本+多模態(tài),能夠理解并分析復(fù)雜論文與專業(yè)學(xué)科知識(shí)。

以上功能,不僅可以幫助消費(fèi)者快速構(gòu)建智能對(duì)話助手,還可以基于超長(zhǎng)上下文模型構(gòu)建知識(shí)庫(kù)問(wèn)答,用于客服、培訓(xùn)等特定知識(shí)的問(wèn)答場(chǎng)景,金融分析師可以用它快速閱讀報(bào)告并預(yù)測(cè)市場(chǎng)趨勢(shì)、律師可以用它精準(zhǔn)解讀法律條文、科研人員可以用它高效提取論文要點(diǎn)、文學(xué)愛(ài)好者可以用它快速掌握作品精髓等,應(yīng)用場(chǎng)景廣泛。

同時(shí),Yi大模型API與 OpenAI API完全兼容,只需修改少量代碼,可以平滑遷移。

零一萬(wàn)物透露,近期將為開(kāi)發(fā)者提供更多更強(qiáng)模型和AI開(kāi)發(fā)框,包括:

1)推出一系列的模型API,覆蓋更大的參數(shù)量、更強(qiáng)的多模態(tài),更專業(yè)的代碼/數(shù)學(xué)推理模型等。

2)突破更長(zhǎng)的上下文,目標(biāo)100萬(wàn)tokens;支持更快的推理速度,顯著降低推理成本。

3)基于超長(zhǎng)上下文能力,構(gòu)建向量數(shù)據(jù)庫(kù)、RAG、Agent架構(gòu)在內(nèi)的全新開(kāi)發(fā)者AI框架。旨在提供更加豐富和靈活的開(kāi)發(fā)工具,以適應(yīng)多樣化的應(yīng)用場(chǎng)景。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-03-14
零一萬(wàn)物:新增API開(kāi)放平臺(tái) 加速大模型應(yīng)用落地
如何用大模型構(gòu)建一個(gè)智能對(duì)話助手,如何將大模型整合進(jìn)工作流,如何用大模型構(gòu)建超長(zhǎng)上下文知識(shí)庫(kù)?

長(zhǎng)按掃碼 閱讀全文