Anthropic大模型實力全面超越GPT-4 亞馬遜云科技露鋒芒

3月5日消息,OpenAI最強競對Anthropic發(fā)布Claude 3系列模型,已經(jīng)實現(xiàn)了對GPT-4的全面超越。

Anthropic是由前OpenAI員工創(chuàng)立的公司,在過去一年獲得了來自亞馬遜40億美元的投資。

此次,Anthropic宣布推出Claude 3模型系列,該系列包括三個模型,按能力升序排列依次是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。

從Anthropic公布的測試數(shù)據(jù)看,其最高能力模型Claude 3 Opus的能力已經(jīng)全面碾壓GPT-4。

如Anthropic所說,Claude 3模型將設(shè)定新的行業(yè)基準(zhǔn)!

目前,Claude 3 Opus和Sonnet已可以在Claude.ai和Claude API中使用。Sonnet正在Claude.ai上提供免費體驗,Claude Pro用戶則可以使用Opus。目前,Claude 3 Sonnet已可在159個國家可用,而Claude 3 Haiku很快將會上市。

同時,今天起Claude 3 Sonnet也可以通過Amazon Bedrock,以及Google Cloud的Vertex AI Model Garden使用,Opus和Haiku很快就會在這兩個平臺同時推出。

如果說微軟通過綁定Open AI的GPT模型,在人工智能領(lǐng)域和亞馬遜、谷歌等大廠的競爭中一騎絕塵,那么,隨著全面碾壓GPT-4的Claude 3 Opus的出現(xiàn),在這場競爭中亞馬遜也將吹起全面反擊的號角。

現(xiàn)在壓力給到微軟和Open AI,在馬斯克的訴訟中,GPT-5何時發(fā)布?而Anthropic和Open AI的那些恩怨情仇還將繼續(xù)上演……

Claude 3 Opus模型性能全面超越GPT-4

根據(jù)Anthropic公布的技術(shù)文檔,Opus是Claude 3 模型家族中最智能的模型,在人工智能系統(tǒng)的大多數(shù)常見評估基準(zhǔn)上都優(yōu)于GPT-4,包括本科生級專家知識(MMLU)、研究生級專家推理(GPQA)、基礎(chǔ)數(shù)學(xué)(GSM8K)等。它在復(fù)雜任務(wù)上表現(xiàn)出接近人類水平的理解力和流利性。

Claude 3模型在分析和預(yù)測、細(xì)致入微的內(nèi)容創(chuàng)建、代碼生成以及西班牙語、日語和法語等非英語語言的對話方面都顯示出更強的能力。

總之,就是在各項測試領(lǐng)域,Claude 3 Opus的性能都已超越GPT-4。

響應(yīng)速度方面,據(jù)介紹,Claude 3 Haiku是市場上速度最快、性價比最高的模型。它可以在不到三秒的時間內(nèi)閱讀(約10k token)的包含圖表和圖形信息和數(shù)據(jù)密集的研究論文,并給出分析反饋。

Anthropic表示正式發(fā)布后,預(yù)計Haiku性能將進(jìn)一步提高。

對于絕大多數(shù)工作負(fù)載,Sonnet比Claude 2和Claude 2.1快2倍,智能水平更高。它擅長于要求快速響應(yīng)的任務(wù),如知識檢索或銷售自動化。Opus提供了與Claude 2和2.1相似的速度,但具有更高的智能水平。

Claude 3模型可以處理各種視覺信息數(shù)據(jù),包括照片、圖片、圖表和技術(shù)圖表。

Anthropic稱,一些客戶的知識庫,高達(dá)50%是如PDF、流程圖或演示幻燈片以格式存儲的信息。Claude 3 Opus在圖表理解和多步推理上表現(xiàn)優(yōu)秀。

以例子來看,通過輸入一張來自皮尤研究中心圖表(如上)“年輕人比長輩更有可能使用互聯(lián)網(wǎng)”,然后詢問“G7國家的年輕人和老年人之間的平均差異百分比是多少?”

模型順利理解了G7概念,識別哪些國家是G7,并從輸入的圖表中檢索數(shù)據(jù)并使用這些值進(jìn)行數(shù)學(xué)運算。

另外,全新的Claude模型在減少“過度拒絕”,與Claude 2.1相比,Claude 3 Opus模型在具有挑戰(zhàn)性的開放式問題上的準(zhǔn)確性提高了兩倍,錯誤答案的水平也有所降低。

在長語境理解能力方面,Claude 3系列的3個模型,都至少支持20萬token的上下文窗口,都能處理超過100萬token的輸入。在200Ktoken的NIAH測試(大海撈針測試)中,Claude 3 Opus準(zhǔn)確率超過99%。

同時,Anthropic透露,計劃在未來幾個月內(nèi)頻繁發(fā)布Claude 3模型系列的更新。

和Open AI的恩怨情仇

Anthropic是由前OpenAI研究人員創(chuàng)立于2021年的一家人工智能企業(yè),總部位于舊金山。

Anthropic的兩位創(chuàng)始人Dario Amodei和Daniela Amodei(達(dá)里奧·阿莫代和丹妮拉·阿莫代)兄妹,此前都是OpenAI公司的員工,但由于與公司的發(fā)展方向有分歧而離開。

有外媒曾透露,他們之所以對該公司的發(fā)展方向產(chǎn)生了分歧而離開 OpenAI的其中一個原因是OpenAI 在 2019 年與微軟達(dá)成第一筆 10 億美元的交易后,越來越趨向商業(yè)化。

隨著ChatGPT的火爆,OpenAI、OpenAI CEO Sam Altman的知名度爆棚。事實上,Anthropic的創(chuàng)始人在人工智能圈也不是泛泛之輩。

美國《時代》雜志2023年公布的人工智能領(lǐng)域百大影響力人物中,達(dá)里奧·阿莫代、丹妮拉·阿莫代兄妹被評為“引領(lǐng)者” (Leaders)并列排在第一位,其后才是OpenAI 首席執(zhí)行官薩姆·奧特曼(Sam Altman)。


ChatGPT推出不久,2023年3月,Anthropic發(fā)布了首款類似于 ChatGPT的 AI 助手,名為“Claude”。 Anthropic被認(rèn)為是Open AI的最大競爭對手。

憑借這一光環(huán),Anthropic開啟了快速融資進(jìn)程:

2023年5月,Anthropic宣布獲得4.5億美元C輪融資,此輪融資由Spark Capital領(lǐng)投,谷歌、Salesforce Ventures、Sound Ventures、Zoom Ventures等參投;

同年8月份,韓國最大電信運營商SK電訊(SKT)表示向Anthropic追加投資1億美元;

似乎是秉持著“敵人的敵人是朋友”的態(tài)度,亞馬遜、谷歌對微軟投資的OpenAI的最大競爭對手Anthropic進(jìn)行了大力的財力支持。

2023年9月,亞馬遜宣布向Anthropic投資多達(dá)40億美元,以鞏固其在蓬勃發(fā)展的人工智能技術(shù)領(lǐng)域的地位。

同年12月,有消息稱谷歌對Anthropic的投資擴大到20億美元。

更有意思的還有,在去年OpenAI鬧“政變”期間,有外媒提到,OpenAI的董事會在11月份曾接觸Anthropic的CEO 達(dá)里奧·阿莫代(Dario Amodei),有意讓他取代薩姆·奧特曼(Sam Altman)成為OpenAI的CEO,并探討過兩家公司可能的合并。

但達(dá)里奧·阿莫代拒絕了這兩個提議。

亞馬遜云科技吹響反擊號角

伴隨Anthropic Claude 3系列模型的發(fā)布,亞馬遜云科技數(shù)據(jù)和機器學(xué)習(xí)副總裁Swami Sivasubramanian在blog中宣布Anthropic最新發(fā)布的Claude 3系列模型都將上架Amazon Bedrock。通過Amazon Bedrock,客戶將可以輕松使用Anthropic的最新模型進(jìn)行構(gòu)建。

Amazon Bedrock是亞馬遜云科技于2023年4月發(fā)布的一項全面托管的服務(wù),通過它,企業(yè)用戶可以通過API等方式訪問亞馬遜自研及眾多第三方大模型。

根據(jù)此前投資時披露的信息,亞馬遜與Anthropic雙方的合作包括亞馬遜向Anthropic投資40億美元并持有其部分股權(quán);Anthropic長期承諾將通過Amazon Bedrock向全球亞馬遜云科技客戶提供其未來基礎(chǔ)模型的訪問權(quán);以及亞馬遜的開發(fā)人員和工程師可以通過Amazon Bedrock使用Anthropic模型構(gòu)建產(chǎn)品,以便將生成式AI能力融入到他們的工作中等等。

隨著Claude 3最強模型的上架Amazon Bedrock,在過去一年,忍受了被微軟云服務(wù)增速壓著打的憋屈后,亞馬遜云科技終于要揚眉吐氣了!

在微軟2月初披露的最新財報中,2024財年Q2(自然年2023年Q4),微軟來自Azure和其他云服務(wù)的收入增長了30%。

其中,AI為Azure云貢獻(xiàn)了6個百分點的增長,這一數(shù)字較上一季度3個百分點翻倍,其中絕大部分增量都來自于OpenAI在Azure云上的推理調(diào)用。在該財季,微軟在Azure運營中就增加了對OpenAI最新模型的支持,包括GPT-4 Turbo、GPT-4 with Vision、DALL-E3等。

反觀亞馬遜云科技,雖然營收總量上亞馬遜云科技穩(wěn)坐云服務(wù)商的頭把交椅,但是在增速上不及Azure。亞馬遜云科技 2023年第四季度營收242億美元,同比增長僅13%。

可以說OpenAI技術(shù)的支持幫助微軟Azure在激烈的云競爭中脫穎而出。

現(xiàn)在,通過Amazon Bedrock,亞馬遜云科技可以給客戶們提供比GPT-4更強大的Anthropic Claude 3系列模型,這對亞馬遜云科技鞏固現(xiàn)有客戶、吸引新客戶都將極為有利。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-03-05
Anthropic大模型實力全面超越GPT-4 亞馬遜云科技露鋒芒
亞馬遜將從中受益。

長按掃碼 閱讀全文