AI芯片巨頭Cerebras爆單:降本增效顛覆市場,AI芯片新紀元正式開啟
隨著人工智能(AI)的快速發(fā)展,AI芯片市場也迎來了前所未有的機遇與挑戰(zhàn)。在這個領域,Cerebras作為一家領先的AI芯片廠商,其推出的晶圓級AI芯片以及DeepSeek-R1模型,已經(jīng)引發(fā)了市場的廣泛關(guān)注。近期,Cerebras的CEO Andrew Feldman表示,由于DeepSeek-R1的預訓練成本低,且效果相近甚至更好,已經(jīng)被一些人認為是AI的分水嶺,其爆單現(xiàn)象也證明了市場對這種新型AI芯片和模型的認可。
首先,讓我們來了解一下DeepSeek-R1模型。DeepSeek-R1的預訓練成本可以低到GPTo1等主流模型的十分之一,且效果相近甚至更好。這種模型采用了Chain-of-thought(CoT)方法來增強推理能力,將多步問題分解為中間步驟,允許模型在需要時執(zhí)行額外的計算。這種模型的特點是推理時逐字進行推理,對整段提示詞的推理需要進行多次,需要大量算力。但是,通過蒸餾將大模型的“知識”轉(zhuǎn)移到小模型,客戶可以緩解這一痛點。
Cerebras的CEO Andrew Feldman認為,DeepSeek對人工智能的影響不僅在當下,更在于將刺激出更大的AI系統(tǒng)。隨著成本的降低,市場正在變得越來越大。事實上,Cerebras已經(jīng)在官網(wǎng)展示了其晶圓級AI芯片部署DeepSeek-R1 70B可以達到1508 tokens/s的性能,比GPU快很多。這一成果無疑將為AI領域帶來更大的推動力。
除了DeepSeek-R1模型外,Cerebras公司還提供其他各種AI芯片和服務。該公司從去年8月開始提供公共推理服務,自稱是“世界上最快的人工智能推理服務提供商”。目前,該公司只提供蒸餾后的70B模型,但對于一部分客戶來說,準確性的提升值得更高的成本而選擇更大的模型。
Cerebras公司的晶圓級AI芯片以及其提供的服務無疑為AI領域帶來了巨大的變革。這種新型的AI芯片不僅提供了更高的性能,而且還在成本方面具有顯著的優(yōu)勢。通過采用先進的制造技術(shù)和設計理念,Cerebras公司已經(jīng)成功地推出了具有峰值算力高達1.2PB的芯片,搭配片外內(nèi)存可以實現(xiàn)更高的內(nèi)存容量。這種芯片的出現(xiàn)無疑將為AI應用提供更大的支持。
值得一提的是,Cerebras公司的這種新型AI芯片并非孤例。在中小AI芯片企業(yè)看來,DeepSeek R1給了他們機會和訂單。隨著人工智能市場的不斷擴大,越來越多的企業(yè)開始關(guān)注AI芯片市場的發(fā)展趨勢。他們看到了AI芯片市場的巨大潛力,并開始積極投入研發(fā),以推出更加先進和高效的AI芯片產(chǎn)品。
總的來說,Cerebras公司的爆單現(xiàn)象不僅證明了市場對新型AI芯片和模型的認可,也預示著AI芯片新紀元的正式開啟。隨著人工智能技術(shù)的不斷發(fā)展,我們相信未來的AI芯片市場將會迎來更加廣闊的發(fā)展前景。
在未來的發(fā)展中,我們期待看到更多的創(chuàng)新和突破,以推動AI芯片市場的不斷進步。同時,我們也希望更多的企業(yè)和研究機構(gòu)能夠加入到這個領域中來,共同推動人工智能技術(shù)的發(fā)展和應用。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )