速度2.6倍提升,TencentOS 支持滿血版DeepSeek

TencentOS Server AI全面支持滿血版DeepSeek R1,在雙機16卡的硬件環(huán)境上,分別在短輸入場景(如知識問答)以及長輸入場景(如企業(yè)私有信息的檢索增強生成)均獲得超過2.6倍的推理性能提升!

本性能評估采用2臺8卡服務器,顯存總量共1536GB,部署TencentOS Server AI版,2臺服務器采用RDMA高速網絡互聯,測試樣本采用通用的數據集。分別測試輸入200tokens/輸出500tokens以及輸入6144tokens/輸出1024tokens下的吞吐能力,測試結果如下:

?

TencentOS Server AI是騰訊云發(fā)布的一款針對AI場景的操作系統(tǒng),提供了從基礎架構到AI框架以及模型的全棧式AI環(huán)境,一方面簡化部署,另一方面通過高性能的AI框架,實現大模型如DeepSeek推理效率成倍的增加。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )