實測百度搜索DeepSeek滿血版:“為我所用”還是“拿來主義”?

導語:百度搜索目前已全量上線DeepSeek滿血版并提供聯網服務,其中PC端開放僅1小時就有超千萬人使用。

繼2月16日百度搜索全面接入DeepSeek和文心大模型最新的深度搜索功能之后,目前的百度搜索已全量上線DeepSeek滿血版。

當下,用戶可在百度APP輸入任意搜索詞,完成一輪搜索后,在搜索結果頁點擊「AI+」進入AI搜索,再點擊下方「去試試“滿血版”」即可與DeepSeek對話。此外,PC版百度AI搜索也已經接入DeepSeekR1滿血版并提供聯網能力。

1.jpg

百度AI搜索的DeepSeek滿血版效果到底如何?在進行過數十個測試后,不禁感嘆:百度AI搜索是真滿血!接入最好的DeepSeek模型能力的百度AI搜索,打開了新世界的大門。

“為我所用”而非“拿來主義”

接入DeepSeek后,百度不對其進行閹割,也讓服務器資源管夠。這背后是百度的為我所用,而不是拿來主義。這一過程并非是把 DeepSeek 接過來就直接給用戶去用,百度有自己的「真東西」在。

要問這一“真東西”是什么?其直接體現在百度通過深度的技術融合、RAG技術優(yōu)勢,幫用戶解決大模型幻覺等實際問題。說到底,是百度25年的數據積累。作為全球最大的中文搜索引擎,百度積累了用戶搜索行為數據、網頁索引數據和內容生態(tài)數據。這些數據覆蓋了從PC互聯網到移動互聯網、再到AI時代的多維度信息,包括文本、圖像、視頻等,形成了獨特的“時間壁壘”,是新興AI搜索難以復制的。

先來一個能考察25年時間跨度的題目:細數過去的25年中,中國新能源行業(yè)的發(fā)展歷程,要求包括明確的時間節(jié)點、時間節(jié)點以及其所帶來的影響和意義。百度AI搜索DeepSeek-R1滿血版得到的回答如下:

2.jpg

答案中詳細羅列了中國新能源行業(yè)25年的發(fā)展歷史,并將其劃分為不同階段,部分數據是其他AI搜索引擎中所沒有的。 

而在搜索這一問題的過程中,百度AI搜索也展示了新功能“特色靈感區(qū)”,能歐根據當前提問,提供靈感內容,幫助用戶梳理問題脈絡,一問便能了解問題全貌。也可以通過點擊靈感區(qū)任意問題即可發(fā)出對應提問。

3.jpg

值得注意的是,目前市面上大部分的AI搜索產品,都會展現模型“思考”的過程,然而其展現形式更多的是“正在搜索XXX個網頁”,而接入DeepSeekR1滿血版的百度AI搜索,能夠細細拆分問題。輸入 Prompt:請統(tǒng)計出2010至2015年期間,世界范圍內GDP排名的變化情況,需提供具體數值并展現變化的過程。

4.jpg

從第一步的確定數據來源是否可靠、到界定請問題范圍是名義 GDP 還是購買力評價(PPP)調整后的GDP、到搜索出早年的數據和進行排名,這仿佛人腦在層層剖析一個問題的過程。

令人驚艷的是,DeepSeek R1滿血版的百度AI搜索能夠全面地考慮到各種微小的細節(jié)、周到地考慮到特殊情況應該如何處理,諸如,要注意各國GDP實際增長速率和波動情況、匯率波動影響、數據處理中四舍五入的部分,這確實是我沒想到的。不僅感嘆一句:DeepSeek R1滿血版的百度AI搜索,還是太全面了!

針對這一問題的完整回答如下,在未被提示的情況下,自動選擇表格的方式進行展現,并且在關鍵事件處給了明確的提示。

5.jpg

百度RAG疊加DeepSeek-R1之后,其幻覺程度是否真的被降低?接下來的一道題目則測試百度AI搜索DeepSeek滿血版的幻覺程度:請?zhí)峁┮环?005年2月20日的全球股市收盤數據。

這一問題的刁鉆之處在于,2005年的2月20日是周日,絕大多數國家并不會在周日開市。如果模型具有幻覺的話,則無法避開這個“坑”,會開始拿其他事件的數據張冠李戴到2005年2月20日。但百度AI搜索的DeepSeek滿血版思考過程如下:

6.jpg

根據思考過程可知,而是在分析過程中就界定清了問題,并沒有“一本正經地胡說八道”,給出的答案也嚴謹準確。

以此為基礎,再將問題升級一個難度為:提供2005年2月18日歐洲市場的逐時數據。這對答案的顆粒度要求較細,百度AI搜索DeepSeek R1滿血版的回答如下:

7.jpg

百度背后多年積累的專業(yè)數據,同樣也在兩者結合后得到了更好地釋放。向模型提問專業(yè)問題:請詳細分析中國藥品價格的形成機制及其影響因素,并結合當前政策背景,說明醫(yī)保藥品價格談判的作用和意義。

這一問題針對醫(yī)療行業(yè)的藥品價格問題,測試模型對特定領域知識的專業(yè)度和成熟度。并且問題中明確要求結合當前的政策背景,也考驗模型是否能準確捕捉到時新信息。給出的回答如下:

8.jpg

答案中包含多處數據細節(jié),如在“以價換量”提高基金使用效率中標注出PD-1抑制劑年治療費用從30萬降至5-10萬,74種新藥納入醫(yī)保目錄中指出CAR-T療法從120萬元降至33萬,說明模型對醫(yī)療藥品這一專業(yè)行業(yè)的數據有較深的積累。

DeepSeek-R1讓百度AI搜索的推理能力如虎添翼,同時,百度AI搜索本身也在發(fā)揮自身優(yōu)勢,將多模態(tài)能力疊加在了大語言模型DeepSeek之上。輸入prompt:我要拿一幅畫去參加涂鴉插畫的比賽,主題是“未來城市”,創(chuàng)造一個充滿奇幻元素的世界,比如神秘的森林、魔法城堡、外星生物、精靈與巨人等,需要給出圖片。這一問題中包含多個畫面主題,既需要大語言模型的能力加以理解,又需要圖像模型進行生成,最后得到的畫面如下:

9.jpg

開啟DeepSeek-R1滿血版后,百度AI搜索的代碼能力也更上一層樓。輸入prompt:請寫出一個生成畫面為“祝賀哪吒票房大賣,并配上哪吒形象”的代碼,并檢測代碼效果。得到的答案如下:

10.jpg

這一回答中不僅包含了完整代碼的運行文件,更給出了視覺元素驗證、動畫檢測、兼容性測試等檢測說明,更給出了效果增強建議的代碼,用戶可以進行自定義的調整。

回歸用戶價值,而非技術孤島

時至今日,回顧中國人工智能發(fā)展史,無論是早在2010年左右開始布局NLP、知識圖譜、機器學習等關鍵技術的研發(fā),還是大語言模型浪潮中“先人一步”開發(fā)出 ERNIE Bot,百度對人工智能的態(tài)度一致都是“堅持高度自研、加大投入力度”。 

即便“堅持自研如百度”,面對 DeepSeek 的沖擊,百度也開始在自家超級APP中接入外部大模型,將第三方模型伙伴納入自己的生態(tài)。這是在大模型戰(zhàn)略下以產業(yè)操作系統(tǒng)為目標的一次進展,本質上是百度圍繞“大模型+搜索”構建的生態(tài)級戰(zhàn)略組合拳。

這意味著,百度搜索回歸用戶價值本身,不但沒有固步自封,而是將自身的核心業(yè)務和重點業(yè)務與DeepSeek做探索融合。背后所指向的趨勢是中國互聯網從超級APP、自給自足的“孤島生態(tài)”,正在轉向連接越來越緊密的“技術共同體”。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2025-02-20
實測百度搜索DeepSeek滿血版:“為我所用”還是“拿來主義”?
百度搜索目前已全量上線DeepSeek滿血版并提供聯網服務,其中PC端開放僅1小時就有超千萬人使用。

長按掃碼 閱讀全文