AI正走向兩條不同的發(fā)展路徑:數(shù)學(xué)和編程的“技術(shù)極客” vs. 語言與創(chuàng)造力的“文藝高手”。未來,能否融合這兩者,將決定AI的進化方向。
當(dāng)前的AI研究似乎正在朝兩個方向分化。一部分研究專注于優(yōu)化AI的邏輯推理能力,使其擅長編程和數(shù)學(xué)運算;另一部分則著力提升AI的語言表達和創(chuàng)造力,使其更接近人類的溝通方式。
從宏觀來看,前者讓AI成為理工科天才,擅長計算和分析,而后者則讓AI更像人文學(xué)科愛好者,熟練掌握語言的微妙之處。這種分裂有點像大學(xué)里的STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))專業(yè)與文科專業(yè)的對立,甚至可以說,AI正在重現(xiàn)高中里的“怪才”和“極客”之爭。
阿里巴巴的Qwen模型:推理AI的新突破
本周,三項新進展展現(xiàn)了這一趨勢。
阿里巴巴剛剛發(fā)布了Qwen QwQ-32B,一個在推理能力上可與DeepSeek的R1匹敵的開源AI模型,但計算成本卻低得多。這意味著AI不僅能變得更強大,還能更高效、更低成本地運行。推理AI正在快速從“革命性突破”變成“觸手可及的商品”。
GPT-4.5:AI的“品味”時代?
與此同時,OpenAI的新模型GPT-4.5引發(fā)了廣泛討論。雖然它的計算成本極高,測試成績也未必刷新紀(jì)錄,但許多AI專家發(fā)現(xiàn),它在語言表達、上下文理解和抽象寫作方面展現(xiàn)出了驚人的“品味”。
Blogger Zvi Mowshowitz總結(jié)道:“GPT-4.5在語言智能、情境適應(yīng)、知識深度以及抽象寫作能力上都更進一步?!?經(jīng)濟學(xué)家Tyler Cowen則認為:“這個模型的改進點在于審美?!?而Sam Altman更是評價道:“它有一種魔力,是我以前從未感受到的?!?/p>
然而,這種突破也帶來了一個悖論——語言的細膩掌控,一直被視為人類獨有的能力。但它無法量化,只能依賴主觀評價。一個人眼中的創(chuàng)造力,在另一個人看來或許只是失敗的嘗試。
Sesame的對話式AI:語音交互新高度
另一個備受矚目的案例是Sesame的Conversational Speech Model。這款A(yù)I在模仿人類自然對話的流暢度和微小缺陷方面,達到了前所未有的水準(zhǔn)。
測試者紛紛表示,這款A(yù)I的語音交流方式前所未有地自然,幾乎難以分辨真假。雖然這類進步難以量化,但它可能會徹底改變?nèi)祟惻cAI的互動方式。當(dāng)然,它也可能讓虛假信息和欺詐手段變得更具欺騙性。
AI最終必須“合二為一”
從更廣的視角來看,數(shù)字智能分化成技術(shù)型和人文型的發(fā)展方向并不奇怪。想想《星球大戰(zhàn)》里的R2-D2和C-3PO,一個是技術(shù)專家,一個是外交大師,AI的演變似乎正在重現(xiàn)這種模式。
然而,現(xiàn)實世界里,最成功的人往往兼具兩種才能,而未來的AI如果想要真正達到“類人”水平,也必須融合這兩條進化路徑。AGI(通用人工智能)的支持者認為,攻克這一難題只是時間問題,而人文學(xué)者則提醒我們,C.P. Snow的“兩種文化”之爭已經(jīng)持續(xù)了幾十年,AI未必能打破這一藩籬。
未來兩年,能否成功彌合這道鴻溝,將決定AI的最終形態(tài)。
本文譯自 axios,由 BALI 編輯發(fā)布。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )