嘗鮮訊飛星火認知大模型,看看它能力如何?

4月26日消息(筱汐)4月24日,科大訊飛在官微上發(fā)布訊飛星火認知大模型,不過目前官方對其介紹并不多,該認知大模型將于5月6日正式亮相。通過申請拿到了這款認知模型的內(nèi)測名額,并進行了大量的測試。

通過科大訊飛的介紹,可以看到,通過海量文本、代碼和知識的學習,訊飛星火認知大模型擁有跨領(lǐng)域的知識和語言理解能力,能夠基于自然對話方式理解與執(zhí)行任務(wù),只需一個指令,訊飛星火認知大模型便可以懂你所言、答你所問、創(chuàng)你所需、解你所難、學你所教。可以說是非常貼心的“智能助手“。

具體體驗如何,我們來親自體驗一下吧。

以下是部分測試的截圖:

首先,提出簡單的問題:可以做一下自我介紹嗎?

在首次操作中,內(nèi)容的快速生成還是出乎意料的。

一、創(chuàng)作能力

作為文字工作者最關(guān)心的莫過于創(chuàng)作能力和數(shù)據(jù)的實時性。先來一題“出一篇《長月燼明》的影評“,看看它的寫作能力。

可以看到,訊飛星火認知大模型的回復僅是在套用模板化的格式,對于其主角描述存在誤差的。我們點擊“重新生成”按鈕,希望訊飛星火認知大模型再次回答,看看結(jié)果能否讓人滿意。

從結(jié)果來看,仍然不盡如人意。先拋開劇情的套話描述,其演員團隊依舊是錯誤的。

再來一個問題:以“訊飛星火”做一首藏頭詩.

通過以上兩次生成的內(nèi)容來看,訊飛星火認知大模型有一定的能力,但其能力并不完美,完成度只能達到50%左右。

對外的內(nèi)容出現(xiàn)偏差,可以理解,那對內(nèi)呢?來問一下,科大訊飛2022年的營收情況。

這個回復是出乎意料的。在時間上,科大訊飛在4月20日晚已發(fā)布財報,不是未來時間。同時,作為語言模型,訊飛星火認知大模型也未生成模板化的內(nèi)容。

二、邏輯能力

把兩杯50度的水融在一起后,水的溫度是多少?

1+1在什么情況下等于3?

如果貓會爬樹,那么狗也會。

針對邏輯性問題,筆者也嘗試了重新生成,來看看有沒有不同的答案,但多次生成的回復是一樣的。

三、編程能力

先來一個簡單的編程問題“從1加到100等于多少,請用JAVA語言編程,并得出結(jié)論?!?/p>

“編寫一個JAVA程序,用if-else語言判斷2023年是否為閏年?!?/p>

對于其編程能力,筆者也問了兩位JAVA程序員,他們都表示其編程能力還是有的。但對于大型項目還說,具體編程效果如何,可能還得看能夠給出具體的描述。

四、圖文生成能力

前有百度文心一言,后有通義千問等等大模型。圖文生成能力也是備受關(guān)注的一點。

可以看到,訊飛星火認知大模型定位于語言模型目前無法生成圖片。

五、交互能力

成語接龍是最直接的交互形式,來玩一局。

對于出現(xiàn)“及時雨”回復時,多次讓其重新生成,答案內(nèi)容并未改變。

整體來看,科大訊飛這次推出的訊飛星火認知大模型表現(xiàn)還比較初級,無論是語義理解,持續(xù)對話、編程能力,還是數(shù)理推理能力等,與真正的“對話式AI”還有距離。

最后再來一個問題,“目前有幾個和你類似的認知智能模型?”

通過回復可以看到,當前類似的認知智能模型已經(jīng)有很多了,訊飛星火認知大模型的將呈現(xiàn)怎樣獨有的優(yōu)勢呢?還需要再等十余天才能揭曉。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-26
嘗鮮訊飛星火認知大模型,看看它能力如何?
科大訊飛也來了,看看它的大模型能力如何?

長按掃碼 閱讀全文