傳承中華文脈,古籍是重要的載體。據(jù)統(tǒng)計,中國是全球擁有古籍最多的國家。然而,當代人面對浩如煙海的古籍,又存在“找不到、不會用、讀不懂”等難題。近日,由字節(jié)跳動研發(fā)的“識典古籍”數(shù)字化平臺上線智能助手功能,試圖通過人工智能大模型技術,提升古籍查閱效率,讓更多普通人讀懂古籍,助力古籍保護與傳承。
用戶打開“識典古籍”官網(wǎng)即可免費體驗這項新功能,當遇到讀不懂的古文語句時,點擊“問AI”,就可以看到這句話的翻譯,還可以用日常說話的方式,讓智能助手總結(jié)文本內(nèi)容,提出可供參考的研究問題,進行跨古籍提問等。如用戶提問“我想找跟北京相關的古籍”,智能助手就會通過語義檢索“識典古籍”的資料庫,給出解答,直接在回答中顯示引用的參考資料和原文鏈接。
據(jù)“識典古籍”產(chǎn)品負責人王宇介紹,古籍保護與文化傳承一直是字節(jié)跳動公益重點關注的領域?!白R典古籍”平臺一方面是一個面向社會公眾的數(shù)字化古籍閱讀工具,同時也是一個開放的古籍數(shù)字化智能整理平臺?!皬?022年上線到現(xiàn)在,我們根據(jù)用戶的反饋對平臺功能進行了一系列優(yōu)化。我們也在探索一些更高效的方式,開發(fā)更好的產(chǎn)品和工具,幫助大家更好地閱讀和理解古籍。此次依托大語言模型技術,上線古籍智能助手,也是我們在這一領域的思考和創(chuàng)新?!?/p>
據(jù)不完全統(tǒng)計,我國現(xiàn)存古籍約有20萬種,其中有數(shù)字化掃描影像的有8萬種,實現(xiàn)文本數(shù)字化的僅有3-4萬種左右。由于古籍種類、數(shù)量繁雜,保存程度不一,加之從事古籍修復的專業(yè)人員數(shù)量不足、資金匱乏等多重原因,古籍資源的挖掘傳承保護工作仍面臨巨大壓力。
2021年,字節(jié)跳動公益就發(fā)起“尋找古籍守護人”活動,邀請來自不同領域的專家學者、文化名人和抖音達人,共同推動古籍保護。2022年,字節(jié)跳動啟動了古籍數(shù)字化的工作,真正實現(xiàn)古籍從紙質(zhì)到數(shù)字化的遷移。當年10月,字節(jié)跳動聯(lián)合北京大學數(shù)字人文實驗室共同打造的古籍數(shù)字化閱讀平臺“識典古籍”正式上線。
“識典古籍”上線以來,收到了許多文史愛好者與研究者的正面反饋與支持。有報道指出,“識典古籍”平臺不僅是一個公益性數(shù)字化平臺,對于古籍愛好者尤其是專業(yè)研究人員來說,其更是一座橫跨千年歷史的知識寶庫。目前,該平臺對社會免費開放的古籍超過了2900部,其提供的分詞檢索、圖文對照、字典釋義等功能,讓普通人也能輕松閱讀古籍文獻。
此次“識典古籍”智能助手的上線,進一步降低了古籍的閱讀門檻,讓流傳千百年的寶貴文獻走入尋常百姓家。同時,以古籍智能助手為代表的人工智能工具,也為古籍數(shù)字化工作帶來了機遇?!拔覀兯幍男聲r代,有可能實現(xiàn)文化典籍永久保護和傳承”,有業(yè)內(nèi)人士表示。
據(jù)了解,目前“識典古籍”除了網(wǎng)頁版,今日頭條產(chǎn)品側(cè)還設置了“古籍”頻道。由于公益項目的延展性,在字節(jié)跳動內(nèi)部,有很多不同業(yè)務板塊的員工參與其中,為此還專門成立了一個古籍保護公益社團。這種開放、協(xié)作的氛圍,也是平臺在兩年時間內(nèi)實現(xiàn)上線并不斷優(yōu)化的基礎。
下一步,“識典古籍”研發(fā)團隊將有計劃地為古籍智能助手開發(fā)更多的工具。除此之外,該團隊還將繼續(xù)提升AI在古籍整理等領域的應用,希望能夠整理和校對更多的古籍,并將其數(shù)字化,促進古籍資源的高效利用,讓平臺在文化傳承中發(fā)揮更大的作用。按計劃,到2025年,“識典古籍”將陸續(xù)完成一萬種古籍的智能化整理工作,基本覆蓋儒家、道家和佛學的核心典籍目錄,屆時將全部免費開放。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )