法國(guó)人的措辭方式:用AI分析法語(yǔ)的演變

法語(yǔ)是一種羅曼語(yǔ),源自拉丁語(yǔ),是古羅馬帝國(guó)的官方語(yǔ)言。但是,法語(yǔ)并不是一成不變的,而是隨著時(shí)間和地理而發(fā)生了變化。為了更好地了解法語(yǔ)的演變,一些研究人員利用了計(jì)算機(jī)科學(xué)和數(shù)學(xué)的方法,對(duì)法國(guó)歷史上的書(shū)寫(xiě)方式進(jìn)行了分析。

這項(xiàng)研究由法國(guó)國(guó)家科學(xué)研究中心(CNRS)和巴黎第六大學(xué)(Sorbonne Université)的數(shù)學(xué)家、計(jì)算機(jī)科學(xué)家和語(yǔ)言學(xué)家組成的跨學(xué)科團(tuán)隊(duì)進(jìn)行。他們收集了從9世紀(jì)到20世紀(jì)的法語(yǔ)文本,包括詩(shī)歌、小說(shuō)、報(bào)紙、政治演講等,共計(jì)約1.2億個(gè)單詞。然后,他們使用了一種稱(chēng)為主題建模(topic modeling)的機(jī)器學(xué)習(xí)技術(shù),來(lái)自動(dòng)識(shí)別文本中的主題,并分析它們?cè)诓煌瑫r(shí)期和地區(qū)的分布。

主題建模是一種無(wú)監(jiān)督的學(xué)習(xí)方法,它可以從大量文檔中提取出隱藏的主題,并給出每個(gè)文檔和每個(gè)單詞對(duì)每個(gè)主題的相關(guān)性。例如,一個(gè)關(guān)于政治的主題可能包含“國(guó)家”、“民主”、“選舉”等單詞,而一個(gè)關(guān)于文學(xué)的主題可能包含“小說(shuō)”、“詩(shī)歌”、“風(fēng)格”等單詞。通過(guò)這種方法,研究人員可以發(fā)現(xiàn)法語(yǔ)文本中存在的約150個(gè)主題,并觀(guān)察它們?nèi)绾坞S著時(shí)間和地理而變化。

研究人員發(fā)現(xiàn),一些主題在特定的時(shí)期或地區(qū)比較突出,反映了歷史和社會(huì)的變遷。例如,在18世紀(jì)末和19世紀(jì)初,與革命和民族主義相關(guān)的主題在法國(guó)大陸比較流行,而在加拿大則沒(méi)有。另一個(gè)例子是,在19世紀(jì)末和20世紀(jì)初,與現(xiàn)代主義和象征主義相關(guān)的主題在法國(guó)首都巴黎比較流行,而在其他地區(qū)則沒(méi)有。

這項(xiàng)研究不僅揭示了法語(yǔ)文本中的主題演變,還展示了計(jì)算機(jī)科學(xué)和數(shù)學(xué)在語(yǔ)言學(xué)研究中的潛力。通過(guò)使用機(jī)器學(xué)習(xí)技術(shù),研究人員可以處理大量數(shù)據(jù),并從中發(fā)現(xiàn)新的知識(shí)和模式。這種方法也可以應(yīng)用于其他語(yǔ)言和領(lǐng)域,為人文社會(huì)科學(xué)提供新的工具和視角。

這項(xiàng)研究發(fā)表在2023年6月15日出版的《自然·人類(lèi)行為》上。

https://phys.org/news/2023-06-written-france-analysing.html

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2023-06-17
法國(guó)人的措辭方式:用AI分析法語(yǔ)的演變
法語(yǔ)是一種羅曼語(yǔ),源自拉丁語(yǔ),是古羅馬帝國(guó)的官方語(yǔ)言。但是,法語(yǔ)并不是一成不變的,而是隨著時(shí)間和地理而發(fā)生了變化。

長(zhǎng)按掃碼 閱讀全文