搜狗搜索“CIPS-SOGOU問答比賽”賽程加碼 正式啟動(dòng)“非事實(shí)類問答子任務(wù)”

構(gòu)建開放域智能問答系統(tǒng)是人工智能研究領(lǐng)域的一項(xiàng)重要前沿課題。近日,由搜狗搜索聯(lián)合中國中文信息學(xué)會(huì)共同舉辦的“CIPS-SOGOU問答比賽”,正式啟動(dòng)了“非事實(shí)類問答子任務(wù)”。搜狗搜索將公開百萬級(jí)真實(shí)用戶問答數(shù)據(jù)集,為參賽者提供一展身手的舞臺(tái),從而促進(jìn)學(xué)術(shù)界及業(yè)界交流,提升智能問答領(lǐng)域的研究水平,推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。

“CIPS-SOGOU問答比賽”,是國內(nèi)首檔基于大規(guī)模真實(shí)用戶問答數(shù)據(jù)集的問答評(píng)測(cè)任務(wù)。大賽根據(jù)問題類型將比賽任務(wù)分為“事實(shí)類問答子任務(wù)”和“非事實(shí)類問答子任務(wù)”,分別對(duì)應(yīng)事實(shí)類問題和非事實(shí)類問題。去年9月,該大賽伴隨著“事實(shí)類問答子任務(wù)”的啟動(dòng)已正式開賽。

而于近日啟動(dòng)的“非事實(shí)類問答子任務(wù)”,無疑又為大賽注入新機(jī),將賽事推向高潮。相較于“事實(shí)類問題”,“非事實(shí)類問題”包括更廣泛的問答內(nèi)容形式,包括列舉(list)、定義(definition)、方式(how)、原因(why)、假設(shè)(hypothetical)等等。

根據(jù)賽制,基于搜狗搜索提供的問題,以及相對(duì)應(yīng)的若干候選答案篇章,參賽者需設(shè)計(jì)算法從候選篇章中抽取合適的詞語、短語或句子,形成一段正確、完整、簡潔的文本,作為預(yù)測(cè)答案,以正確、完整、簡潔地回答該問題,答案文本長度限定在500字內(nèi)。

針對(duì)大賽中的每個(gè)問題,參賽者只需提供一個(gè)預(yù)測(cè)答案。“非事實(shí)類問答子任務(wù)”將針對(duì)該預(yù)測(cè)答案與標(biāo)準(zhǔn)答案計(jì)算ROUGE-L和BLEU值,再以測(cè)試集上兩個(gè)指標(biāo)的平均值作為最終指標(biāo)。此次比賽將在2018年11月CIPS年會(huì)上舉行頒獎(jiǎng)儀式,授予獲勝者獎(jiǎng)金和榮譽(yù)證書。

搜狗搜索“CIPS-SOGOU問答比賽”賽程加碼 正式啟動(dòng)“非事實(shí)類問答子任務(wù)”

  (圖:CIPS-SOGOU問答比賽任務(wù)說明)

值得期待的是,此次“非事實(shí)類問答子任務(wù)”中,搜狗搜索將公開百萬級(jí)真實(shí)用戶問答數(shù)據(jù)集。包含10萬個(gè)非事實(shí)型問題,代表了最真實(shí)廣泛的網(wǎng)民信息需求;以及100萬個(gè)對(duì)應(yīng)問題的候選篇章及答案標(biāo)注(每個(gè)問題對(duì)應(yīng)給出10個(gè)候選答案篇章),候選篇章都是從搜索引擎檢索真實(shí)網(wǎng)頁結(jié)果中抽取的文本。

實(shí)際上,搜狗搜索在此次任務(wù)中提供百萬級(jí)真實(shí)用戶數(shù)據(jù)集,除了促使大賽正常開展外,更有意義的是,此舉為構(gòu)建開放域智能問答系統(tǒng)的研究提供了剛需的數(shù)據(jù)支撐,有助于促進(jìn)智能問答領(lǐng)域技術(shù)的發(fā)展和應(yīng)用,從而推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù),讓用戶更加便捷地獲取信息和知識(shí)。

作為國內(nèi)第二大搜索引擎,搜狗搜索憑借自身數(shù)據(jù)優(yōu)勢(shì)及在人工智能領(lǐng)域研究的持續(xù)大力投入,已經(jīng)在智能問答領(lǐng)域處于領(lǐng)先地位,率先實(shí)現(xiàn)了“直接為用戶提供答案”。搜狗搜索已上線的“立知”智能問答系統(tǒng),就是其研發(fā)的面向未來的搜索。該系統(tǒng)能夠理解用戶搜索意圖,并直接提供答案。目前,“立知”智能問答系統(tǒng)在事實(shí)性問題、分析類問題、觀點(diǎn)類問題、數(shù)字類問題、隱式問題等方面,都能為用戶直接返回精確答案。

現(xiàn)在,作為智能問答領(lǐng)域的帶路黨,搜狗搜索開放技術(shù)能力,向?qū)W界及業(yè)界提供百萬級(jí)真實(shí)用戶問答數(shù)據(jù)集,助力行業(yè)向“非事實(shí)性問答”領(lǐng)域研究開拓,促進(jìn)智能問答領(lǐng)域的學(xué)術(shù)交流。有興趣進(jìn)行技術(shù)切磋,提升研究水平的高校師生及業(yè)內(nèi)研究人員,均可通過“搜狗實(shí)驗(yàn)室”官網(wǎng)提交報(bào)名信息參賽。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-05-22
搜狗搜索“CIPS-SOGOU問答比賽”賽程加碼 正式啟動(dòng)“非事實(shí)類問答子任務(wù)”
構(gòu)建開放域智能問答系統(tǒng)是人工智能研究領(lǐng)域的一項(xiàng)重要前沿課題。

長按掃碼 閱讀全文