在線測評:噱頭大于實效還是技術(shù)惠及大眾?

AI?

在線測評的概念無疑是隨著整個自適應學習的興起而來。

自適應學習是一種較為先進的教育科技手段,通過自主提供適合每位學生的獨立幫助,引導學生下一步學習內(nèi)容和活動,當學生在學習過程中遇到課程難度過高或過低時,課程的難易程度都可以自動調(diào)整,從而實現(xiàn)可規(guī)?;膫€性化教育。一般而言,測評是自適應學習產(chǎn)品最常應用的在線教育場景。

自適應學習中的測評主要依賴學習過程數(shù)據(jù)、考試結(jié)果等來測評,測評比較全面、精準,并能夠支持學習過程的動態(tài)優(yōu)化,有助于教學效率的提升。

其實,在線測評的需求是真實的,很多的公司將技術(shù)的力量投入于此,對外都宣稱自己的技術(shù)更為領(lǐng)先,但是我們需要先問一個問題,測評的核心真的是AI技術(shù)嗎?

或許未必。因為保證任何算法的有效性最關(guān)鍵因素是正確的模型,對于教育而言,有效的模型,能夠最大程度地保證信度和準度的測評題目設(shè)置,才是最根本的。

以語言測評為例,朗播網(wǎng)此前上線的「雅思托福測評小程序」,依托全球首款托福自適應學習系統(tǒng),深度挖掘了學員數(shù)據(jù),全面覆蓋了19個核心能力點,設(shè)置了10-15分鐘時長的測試內(nèi)容,能夠更精準的測試出用戶的真實水平。

據(jù)朗播網(wǎng)創(chuàng)始人&CEO杜昶旭介紹:從語言測評模型上來看:基礎(chǔ)其實是能力圖譜/量表,定性描述不能解決本質(zhì)問題,最關(guān)鍵的是標準化的定量描述。要想量化一個人的語言能力,追根溯源還是要用測量學的方法,來評測一個學生的語言能力。因此針對語言類的考試完全區(qū)別于數(shù)學等以知識點為導向的學科,是不會有太多所謂“規(guī)律性”的東西,反而是對考生能力的描繪。

從語言測評內(nèi)容上來看:語言測評我是完全不主張用真題去測試的(雖然市面上很多測評都是拿了真題就包裝成測評給用戶),應該是基于能力模型自主定義測試題,測試題之間交叉對應能力點,反映用戶的趨勢和現(xiàn)狀。

從語言測評技術(shù)層面來看:一般來說,為了測量一個能力點,通常需要3-5道測試題。為了簡化測驗過程,我們依據(jù)知識之間的關(guān)聯(lián)程度構(gòu)造了一個特殊的神經(jīng)網(wǎng)絡,找到題與題之間的關(guān)聯(lián),朗播網(wǎng)現(xiàn)在研究的,就是如何基于基于貝葉斯和IRT模型的神經(jīng)網(wǎng)絡算法,來優(yōu)化這個測評的過程并提高準確性。

除了優(yōu)化自適應測評技術(shù),朗播網(wǎng)還不斷發(fā)力語音、圖像識別和NLP,即機器學習和深度學習技術(shù)的應用,以及用機器來解決用戶學習過程數(shù)據(jù)收集分析,基于分析生成形成性的評價和結(jié)果的預測。

完成自適應學習閉環(huán),測評只是第一步

測評與體檢類似,體檢發(fā)現(xiàn)身體的問題,但是不會給出治療方案。真實有效的測評通過技術(shù)和模型的力量發(fā)現(xiàn)了問題,接下來應該考慮的就是誰來解決問題,以及怎么解決問題。

人工智能自適應教育最早發(fā)展出的功能是反映學生的能力水平(測試功能),后來逐漸加入找出知識點盲區(qū)(評價功能)、推送內(nèi)容彌補盲區(qū)(學習功能)的功能,但目前所推送的學習內(nèi)容表現(xiàn)形式仍然是視頻、題目等舊形式,背后的學習方式是傳統(tǒng)的“聽課”和“刷題”,這是由教學思路的固化導致的。按照傳統(tǒng)的在線教育以及線下培訓機構(gòu)的做法,從自測環(huán)節(jié)就已落后,更不用說形成有效的閉環(huán)了。

從自適應學習的角度來看,測評只是形成整個閉環(huán)的第一步。以朗播網(wǎng)為例,用戶在朗播網(wǎng)通過自行測試,完成對自身英語能力的檢測。測驗完成后,朗播網(wǎng)會依據(jù)模型,用可視化的方法描述用戶的英語能力,并依據(jù)用戶的不同情況,給予其不同的解決方案。

除了初次的測評以外,用戶在朗播網(wǎng)學習還需要每完成10套任務包后再進行測評,通常是10-15天,測試也會使用戶的能力更貼合應該達到的要求,并且結(jié)合個性化學習計劃,繼續(xù)推薦更為適合的學習方案。

涉及到機器學習的,數(shù)據(jù)都是非常重要的,尤其是對個性化要求極高的自適應學習。教學不應該是單方面給予的過程,學習不是把線下培訓方法照搬到線上,而是成體系化、模塊化的,隨著用戶能力提高,系統(tǒng)也可以實現(xiàn)升級,結(jié)合教研與數(shù)據(jù)就是在線教育實現(xiàn)個性化教學的完備路徑。

在線教育競爭逐漸升溫,傳統(tǒng)營銷手段無法突出平臺優(yōu)勢,如何讓數(shù)據(jù)大量沉淀下來,發(fā)揮人工智能和機器學習的技術(shù)優(yōu)勢,真正利用技術(shù)解決自適應學習的問題,形成有效的閉環(huán),才是未來在線教育抓住當前機遇,獲得競爭優(yōu)勢的著力點。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-18
在線測評:噱頭大于實效還是技術(shù)惠及大眾?
任誰再獨善其身也很難不被朋友圈中的“測一測”吸引目光。娛樂性質(zhì)的測試小程序,以測試為噱頭做著各種產(chǎn)品、服務...

長按掃碼 閱讀全文