報告人簡介
教育測量和評價方向博士(馬里蘭大學(xué)帕克分校),現(xiàn)任多鄰國科技有限公司高級測量科學(xué)家。從事分數(shù)效度、考試安全、計算機自適應(yīng)測試、認知診斷建模等方面的研究工作。相關(guān)成果曾發(fā)表在British Journal of Mathematical and Statistical Psychology, Measurement: Interdisciplinary Research and Perspectives, Educational Psychology Review, Applied Psychological Measurement等學(xué)術(shù)期刊。
內(nèi)容簡介
隨著數(shù)字化語言測試(digital-first language assessment) 的普及,考生可在家中的便利環(huán)境下隨時進行測試。人工智能(AI)的應(yīng)用對于數(shù)字化語言測試的成功至關(guān)重要——AI不僅在測試的開發(fā)和自動評分中發(fā)揮關(guān)鍵作用,還在維護測試的安全性方面起到了重要功能。本次報告將深入探討AI在多鄰國英語測試中的應(yīng)用,重點討論了如何利用AI大規(guī)模生成高質(zhì)量考題以及如何通過AI幫助監(jiān)測作弊行為。此外,報告還強調(diào)人類監(jiān)督在AI應(yīng)用過程中的必要性,突出人在回路(human-in-the-loop)方法在規(guī)避AI潛在風險中的關(guān)鍵作用。