点击蓝字 关注我们
SUBSCRIBE to US
Image: The Verge
据悉,得克萨斯州近日参加州规定考试的学生正被用作一种新的人工智能评分系统的小白鼠,该系统将取代该地区大部分的人工评分员。
据Texas Tribune报道(https://www.texastribune.org/2024/04/09/staar-artificial-intelligence-computer-grading-texas/),得克萨斯州教育局(TEA)正在推出一种利用自然语言处理的“自动评分引擎”,该技术使OpenAI的ChatGPT等聊天机器人能够理解用户并与用户交流,以在得克萨斯州学业准备评估(STAAR)考试中对开放式问题进行评分。。该机构预计,通过减少对临时人工记分员的需求,该系统每年将节省1500万至2000万美元,今年计划雇佣2000名以下的评分员,而2023年需要6000名。
STAAR考试测试三年级至八年级的学生对核心课程的理解,去年进行了重新设计,减少了多项选择题。现在,它包含的开放式问题增加了七倍,TEA学生评估主管Jose Rios表示,该机构“希望尽可能多地保留开放式回答,但这些回答需要花费大量时间来评分。”
根据TEA网站上的幻灯片显示(https://tea.texas.gov/student-assessment/testing/hybrid-scoring-key-questions.pdf),新的评分系统是使用3000份已经接受两轮人工评分的考试答卷进行训练的。一些安全网也已经实施——例如,四分之一的计算机评分结果将由人类重新评分,混淆人工智能系统的答案(包括使用俚语或非英语回答)也将被重新评分。
虽然TEA乐观地认为人工智能将使其能够节省大量现金,但一些教育工作者并不那么希望看到它的实施。Lewisville独立学区负责人Lori Rapp表示,2023年12月,当自动评分系统在有限的基础上使用时,她所在的学区收到的得零分的建构式回答"急剧增加"。Rapp说:“目前,我们还无法确定是试题出了问题,还是新的自动评分系统出了问题。”
人工智能论文评分引擎并不是什么新鲜事。Motherboard 2019年的一份报告发现,至少有21个州正在使用这种引擎,并取得了不同程度的成功,不过TEA似乎决心避免重蹈覆辙。TEA幻灯片上的小字还强调,其新的评分引擎是一个封闭的系统,与人工智能本质上不同,因为“人工智能是一台使用渐进学习算法进行调整的计算机,允许数据进行编程,并从本质上自学。
试图在两者之间划清界限并不令人惊讶--网上不乏教师对人工智能生成服务如何被用来在作业和家庭作业中作弊感到绝望。被这一新评分系统评分的学生可能很难接受,他们认为"只许州官放火,不许百姓点灯"在这里是如何被应用的。
微信号|IEEE电气电子工程师学会
新浪微博|IEEE中国
 · IEEE电气电子工程师学会 · 
继续阅读
阅读原文