不用老师批改也不麻烦家长,美国学校用AI批改作业,效果怎么样?

恋习Python

共 2864字,需浏览 6分钟

 ·

2020-12-06 16:33

大数据文摘出品

来源:WSJ

编译:周熙  


前段时间,江苏一家长大呼“我就退出家长群怎么了”迅速引起公众关注。



很多家长在感叹“压垮一个成年人只需一个家长群”的同时,继续大倒“苦水”;而老师们也频频“发声”,有人说自己到了深夜11点还在微信群里回复家长的咨询信息。


随着“家长退群”事件持续发酵,江西、辽宁等省纷纷出台文件,明确指出教师必须亲自批改作业,严禁家长、学生代劳。


家长和老师各有苦楚,那么批改作业这个事,交给AI怎么样?我们可以看看美国已经应用这项技术的情况。


自动批改软件经常把正确的答案标注为错误


当今年秋季的成绩单出来的时候,一些家长可能会收到令人不悦的“惊喜”:孩子的成绩低于预期。


但是这可能并不是他们孩子的学习情况的准确反馈,而是许多学校用来检查作业的AI系统出现了故障。


除非家长和老师对学生的考试重新检查,否则这个问题很容易被忽略。当一个五年级学生在一次科学考试中考砸了,才有人发现了这个问题,老师知道他已经为考试做好了准备,所以在网上打开测试,想看看这个学生漏掉了什么,发现他的一些答案是正确的,但批改错了。


"错误 "是什么呢?只是大小写字母的问题。


于是老师最好把他参加过的每一次考试都看一遍,看完后,又发现了几个例子。


自动评分承诺为教师节省了时间,但现在老师中的许多人却要花上几个小时的时间来研究学生的每次评估和考试的答案。



在某些情况下,Canvas学习平台将回答的大写字母的差异标记为不正确。图片:Julie Jargon《华尔街日报》杂志社


错误从何而来?


错误的根源在于许多评分机器人的被设计的过于简单化。它们试图将学生的回答与老师的答案进行匹配。如果两者不完全一样,即使人类很容易就能看出答案的正确性,但答案往往会被标记为错误。这是突然转向远程学习给老师、家长和学生带来的又一个头疼的问题。


这类教育软件的制造商承认自动评分存在的问题,并表示许多教师没有足够的时间接受如何准确使用在线平台的相应培训。


科罗拉州奥罗拉市的一位单身母亲Cristina Perez说,她的三个孩子已经对整个远程学习的经历感到失望,包括在Canvas学习管理平台中收到许多错误的测试评分。我的孩子们在加利福尼亚使用的虚拟教室也是同一平台。


"我所有的孩子都是'B'级学生,现在他们大部分课程都不及格。这就是它的糟糕之处。" Perez女士说,她的孩子们正在读七年级、八年级和十年级。"这对孩子的心理健康和即便是简单尝试造成什么样的影响?"


孩子上学期间,Perez女士从事运送汽车零件的工作,她说她发现很难联系到老师。她的每个孩子都有七位老师。她说,她已经给他们中的一些人发了电子邮件,告诉他们这些问题,但考试成绩还是没有得到纠正。


"我没有时间坐在那里监督这一切,"她说。"我已到了告诉我的孩子们只需登录并做他们能做的地步了。他们的压力已经够大了。



有些学生在Canvas中对问题的回答因为与教师的准确措辞不一致而被自动标记为错误。在这种情况下,教师已经手动调整了成绩。图片:Julie Jargon《华尔街日报》杂志社


Patrick Lytle在伊利诺伊州高地公园(Highland Park)经营一家设计公司,他五年级的女儿告诉他,她在在线平台Otus的一次数学测验中答错了答案。她的老师曾指导学生在答案中加入单位,而她在一道题上正确地回答了 "3克"。然而,自动评分器却标错了,显示正确答案只是 "3"。Lytle先生就此给老师发了邮件,老师纠正了该女生的分数。


位于犹他州的教育软件公司Instructure Inc.的首席产品官Mitch Benson表示,该公司经常听到有关其自动评分功能的问题。他说,在虚拟学习的热潮中,许多学校没有足够的时间对教师进行彻底的培训,让他们了解Canvas作为远程学习一站式服务平台的各种属性。


"教师们不得不使用他们并不熟悉的工具,这带来了一些新的挑战," Benson先生说。     


教师在Canvas中建立自己的虚拟教室,学生可以登录视频会议,访问教育应用程序,接收和提交作业并进行测试。在旧版本的测验功能中——Instructure表示,在其6000个地区和大学客户中,约有75%的客户仍在使用该功能——学生必须完全按照教师输入的问题来回答。大约18个月前,Canvas开始推出更新的测验功能,其算法可以检测出答案何时足够接近。


Benson先生说,在业务快速增长的过程中,很难跟上所有的问题。Canvas的并发用户数峰值已从4月的200万上升到9月的650万。客服电话与使用量同时上升,上个月达到20多万个求助电话。


Benson先生说,该公司的目标是让教师的工作更轻松。"我为我们有些落后的领域感到抱歉,"他说。


总部位于伊利诺伊州的Otus公司首席运营官Keith Westman也表示,自动评分问题不是技术问题,而是教师培训问题。


当教师在Otus中设计测试时,他们可以包括几个备用答案。例如,如果一道数学题的正确答案是 "3克",教师可以指定几个被认可为正确的答案,如 "3克",或是 "3"。教师可以选择是否给学生一个满分或半分的答案,可以要求答案完全吻合,或包含部分正确的文字。


Westman先生说,如果教师不喜欢自动评分,他们可以完全禁用它。他还说:"自动评分在起作用的时候是很好的,但当它不起作用时,对学生来说是毁灭性的。"



在170个K12学区使用的平台Otus,让教师包括几个备用答案。该公司表示,自动评分问题不是技术问题,而是教师培训问题。图片:Otus


Kristin Beamish-Brown是明尼苏达大学双城分校的高级教学专家,她每天都要处理来自她第三学期西班牙语课上远程学生的恼人问题。尽管她警告他们,他们在Canvas中看到的自动成绩可能是错误的,但她经常在她二次检查自动批改成绩之前听到他们的消息。


"我有71个学生。我需要花上几个小时的时间来评定本应是自动评分的测验,"她说。"我不仅要回去检查他们的成绩,还要回复50个给我发邮件担心成绩的学生。"


Beamish-Brown女士说,她已经开始向学生隐瞒成绩,直到她可以审查所有的答案。当自动评分器标出一些错误时,她发现自己要读三四遍答案才能确定。


她说:"我开始怀疑自己,因为机器说那是错的。""这就是科技让我们的生活变得更轻松。"      


相关报道:

https://www.wsj.com/articles/when-the-bot-that-grades-your-kids-schoolwork-earns-an-f-11605618000?mod=tech_lead_pos5     
习Python

关注恋习Python,Python都好练
好文章,我在看❤️
浏览 14
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报