如何在教育领域应用大语言模型

电子说

1.3w人已加入

描述

教育中的基础模型可以在多个数据源上进行训练,以学习教育所需的能力:对各种主题和不同教学技术的理解。这些基础模型可以以通用的方式应用于一系列任务和目标,例如理解学生、协助教师和生成教育内容。

2000 年,世界领导人最大规模的聚会在联合国千禧年首脑会议上举行,以反思对未来的理想愿景。代表们得出结论认为,首要重点应该是教育,并宣布教育“是人类成就感、和平、可持续发展、经济增长、体面工作、性别平等和负责任的全球公民的基础。”这一讨论最终被重新编入联合国可持续发展目标 “确保全民优质教育,促进终身学习”[联合国大会 2015 年]。然而,大规模提供高质量、包容性的教育给社会带来困难和经济挑战。每个学生的教育价格增长速度快于整体经济成本 [Bowen 2012],限制了可用于支持学生学习的资源。在美国,一个症状是学生持有的私立教育债务已达到 1.6 万亿美元,超过了信用卡债务总额 [Friedman 2020]。 

随着数字时代的到来和数字学习的快速发展,教育的计算方法在提高学习者和教师的效率方面显示出希望。几个核心方向已经成为人工智能的潜在影响应用,例如可以为学生提供有意义反馈的系统 ,帮助教师提高.

尽管有这种潜力,但事实证明,构建技术解决方案以有效地扩大包容性和教育质量非常困难。一个特殊的挑战是,现有工作侧重于为高度具体的任务定制解决方案,为此必须从头开始收集大量训练数据。由于创建大型数据集的难度和成本,使用这种方法独立解决每项教育任务从根本上受到限制。相反,是不是有可能创建可在各种任务和主题中重复使用的通用方法吗?  基础模型能否在该领域带来更具变革性的变化?将基础模型应用于教育的已知和想象风险是什么?我们将讨论置于两个具体任务中:(1) 理解学生的误解,以及 (2) 通过教学提高学生的理解力。

教育研究中以基础模型为中心的重要关注点。

人工智能教育的未来令人兴奋,尤其是在基础模型的背景下。然而,我们提醒读者要特别考虑任何人工智能研究应用于教育的影响。虽然我们积极致力于改善数字教育,但当务之急是我们投入了大量的思考,试图想象这个空间中任何破坏的复杂性 [Piech and Einstein 2020]。道德挑战包括数据偏见、法律约束和数字社会化的影响等问题。这些问题并非基础模型所独有,但随着研究在人工智能教育方面取得实质性进展,它们值得定期反思。 当研究开始时问“新的 AI 技术能提供什么?”时,对影响的反思尤为重要。例如,与许多其他领域一样,基础模型训练数据中的小偏差可能很难追踪, 但对教育机会的公平性有重要影响。此外,这些系统可能会经历高度的“反馈”,其中收集的数据会不断加强模型的决策。这个偏见问题超出了收集的数据范围,包括对研究人员选择研究的应用程序的担忧。下面,我们讨论其他特定于教育的问题。许多问题都围绕着这个问题:“谁受益?” 新技术是为谁创造的?

将教师从循环中移除数字教育的目标之一,尤其是基于人工智能的数字教育,是提高学习体验的生产力,以便每单位时间或单位成本进行更多的学习。可以想象,决策者可以利用这种提高的生产力将人类教师从循环中移除。这些决定的长期影响很难先验地知道。可以与经过优化以最大化“学习”的教育系统进行交互对社会情感技能发展有不利影响?它会减少与他人互动的机会吗?年轻一代的孤独感正在上升,教师是 AI 研究人员可能无法预料的压力调节力量。

这项工作是由学习者还是基础模型完成的? 另一个挑战是如何有效地教授可以使用基于基础模型的工具的学生。例如,如果学生与强大的生成模型一起工作,或者规范无效的合作和检测剽窃,教师将更加复杂地了解学生的贡献程度。Visual Studio 最近发布了 GitHub CoPilot,这是一个基于 GPT-3 。这将如何改变计算机科学教育?对于初学者程序员来说,许多挑战对于 CoPilot 或其技术继承者来说可能微不足道,这可能会破坏新手的学习体验。研究扰乱某些学科教育的技术进步的其他例子将是有益的,例如数学中的计算器, 语言课程中的教室和谷歌翻译,这两者现在都与传统教学共存。

隐私和安全。关于学生工作隐私的严格法律准则突出了在教育中使用 AI 的一个重要伦理问题。例如,在美国,学生信息受到家庭教育权利和隐私法案 (FERPA) 的保护。这些法律法规对于 13 岁以下的儿童尤为重要,他们的数据隐私和安全受到《儿童在线隐私保护法》的额外保护。除其他事项外,FERPA 限制教师分享可识别学生个人身份的作业。这可能会直接影响共享用于培训和评估基础模型的数据的计划。 

学生思维的基础模型

在为包容和快乐的教育构建 AI 工具时,基础模型可以用于许多任务。其中许多任务要求我们首先了解我们试图帮助的学习者,尤其是在开放式工作的背景下。基础模型需要什么才能对学生的理解进行推理?很容易想象一个基础模型已经适应正确回答数学问题,

但是不太清楚如何建立一个模型来诊断学生理解中的错误。为了探索这个主题,我们考虑提供反馈的案例研究对于正在从事开放式任务的学生,例如写一个简短的段落,画一个物理图,或编写代码。这种“反馈挑战”举例说明了基础模型可以为学习者提供现成的帮助,也可以展示基础模型的开放区域研究。

为了有效地向学生提供反馈,需要具备两项核心能力:(1) 理解任务的主题(例如物理或编码), (2) 诊断能力:一个教育专业术语,用于推断学生犯错的原因。对于典型的交互,没有足够的数据供 AI 模型从头开始学习,这两项核心能力。即使是有数百万学生的大规模课程,也有监督即使是短短的四行程序,算法也几乎无法理解复杂的学生推理。

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分