网上作业管理系统:我们应该允许多尝试?外文翻译资料
2023-07-28 11:15:10
英语原文共 24 页,剩余内容已隐藏,支付完成后下载完整资料
网上作业管理系统:我们应该允许多尝试?
摘要
传统的铅笔和纸的智慧表明,允许多次尝试家庭作业导致更多的时间花在家庭作业上,更高的家庭作业成绩和更好的考试表现。由于各种原因,家庭作业越来越多的是在线自动执行的。
本文讨论了一个网上作业管理系统评估学生在一次和多次尝试作业设置下的行为的准实验结果。该论文讨论了多次尝试是否会导致更多的努力和改进的表现,并评估替代的,不太可取的,潜在的激励行为。我们发现,多次尝试会导致“游戏”行为,导致分数膨胀,而学习结果没有改善,这些发现很重要,因为它们提供了指导和洞察最佳实践,以最大化学生在选择网上作业设置时的结果。
关键词:学生的努力和表现,评估设置,多次尝试。
1 介绍
历史上,传统观点认为,允许分数和重做作业问题的能力等激励因素,会导致花在家庭作业上的时间更多,家庭作业成绩更高,考试成绩更好--见Keith (1982)、Emerson(2011)和Grove (2006)等人。探索这些主张的研究发现了支持这一观点的证据,Keith (1982)和Emerson(2011)等人。然而,许多研究早在技术管饭应用之前就开始了,因此,通过铅笔和纸作业的方法来研究上述假设。随着网上管理系统的出现,家庭作业的性质发生了根本性的变化。今天,教师和教师们面临着扩招、资源减少和额外的行政责任,这些限制和网上管理系统的可行性鼓励使用自动评分的家庭作业,通常意味着作业时多项选择(Schaur)。
关于网上管理系统的使用已经写了很多,包括它们对学习的影响Calaoreore和 Trost 等人)。研究表明,使用这样的系统可以提高性能(Sosin和Emerson 等),与使用传统的铅笔和纸作业技术一样有效(Dufresne, Bonham, Fynewever Lee等)。然而,很少有研究(如果有的话)关注网上作业管理设置如何影响学生的表现。例如,历史上关于通过很多尝试来修改问题的传统智慧在自动评分的多项选择题中可能并不适用。
本文利用一个网上作业管理系统,对学生在单次和多次尝试作业设置下的行为进行了准实验评估。具体来说,我们探索多次尝试是否会导致更多的努力和提高性能;并评估其他的,不太可取的,有潜在激励作用的行为。通过分析两门宏观紧急导论课程的不同平均表现指标的差异,我们发现多次尝试并没有改善学生的学习,也没有证据表明“猜测”行为可能导致不太理想的结果,如作业和整个课程的分数膨胀。
虽然学生多次尝试的目的是促进一种通过修改学习的现象,但我们的中心发现,多次尝试激励猜测说明了使用网上作业管理系统的一些微妙的危险。因此,我们认为我们的研究结果对教育者的总体目标至关重要,即在使用网上作业管理系统时,确定一套适当的评估设置,以最大限度地提高学生的成绩。
2 整体课程描述
在我们的实验中,我们使用了两门宏观紧急导论课程,这两门课程在2021年的夏天连续开设了两个夏季课程,每个课程报名人数上线为60人。评分作业包括10个家庭作业(前8个算进学生的成绩)和2次考试。并没有任何形式的补课或延期作业。课程资料采用Blackboard和MyEconLab相结合的方式管理。主题分为5个模块,每个模块包含2个作业。这些模块被列在黑板上,并与MyEconLab的链接一起管理作业。这两门考试都是通过黑板进行的。黑板上的其他材料包括课程欢迎辞、教学大纲、考试解答和各种模块和技术支持的讨论板。教学大纲非常详细,杨希地描述了政策、作业和考试设置。
3 作业分配
3.1 作业的设置
通过MyEconLab管理的作业主要是8到15个问题的多项选择题,学生可以在截止日期之前的任何时间查阅。一旦进入,问题会按固定的顺序每次出现一个问题,学生可以在截止日期之前的任何时间保存和回复他们的工作。在截止日期之后,家庭作业链接将失效,不久之后将通过MyEconLab提供解决方案。学生有责任利用教学大纲中提供的额外资源来解决技术上的困难。这些和其他关于作业的细节在教学大纲中都有明确的描述。为了更详细地描述作业,作业平均值有11道题。最短到最长的家庭作业分别是8题和14题。在题目类型上,98%的题目是选择题,剩下的2%要求学生提供数字答案。多项选择题的选项为4至5项,其中4项占55%,5项占45%。
3.2 考试设置
学生还在每门课程的第三周和第五周的中间时间提交了两门考试。每一场考试都有23道题,包含真假题、多项选择题、数字题和写作题。学生们有24小时的时间通过黑板提交试卷。一旦进入,学生有4个小时来完成考试,每个问题将随机出现一个时间。学生可以保存简历,但时间限制仍然适用。没有化妆品供应。在24小时窗口之后,黑板上的考试链接将失效。不久,考试就评分了,答案就写在黑板上。
4 实验概述
为了分析多重家庭作业尝试对学生成绩的影响,我们考虑了一个非常简单的自然实验,我们只改变了家庭作业的设置,但保持每门课程的其余方面完全相同。具体来说,第一个暑期班课程允许每个家庭作业尝试两次,而第二个暑期班课程只允许一次。在两次尝试的部分,学生将获得一个家庭作业,完成第一次尝试后,将收到关于他们的分数的信息,并指出他们特别遗漏了哪些问题。然后他们可以重新完成作业,每个问题以完全相同的顺序一次出现一个问题。这个分数是每次尝试的分数的最大值。在一次尝试的部分,学生将获得一个家庭作业,完成他们的唯一一次尝试后,将给出他们的分数。
虽然我们没有学生个人水平的数据,但我们认为这两个部分的学生比例相当。每一种功能都具有相同的最大容量,并且都是连续提供的。此外,学生注册通常比正式的教师名单早,从而最大限度地减少了学生系统地选择一名教师而不是另一名教师的顾虑。此外,在回顾了我们的课程名单后,没有学生在第二学期的暑期课上重复这门课程。最后,每个暑期课程的教学大纲只能通过黑板提供,因此一般公众是无法获取的。这意味着第二节课的学生不知道第一节课的另类家庭作业设置,因为他们无法获得教学大纲。同样,第一节课的学生也不知道第二节课的另类家庭作业设置,因为教学大纲还没有制定出来。
就概括性而言,我们认为我们的实验和分析可以准确地描述大多数四年制公立大学或学院的在线学生行为和评估,更具体地说,还可以描述商学院设置的经济课程。此外,我们认为这种类型的分析是重要的,因为在线课程的有效性和大量的作业选择和家庭作业管理系统的广泛使用。当然,在线学生群体可能与传统的课堂学生群体有所不同。然而,我们目前的分析可能对典型的以讲座为基础的课程使用家庭作业管理系统有定性意义。
5 经济框架和可验证的假设
为了预测多重作业尝试如何影响学生的成绩,我们考虑以下简单的框架,以获得可验证的假设。我们假设一个学生分配一定的时间在一项作业上,通过权衡边际效益和边际成本来达到理想的成绩。对于一个有代表性的学生来说,总时间和作业成绩之间的关系如图1所示。注意积极的关系。学生必须增加他们在作业上的总时间(即努力),以获得更高的作业分数。因此,我们把这种关系称为努力的供应。
在我们自然实验的背景下,我们考虑改变家庭作业尝试次数对一个有代表性的学生的家庭作业和考试成绩的影响。图2和图3说明了两个相关的案例。在图2中,允许第二次尝试做作业将努力的供应旋转到左边,因此,相对于只做一次尝试,允许学生在相同的水平上获得更高的家庭作业分数。继续考虑对考试成绩的影响,并保持所有其他因素不变,可以得出这样的结论:由于家庭作业的努力水平是不变的,当学生尝试两次做家庭作业时,他们的考试成绩应该是相同的。
假设1:与只做一次作业的学生相比,两次做作业的学生在家庭作业上的表现更好,作业的总工作量和考试成绩相同。
图3:
说明了另一种可能性。当第二次尝试时,成绩的供应将继续向左旋转,学生现在可以获得相同的固定家庭作业分数,但相对于只尝试一次时,总时间减少了。在某种程度上,花更多的时间在家庭作业转化为提高考试成绩,这就意味着一个学生尝试了两次家庭作业将获得较低的考试分数相对于只给了一次家庭作业。这就给出了第二个与之竞争的假设。
假设2:与只做一次作业的学生相比,做过两次作业的学生在家庭作业上的表现是一样的,家庭作业的总得分更低,考试成绩也更差。
最后,我们考虑两个家庭作业尝试如何改变一个有代表性的学生所面临的边际决策。图4展示了每个问题每次尝试所花费的时间和每个问题每次尝试的结果分数之间的关系。在决定分配多少时间给一个家庭作业问题时,学生权衡边际效益和边际成本。当一个学生有两次作业尝试的机会时,第一次尝试的边际效益相对于只有一次尝试的边际效益要低。相应地,有两次尝试的学生在每道题上花费的时间更少,第一次尝试的得分也比只有一次尝试的学生低。因此,在保持所有其他不变的情况下,得出的结论是,与只给一次尝试的学生相比,有两次尝试的学生花费的时间更少,第一次尝试的成绩更差。这就是我们的第三个也是最终的假设。
假设3:与只做一次作业的学生的总时间和成绩相比,做两次作业的学生花的时间更少,第一次作业的得分更低。
6资料及相关变数
为了验证我们的假设,我们使用了第一届和第二届暑期课程的作业和考试成绩数据。在一次作业尝试部分,我们有每个学生每次作业花费的总时间和作业分数的数据。对于两个家庭作业尝试部分,我们有每个学生每次尝试花费的时间和家庭作业分数的数据。当汇总时,我们得到在两个尝试部分中每个学生在每个作业上花费的总时间。此外,在每次尝试的家庭作业分数取最大值后,我们在两次尝试部分获得每个学生每个家庭作业的家庭作业分数。最后,为了检验考试成绩,我们重新计算了学生的考试成绩,只根据多项选择题、真假题和数字题来计算,以避免教师对每次考试的论文题的评分差异。
检验我们的前两个假设的关键变量是平均家庭作业分数,平均家庭作业总时间和两次和一次尝试的平均考试分数。具体来说,我们对每个家庭作业和考试的两个和一个尝试部分的平均家庭作业分数、平均总时间和平均考试分数的差异进行统计推断。为了检验我们的第三个假设,我们感兴趣的变量是两个尝试部分在第一次尝试上花费的平均家庭作业分数和时间与一个尝试部分花费的家庭作业分数和总时间。我们对每个家庭作业的第一次尝试的两个尝试部分花费的平均时间与第一次尝试部分花费的总时间的差异进行统计推断。类似地,我们还对每个家庭作业的两次尝试部分的第一次尝试的平均家庭作业分数与一次尝试部分的平均家庭作业分数的差异进行统计推断。
为了将我们的数据和提出的统计检验与我们的经济框架联系起来,我们使用一组基准来检验我们的每一个假设。对于第一个基准,与我们的第一个假设一致的统计证据包括以下三个发现。首先,一个发现支持拒绝零假设的右尾检验的平均家庭作业分数之间的差异,在每个家庭作业作业两次和一次尝试部分。第二,一个发现支持拒绝零假设的双尾检验的平均总时间花费在两个和一个尝试部分为每个家庭作业。第三,一个发现支持拒绝零假设的双尾检验的平均考试成绩的差异,在两个和一个尝试的部分,以及每个考试。
对于第二个基准,与我们的第二个假设一致的统计证据包括第一个发现,支持拒绝零假设的双尾检验的平均家庭作业分数之间的差异,每个家庭作业作业的两次和一次尝试部分。第二,一个发现支持拒绝零假设的左尾检验的平均总时间花费在两个和一个尝试部分的每个家庭作业。第三,一个发现支持拒绝零假设的左尾检验的平均考试成绩的差异,在两个和一个尝试的部分,每个考试。
最后,对于最后的基准,统计证据符合我们的第三个假设包括第一次拒绝零假设的发现支持left-tailed测试之间的差异意味着时间的第一个作业的尝试两个尝试部分和一次部分的总时间为每个作业。第二,一个发现支持拒绝零假设的左尾检验的平均家庭作业分数之间的第一次家庭作业尝试的两个尝试部分和唯一的尝试的家庭作业的每一个作业.
7 结果
7.1 评估两个家庭作业尝试的效果
表1显示了两个和一个家庭作业尝试部分的家庭作业分数和花在家庭作业上的时间的平均值差异的一尾和双尾统计检验。就A组的家庭作业表现而言,从定性和统计上看,两个尝试部分的家庭作业表现更好,在10个家庭作业中差异在4到15个百分点之间。right-tailed测试的统计上,零假设的差异意味着两者之间的作业分数和一个尝试部分超过0被拒绝在10%显著性水平的9 10作业和拒绝在5%显著性水平的8 10作业。最弱的统计结果的p值仍然是0.17,并且适用于本课程最后的家庭作业。因此,这些结果提供了令人信服的证据,允许两个以上的家庭作业尝试提高平均家庭作业表现。
对于花在家庭作业上的时间,在两个和一个家庭作业尝试部分之间花费在每个家庭作业的平均总时间的差异的一个和两个尾统计测试显示在表1的面板B中。定性地说,两个作业尝试部分相对于一个作业尝试部分花在家庭作业上的总时间更多。然而,一个右尾检验的零假设,在平均总时间花费在家庭作业之间的两个和一个尝试部分超过零被拒绝在10%的显著性水平,只有3个作业。此外,对于大多数作业来说,震级一般都比较小,在0.5到12分钟的范围内,有利于两次尝试。
值得注意的是,两个尝试部分的总作业时间并没有根据两个可能的现象进行调整。第一个是学生在第一次尝试后记录信息的时间,比如他们回答的问题正确与否。第二个是学生第二次重新做作业所需要的时间,也就是说,简单地浏览作业,重新回答他们知道第一次做对的问题。最后,每个问题的平均时间差异在-。37到1.22分钟,如panel c所示。因此,我们认为这些结果表明,允许两相对一的作业尝试很可能不会以任何有意义的方式增加花在作业上的总时间。
关于考试成绩,表2显示了两次和一次家庭作业尝试部分的平均考试成绩的差异。对于每一项考试,两个部分的平均考试成绩的差异非常小。第一次考试的区别是-。23个百分点,在统计上与零没有区别。第二次考试的差异是0.20个百分点,在统计上与零没有区别。第二次考试的差异是
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[604652],资料为PDF文档或Word文档,PDF文档可免费转换为Word