案例研究:通过NDRT和WIAT-II理解测试预测眼球运动

“叮当谬误”是指一种有缺陷的假设,即共享相似名称的测试必须测量相同的底层结构。在他们最近的研究论文中,“阅读理解测试中的叮当声谬误,”Lee、Godwin和Drieghe(2024)提供了阅读理解背景下的谬误的一个例子。该研究发表在《公共科学图书馆·综合》上,强调了两种常用的理解测试之间的显著差异,即Nelson Denny阅读测试(NDRT)和Wechsler个人成就测试(WIAT-II),特别是在预测不同理解需求下熟练成年读者眼球运动模式的能力方面。
眼动追踪阅读理解
这项研究的一个关键要素是使用SR研究EyeLink 1000眼动仪,为实时阅读策略提供了有价值的见解。通过记录参与者在理解任务中的眼球运动,研究人员可以观察到阅读行为的细微变化,如注视次数、平均注视持续时间和前向扫视长度。这些客观指标可以更深入地了解读者在面对更高或更低的理解要求时如何调整策略,以及理解能力的个体差异如何在阅读模式中表现出来。
这项研究涉及91名大学生,他们在阅读文章的同时记录了他们的眼球运动。参与者完成了两个实验模块——一个具有较高的理解要求,一个具有较低的理解要求。
Nelson Denny Reading Test Predicts Eye Movement Patterns
关键发现表明,虽然这两项理解测试都旨在衡量阅读理解能力,但只有NDRT是观察到的眼球运动模式的可靠预测指标。具体来说,NDRT的高分者随着时间的推移不断提高阅读速度,减少注视次数,延长扫视时间,在高和低理解要求下有效地调整策略。相比之下,NDRT得分较低的人在阅读速度和减少注视的能力方面达到了上限,尤其是在理解要求较低的情况下。
至关重要的是,WIAT-II理解测试在眼动模式方面没有显示出类似的预测能力。这种差异突显了叮当声谬误:尽管这两项测试都被标记为“阅读理解”,但它们似乎利用了不同的潜在技能,或者受到不同混杂因素的影响。
详细的眼动数据提供了阅读处理的精细视图,而传统的准确度评分无法单独提供。例如,眼动追踪数据显示,当理解要求较高时,读者通常会采取更“谨慎”的策略(更多的注视、更长的持续时间、更短的扫视),而当要求较低时,他们会采用更“危险”的策略。通过眼动指标量化的阅读行为的这些微妙变化,为读者如何实时调整认知努力提供了直接证据。
这项研究强调了仔细选择理解测试进行研究的至关重要性,特别是在调查熟练的成人阅读和眼动行为时。眼动追踪技术提供的精确和客观的数据是发现这些差异的基础,证明了它在促进我们对阅读理解和个体差异的理解方面的重要作用。
有关眼动追踪如何帮助您的研究的信息,请查看我们的解决方案和产品页面或联系我们。我们很乐意为您提供帮助!