案例研究:语言语境线索对阅读中分词的影响

与英语等字母语言不同,中文文本不使用空格来划分单词边界。这种独特的特征要求中国读者依靠其他内部线索和上下文信息将连续字符组合成有意义的单词,这一过程被称为分词。研究论文,“词汇和句子级语境线索对中文分词的影响”解决了一个基本问题:中国读者如何分词?
先前的研究已经确定词频、相对词位和句子上下文是中文分词的重要因素。然而,词汇级语境线索的作用——目标词和前一语境中单词之间的语义关系——以及词汇级和句子级线索之间的相互作用尚不清楚。
本研究旨在调查中国读者是否利用词汇级语境线索进行分词,并探讨在阅读过程中使用词汇级和句子级线索的相对时间。
阅读歧义句的眼动追踪方法
该研究采用了SR研究EyeLink 1000眼动仪,以1000 Hz的采样率记录参与者在阅读包含重叠歧义字符串(OAS)的中文句子时的眼球运动。OAS通常包含三个字符:前两个组成一个单词,后两个组成另一个单词。
分析了几个关键的眼球运动指标:
- 首次注视持续时间(FFD):首次凝视特定区域的持续时间,表示早期处理。
- 第一遍阅读时间(FP):在前进之前,对一个区域的所有注视的总持续时间,反映了最初的处理和理解。
- 过去时间(GP):在一个区域中花费的总时间,直到越过其右边界,表示处理该区域中的信息并越过它所需的努力。
- 回归输出概率(RO):眼睛从当前区域移回文本早期部分的可能性,通常表示处理困难或重新评估。
- 第二遍阅读时间(SP):第一遍后对某个区域的注视累积持续时间,反映了重读或更深层次的处理。
- 概率回归(RI):眼睛返回到先前读取区域的机会,也表明处理挑战或澄清需求。
语境线索对歧义句分词的影响
这些措施使黄和李能够观察到词汇和句子层面的语境线索如何影响读者对汉语句子中OAS的即时和后续处理。例如,在某些条件下,较长的Go Past时间和较高的Regression Out概率表明处理难度增加或需要重新分割,为线索利用的相对时间提供了经验支持。
如果没有眼动追踪提供的精确性和细节,在快速阅读过程中很难辨别这些上下文线索之间的动态相互作用。传统的行为测量,如对理解问题的反应时间,只能提供对理解最终产物的粗略理解,而不是分词中涉及的复杂的、每时每刻的认知操作。因此,眼动追踪数据对于揭示中国读者确实利用词汇级语境线索是不可或缺的,即使对于正确的分词来说不是绝对必要的,而且这些线索的处理早于或与句子级语境线索同时进行。这突显了眼动追踪在促进我们对复杂阅读过程的理解方面不可或缺的性质。
有关眼动追踪如何帮助您的研究的信息,请查看我们的解决方案和产品页面或联系我们。我们很乐意为您提供帮助!