查看原文
其他

“来”读书 | 第三期: 设计听力测试的实用方法

杨吕娜 外研测评 2022-04-24

“来”读书 本期主笔 :杨吕娜


北京师范大学外文学院外语测试与评价研究所博士生,加拿大女王大学访问学者。目前主要研究方向为听力测评。参与国家社科基金项目等多项研究课题,在《外语测试与教学》等期刊上发表论文数篇,多次在世界应用语言学大会(AILA)、国际语言测试年会(LTRC)等国际会议上发言。






听力理解能力测试领域一直受到研究者们的热切关注,本书是继 Assessing Listening (Buck, 2001) 与 Examining Listening: Research and Practice in Assessing Second Language Listening (Geranpayeh & Taylor, 2013) 之后,听力理解测试领域的又一重要著作。


本书为听力测试任务的设计提供了系统的方法。全书共七章。作者 Rita Green 在第一、二章中介绍听力的本质、测试细目表的重要性,接着在第三章至第五章对基于听力音频(sound file)的测试任务的设计方法及其相关的议题进行探讨,最后第六章和第七章介绍了试测和数据分析的作用、测试分数的报告和分数线的划定方法。


第一部分


第一章作者从宏观上介绍测试开发者在研发听力任务时需要考虑的方面。测试开发者需要关注在实际听力活动中涉及的过程,口头语言与书面语言的差异,以及造成听力困难的原因。在本章结尾,作者对听力测试的重要性和必要性进行探讨,并向读者展示了15个测试研发的基本环节。


第二章作者就测试细目表在界定测试构念和对评价考生表现的条件进行描述时的重要作用进行讨论。作者指出测试细目表从测试研发伊始直至最后研发阶段,都举足轻重,而且细目表的研发是一个循环往复的过程。


第二部分


第三章至第五章是本书最精彩的部分。


在第三章,作者提出了研发听力任务的出发点是听力音频而非听力文本。作者介绍了听力任务研发的核心方法——文本映射(textmapping)。该方法的流程将帮助测试任务研发者确立听力音频使用的适当性。文本映射涉及对一个听力文件意义共同构建的系统过程。这需要基于测试研发者对同一听力音频意义达成的共识,绝非仅仅依赖于一个研发者的理解。基于听力音频研发任务的方法可以避免研发者只是依赖静态的文本材料,为研发者提供发音、语速、时间和信息冗余程度等信息。文本映射的方法包含对一个或多个听力音频材料主旨信息的文本映射(textmapping for gist)、对具体信息和重要细节的文本映射(textmapping for specific information and important details)、对主要观点和支持性细节的文本映射(textmapping for main ideas and supporting details),适用于研发探测不同听力行为和理解能力的任务。作者非常详细地介绍了每一类研发任务涉及的具体流程,对听力任务的研发实践非常具有指导意义。下面以主旨信息的文本映射为例,简要展示相关流程。


▲ 准备一个适合主旨任务的音频材料,在听第二遍时写下你的主旨映射信息。


▲ 请三名以上未听过该录音的人员,对其进行信息映射的培训,检查其对“主旨”的认识。需要提醒他们的是在听的时候不能写任何相关信息,录音只播放一遍,在所有人都完成前保持安静,尽量使用 14-20 词表达主旨(根据录音长短确定具体词数),但不少于 10 词。


▲ 简要介绍录音的背景,防止过多的信息影响参与人员的理解。录音播放一遍之后,预留足够的时间写下主旨信息。


▲ 在全部人员完成主旨信息的撰写后,请其检查写下的词数,保证符合以上提到的要求。逐一请参与人员读出其写下的主旨信息。


▲ 参考每一条主旨信息以初步确定录音是否适合进行主旨信息的考查。如果有达成一致的信息时,请将该信息记下。


▲ 在文本映射记录表中记录信息映射的结果,收集并确定所有的主旨信息。


▲ 选择合适的测试方法,开始测试任务的进一步研发。


第四章作者介绍了文本映射完成后,研发一个听力任务所需要经历的其它研发流程。相关的流程包括对任务特征识别表(task identifier)的完善、任务指导语的撰写、测试方法的选择、听力录音播放的次数、任务题量、任务呈现、实施形式和评分、测试任务命题指南的研发以及任务质量评审与修订。


第五章中作者为读者展示了不同背景与情境下对不同语言水平学生听力理解能力进行测试的优秀听力任务。作者从任务指向的听力行为、测试方法和目标群体能力水平三个维度对八个不同的听力测试任务进行评价。


第三部分


第六章作者对为什么要进行试测,如何进行试测,试测结果的解读以及对测试任务进一步的修改进行阐述。涉及的相关议题有试测的时间、实施指南、试测反馈的收集方法、评分以及试测数据的分析和解读等。


第七章作者对测试分数的汇报及及格分数的设定进行说明。介绍了分数报告时需要关注的构念问题,不同技能的权重,基于标准或基于常模方法的选择原因。作者详细说明了标准划定的的方法。





语言测试学作为应用语言学的重要分支,近年取得了长足的发展,新书新著层出不穷。关注国内外研究的最新进展,站在学科的最前沿对于每位研究者和教师而言至关重要。如何实现这一目标?有意识地全面提升语言评价素养无疑是最有效的途径。语言评价素养不仅包括理论知识、专业技能、原则概念,也包括个人信念和态度以及社会文化价值观等(如下图 Taylor, 2013)。



针对语言测试学进行研究讨论的 “来”读书 现在已经走到了第三期!每两周,来自北京师范大学外国语言文学学院的 林敦来副教授 都会带领他的阅读小组向读者推荐国内外语言测试学方面的最新著述,与同道分享学习心得。“来”读书不是书评, 更不是广告,它是你了解语言测试学最新发展动向的窗口,每月两期,送上新鲜的语言测评新动向!


直达来读书第一期:“来”读书 | 第一期:混合方法研究在语言评价领域的运用


直达来读书第二期:“来”读书 | 第二期:少儿英语学习者的语言能力评价

 与 来 有约


不论你对语言测评有什么想法,都可以通过留言的方式与我们互动!将来更有机会和林老师面对面交谈!有什么话想对林老师说?有什么让你烦恼的测评问题想问林老师?还是有什么压箱底的好书想推荐给业界同仁?

本期的“来”读书就到这咯,让我们下期再见!


长按识别二维码关注 “外研测评”


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存