查看原文
其他

学术观点 | 中国博士学位论文摘要句法复杂度研究

点击蓝字关注我们


八万学者关注了语言学通讯



中国博士学位论文摘要句法复杂度研究 


宋瑞梅 汪火焰 

武汉大学外国语言文学学院;山东商务职业学院商务外语系 


摘要:句法复杂度是衡量二语学习者学术写作语言表现的重要指标。现有研究对大学生之外更高阶段中国英语学习者的句法复杂度关注较少。本研究以美国博士学位论文摘要为参照, 采用L2SCA提供的7项指标, 对比研究了中国教育技术专业与语言学专业博士学位论文摘要的句法复杂度。双因素秩次方差分析结果显示, 中国博士生的平均子句长度和并列句比例显著高于美国博士生, 但从属子句比例显著低于后者, 学科差异程度不大。国别和学科对每子句中的复杂名词性短语数量具有交互效应。本研究建议学术英语写作训练中重视句法多样性的显性教学。

关键词:国家社科项目 ;炼题 ;符号学 ;形义互证 ;语用观照

学习文献: 博士学位论文摘要; 句法复杂度; 二语学习者; 学术写作; 

 基金项目:教育部高等教育司“基础学科拔尖学生培养试验计划”研究课题“拔尖人才计划英语语言与文化教学专题研究” (20160403); 山东省社会科学规划研究项目“高职公共英语跨文化教学模式研究” (14CWXJ72); 

学习文献:宋瑞梅,汪火焰.中国博士学位论文摘要句法复杂度研究[J].解放军外国语学院学报,2019,42(01):84-91.   

作者简介: 宋瑞梅, 女, 山东邹城人, 讲师, 博士研究生, 研究方向为学术英语写作;汪火焰 (1961-) , 男, 湖北武汉人, 教授, 博士, 博士生导师, 研究方向为应用语言学和跨文化交际。

推荐阅读:

科研助力 | 学术研究方法网课集锦

学术观点 | 2020年第1期《学术文摘》

学术观点 | 雷蕾:中国英语学习者学术写作句法复杂度研究




0.引言



句法复杂度常用于描述学习者语言产出、评估语言水平及测试语言发展 (Norris&Ortega2009) , 是指说话者或写作者产出的句法形式的复杂程度及范围或多样性 (Ortega 2003;Lu2011) 。传统的写作句法复杂度测量指标涉及产出长度与从属结构密度 (Hunt 1965;WolfeQuintero et al.1998;Ortega 2003) 。鉴于句法复杂度构念的复杂性, Norris&Ortega (2009) 呼吁囊括从属结构、整体句子复杂度以及短语结构等多维度测量指标。Biber et al. (2011) 建议使用复杂名词短语衡量学术写作语言的发展。在该理念下, 研究者们考察了中国大学生写作文本的句法复杂度 (Lu 2011;Ai&Lu 2013;徐晓燕等2013) , 对更高阶段中国英语学习者学术写作语言特点的关注有限。为数不多的研究也侧重语言学硕、博士学位论文正文 (雷蕾2017) , 没有考察学位论文摘要的句法复杂度。

学位论文摘要是学术成果传播的重要筛选工具 (Huckin 2001) 。作为学术体裁, 摘要中专业词汇和复杂名物化结构的比重可能不低 (Lei&Yan 2016) 。对外语写作者和新手作者而言, 摘要写作是一项挑战。考察博士学位论文摘要的句法复杂度是否存在国别和学科差异, 便于我们了解中国博士学位论文摘要写作的整体句法特征和潜在差距, 为摘要等学术英语写作教学提供一定的依据。






1. 研究背景



1.1 句法复杂度测量指标研究

句法复杂度的传统测量指标是子句和T单位 (Biber et al.2011) 。子句为带有主语与限定动词的结构, 包括独立句和定语、状语和名词性从句等从属子句 (Hunt 1965) , 即任何主谓句法结构 (秦晓晴、文秋芳2007) 。T单位是“包含有一个主句, 以及附加和嵌入的所有从句和非从句结构的不可分割的最小单位” (秦晓晴、文秋芳2007:16) 。T单位最初用于考察儿童母语写作的句法成熟度, 如Hunt (1965) 认为C/T (每T单位中子句数量) 、W/C (每子句中单词数量) 和W/T (每T单位中单词数量) 是测量写作句法成熟度的最可靠指标。

C/T与DC/C (从属子句比例) 被Wolfe-Quintero et al. (1998:119) 列为测量语法复杂度发展的最佳指标, 但它们究竟能否有效测量写作的句法复杂度似乎存在争议。如C/T无法区分从属子句的类型 (Rimmer 2006:507-508;Kyle 2016:12) , 因此无法揭示句法多样化程度。Beers&Nagy (2009) 发现C/T与中学生记叙文和议论文的成绩分别呈正负相关, 可见, 采用C/T指标时需规避体裁的影响。就DC/C而言, Biber et al. (2011) 指出子句复杂度是口语语篇的特征, Bulté&Housen (2014) 却发现, 学习者写作的人工评分与DC/C呈显著正相关, 表明DC/C仍是人工评审写作质量的重要参考。

Biber et al. (2011) 提出学术写作中各类从句的功能会逐渐由非限定动词和介词短语实现, 最终发展为嵌套了复杂修饰成分的名词短语。受此启发, 不少研究者考察写作句法复杂度时都涵盖了名词短语复杂度 (Lu 2011;Ai&Lu 2013;Crossley&McNamara 2014;雷蕾2017) 。

除了句法复杂度构念的改进 (Norris&Ortega 2009) , 句法复杂度分析软件的开发也推进了实证研究的开展。如二语句法复杂度分析器 (L2SCA) (Lu 2010) 可自动计算名词短语复杂度在内的14项指标。Lu (2011) 测试了《中国学生英语口笔语语料库》中3554篇有效语料, 发现10项指标能够区分学习者不同学年句法结构的发展。这10项指标亦被用于对比学习者与本族语者句法复杂度的研究 (Ai&Lu 2013;Mancilla et al.2017;雷蕾2017) 。

1.2 中国英语学习者二语写作的句法复杂度研究

针对中国英语学习者二语写作句法复杂度的研究已有不少重要发现。Ellis&Yuan (2004) 采用C/T和不同时态、情态及语态的动词形式总量为测量指标考察了准备条件对42名英语专业学习者记叙文写作的影响。秦晓晴、文秋芳 (2007) 系统地考察了中国英语专业学习者写作的句法复杂度。他们发现学习者的T单位长度与子句长度随年级呈线性增长, 这在鲍贵 (2009) 与Lu (2011) 中得到证实。与本族语者相比, 中国英语专业大学生的子句、T单位及句子长度显著偏低 (Ai&Lu 2013) , DC/C亦然 (鲍贵2009;Ai&Lu 2013;徐晓燕等2013) 。类似差异在中美语言学专业硕士生写作中依然存在 (雷蕾2017) 。此外, 研究者们还采用产出长度和单位密度相关指标考察了语言水平 (鲍贵2009, 2010;纪小凌2009) 和写作条件 (曾祥敏2011) 对英语专业学习者限时议论文句法复杂度的影响, 发现产出长度与议论文成绩显著正相关 (杜慧颖、蔡金亭2013) 。

对非英语专业学习者写作句法复杂度的考察也有不少发现。如赵秀凤 (2004) 对比研究了工科博士生与工科大学生作文中名词短语的结构特征, 发现前置修饰成分多于后置, 后置修饰成分以定语从句为主, 短语稀缺。赵俊海、陈慧媛 (2012) 采用T单位、从属子句、非限定动词及衔接成分等4项指标抽样考察了低分组与高分组六级作文, 发现从属子句作为学习者写作句法复杂度发展测量指标的敏感度较低, 表明高分组学习者不一定多用从属子句。

综上, 先前有关中国英语学习者写作句法复杂度研究的群体以大学生尤其是英语专业大学生为主, 对更高级别英语学习者的关注较少, 对比研究不同专业英语学习者写作句法复杂度的研究更少。其次, 先前研究多以限时写作的议论文为主, 对非限时学术写作的关注有限。

鉴于此, 本研究将以美国博士学位论文摘要作为参照, 对比考察中国博士学位论文摘要的句法复杂度。

1.3 研究问题

本文的具体研究问题如下:

1) 中美博士学位论文摘要的句法复杂度是否存在显著差异?

2) 不同学科博士学位论文摘要的句法复杂度是否存在显著差异?

3) 不同国别及学科博士学位论文摘要的句法复杂度是否存在显著差异?






2. 研究设计



2.1 语料选取

本文选择教育技术与语言学博士学位论文摘要作为考察对象。原因有二:一是两个学科都与英语教学关系密切, 前者的开发和应用可改善英语教学的外部环境, 后者的研究成果可能会更新英语教学理念;二是本文研究者对两个学科内容相对比较熟悉, 能更好地分析学科博士论文摘要的内容。通过中国知网下载上述学科中国博士学位论文摘要各100篇, 通过ProQuest学位论文全文数据库下载美国博士学位论文摘要各100篇, 时间均为2011~2017年。中国博士论文摘要均来自中国大陆高校。由于时间段、学科、样本量等限制, 筛选美国博士生语料时, 排除了中国留学生的摘要, 但可能涵盖了其他非英语本族语者的摘要。

所有摘要经过格式转化, 去除标题、关键词后存为纯文本文档, 建成4个小型语料库。语料库具体信息见表1。

由于句法复杂度测量的是独立文本中产出单位的平均长度或一种句法结构的出现频次与另一种句法结构频次的比值 (Ai&Lu 2013) , 4个语料库的库容差异不会影响本研究的信度。

2.2 数据处理工具与句法复杂度测量指标的选取

本研究采用L2SCA (Lu 2010) 和SPSS 22.0作为数据处理工具。L2SCA自开发以来已被广泛应用于多项研究 (如Ai&Lu 2013;Lu&Ai 2015;Mancilla et al.2017;雷蕾2017) 。区分力强的10项指标中, Lu&Ai (2015) 发现从属子句使用量3项指标以及复杂名词性短语数量两项指标在7组母语不同的英语学习者之间均表现出同样的变化类型, 建议这两个维度可各选一项指标。因此, 根据测量指标要避免冗余、效度一致、构念独立的标准 (Norris&Ortega2009) , 本研究选取L2SCA提供的7项句法复杂度测量指标, 如下页表2所示。

2.3 数据分析

数据分析主要分4步进行。首先, 使用L2SCA分别计算4个库中句法复杂度各项指标的数值, 整理数据并导入SPSS 22.0。其次, 对7项指标的数据分别进行国别和学科的分组正态分布检验。Kolmogorov-Smirnov (柯尔莫哥洛夫-斯米诺夫) 检验结果显示, 除DC/C指标外, 其余6项指标的p值均小于.05的显著性水平, 说明中美及学科之间6项指标的数据均不呈正态分布。方差齐性检验显示DC/C的p值小于.05, 说明方差非齐性。再次, 根据第二步检验结果, 对所有数据进行双因素秩次方差分析即Scheirer-Ray-Hare检验, 并对具有国别和学科差异的指标进行事后检验。最后, 汇报检验结果, 进行分析与讨论。






3. 结果



7项句法复杂度测量指标的双因素秩次方差分析 (Dytham 2011:175-177;申希平等2013) 结果汇报如下:MLC指标存在显著的国别差异, H (1, 399) =33.64, p<0.05;学科差异不显著, H (1, 399=0.01, p=0.944;国别与学科的交互效应达到显著性水平, H (1, 399) =6.90, p<0.05。MLS指标的国别差异不显著, H (1, 399=0.01, p=0.944;学科差异亦不显著, H (1, 399) =3.10, p=0.079;国别与学科的交互效应未达到显著性水平, H (1, 399) =1.55, p=0.214。MLT指标的国别差异显著, H (1, 399) =6.67, p<0.05;学科差异显著, H (1, 399) =5.57, p<0.05;国别与学科的交互效应未达到显著性水平, H (1, 399) =1.12, p=0.291。DC/C指标的国别差异达到显著性水平, H (1, 399) =105.49, p<0.05;学科差异也达到显著性水平, H (1, 399) =15.73, p<0.05;但国别与学科的交互效应不显著, H (1, 399) =1.99, p=0.158。CP/C指标的国别差异显著, H (1, 399) =28.06, p<0.05;学科差异未达到显著性水平, H (1, 399) =1.81, p=0.178;国别与学科的交互效应未达到显著性水平, H (1, 399) =1.39, p=0.238。T/S指标存在显著的国别差异, H (1, 399) =30.59, p<0.05;学科差异不显著, H (1, 399) =0.79, p=0.374;国别与学科的交互效应亦不显著, H (1, 399) =0.16, p=0.689。CN/C指标的国别差异达到显著性水平, H (1, 399) =17.74, p<0.05;学科差异未达到显著性水平, H (1, 399) =2.94, p=0.086;国别与学科的交互效应达到显著性水平, H (1, 399) =5.06, p<0.05。

换言之, 除MLS指标外, 其余6项指标均存在显著的国别差异, MLT和DC/C指标的学科差异显著, 国别与学科对MLC和CN/C指标具有显著的交互效应。

使用Mann-Whitney U检验方法对具有国别差异的指标进行事后检验并计算效应量, 结果如下:MLC指标方面, 中美博士生的平均秩次分别为234.03和166.97, U=13294.50, Z=-5.80, p<0.001, r=0.29;MLT指标方面, 中美博士生的平均秩次分别为185.57和215.43, U=17015, Z=-2.58, p=0.010, r=0.12;DC/C指标方面, 中美博士生的平均秩次分别为141.14和259.86, U=8127.50, Z=-10.27, p<0.001, r=0.51;Cp/C指标方面, 中美博士生的平均秩次分别为231.12和169.88, U=13875.50, Z=-5.30, p<0.001, r=0.27;T/S指标方面, 中美博士生的平均秩次分别为232.32和168.68, U=13636.50, Z=-5.53, p<0.001, r=0.28;CN/C指标方面, 中美博士生的平均秩次分别为224.85和176.15, U=15130.50, Z=-4.21, p<0.001, r=0.21。

使用Mann-Whitney U检验对具有学科差异的指标进行事后检验并计算效应量, 发现教育技术与语言学专业博士生MLT指标的平均秩次分别为186.86和214.14, U=17272, Z=-2.36, p=0.018, r=0.12;教育技术与语言学博士生DC/C指标的平均秩次分别为177.58和223.42, U=15415.50, Z=-3.97, p<0.001, r=0.20。

根据Cohen (1988) 的标准, r值为0.1、0.3、0.5时分别对应小、中、大效应量 (转引自秦晓晴、毕劲2015:320) , 可知中美博士生DC/C指标的实际差异较大。其余指标的国别差异或学科差异尽管达到了显著性水平, 但r值均小于0.3, 效应量不到中等, 表明实际差异不算太大。

根据申希平等 (2013:914) , 对国别与学科交互效应显著的MLC与CN/C指标的平均秩次进行了样本间两两比较和效应量计算。发现中国教育技术专业博士生MLC指标的平均秩次显著高于美国教育技术和语言学专业博士生 (p<0.001) , r分别为0.42和0.30, 中国语言学专业博士生MLC的平均秩次高于美国教育技术专业博士生 (p<0.001, r=0.29) 。在CN/C指标方面, 中国教育技术专业博士生平均秩次显著高于美国同专业博士生 (p<0.001, r=0.32) , 但中美语言学博士生之间不存在差异;美国教育技术专业博士生CN/C平均秩次显著低于美国语言学博士生 (p<0.05, r=0.20) , 但中国两专业博士生之间不存在差异。






4. 讨论



本文旨在考察中美两个学科博士学位论文摘要的句法复杂度是否存在显著差异。根据双因素秩次方差分析及事后Mann-Whitney U检验结果, 有三点发现。第一, 中国博士生在平均子句长度、每子句中并列短语数量、每子句中复杂名词性短语数量以及并列句比例等4项指标方面显著高于美国博士生, 效应量接近中等;在平均T单位长度和从属子句比例方面显著低于后者, 分别对应小、大效应量;平均句子长度方面无差异。第二, 学科差异仅体现在平均T单位长度和从属子句比例方面, 教育技术专业低于语言学专业, 均为小效应量。第三, 国别与学科在每子句中的复杂名词性短语数量方面存在交互效应, 表现为:1) 中国教育技术专业博士生显著高于美国同专业博士生, 效应量中等, 但中美语言学专业博士生不存在差异;2) 美国教育技术专业博士生显著低于美国语言学专业博士生, 效应量小, 中国两专业博士生不存在差异。

中国博士生的平均子句长度、每子句中并列短语数量与每子句中复杂名词性短语数量显著高于美国博士生, 这可能是前者与后两项指标呈显著正相关 (Lu 2011) 所致, 表明平均子句长度实际测量的是短语层面的复杂度 (Norris&Ortega 2009:561) , 可能是倡导将句子写长的教学效果的体现。同时, 中国博士生子句中复杂名词性短语数量较高可能与学术写作需要大量使用名词短语传递复杂信息的体裁特点有关 (Biber et al.2011) , 是语言发展高级阶段特征的体现 (Norris&Ortega 2009) 。

然而, 中国博士生并列句比例高于美国博士生这一发现似乎表明前者一定程度上依赖并列句或简单句实现学位论文摘要的语篇功能, 体现出句法发展初级阶段的典型特征 (Norris&Ortega 2009;Lu 2011;Ai&Lu 2013) , 这与学术写作正式概要的语言风格不符。高级阶段与初级阶段句法特征并置的这种特点似乎与Norris&Ortega (2009) 提出的学习者句法呈线性发展轨迹的假设不符。这可能与英语作为外语的教学环境有关, 学习者对口语语体和书面语体差别的认知不足。

中国博士生从属子句比例显著低于美国博士生这一结果可能表明中国博士生“对限定动词和非限定动词的句型控制” (徐晓燕等2013:272) 能力不如后者。这种能力差别与语言环境和语言的输入量不无关系。也可能由于中国博士生较多使用了并列句等其他语言形式, 并列句或简单句的多用会导致DC/C指标低 (徐晓燕等2013:272) , 句法结构的变化有限。再者, 由于从属子句比例模糊了从属子句的具体类型, 可能需要细化书面语与口语语篇中不同从属子句的指标 (雷蕾2017) , 方能更深入地考察从属子句比例差异的意义。

除了效应量较小的平均T单位长度和从属子句比例之外, 其他句法复杂度指标不存在学科差异, 原因可能如下。第一, 产出长度等不再是衡量高级二语学习者句法复杂度的有效指标。第二, 在学术研究国际化的大背景下, 博士生投入大量时间阅读英文文献或进行写作训练以融入学术话语共同体。大量的学术阅读和写作训练会促进学习者词汇和句法结构的附带习得 (Li&Schmitt 2009;Mazgutova&Kormos 2015) , 写作的句法复杂度也随之提升。第三, 鉴于学位论文摘要的重要地位和非限时写作的特点, 博士生会对摘要语言进行细致加工以符合学术话语共同体的规约, 致使学科之间句法复杂度的实际差异不大。

本研究还发现, 中国教育技术专业博士生的平均子句长度显著高于美国博士生, 且前者每子句中复杂名词性短语数量显著高于美国同专业博士生, 但中美语言学博士生之间无差异。这一结果似乎表明中国教育技术专业博士生在子句产出长度与子句中复杂名词性短语数量方面达到了高级水平, 甚至存在过度使用之嫌, 毕竟学习者过度使用名词结构是二语习得中的常见现象 (雷蕾2017) 。这也启示我们反思采用的句法复杂度测量指标能否有效捕捉高级学术写作的细微差异。第一, 增加补语或短语修饰语可增加平均子句长度, 但该指标无法揭示子句中具体的语言特征信息。第二, 鉴于复杂名词性短语的大量使用是高级学术写作的突出特征 (Biber et al.2011) , 有必要进一步考察博士生的名词短语复杂度, 如对形容词、物主代词、名词等前置修饰语以及定语从句、介词短语、非限定动词等后置修饰语的使用做更加细致的分类和比较, 但这种更加细化的名词短语复杂度是CN/C指标无法捕捉到的。不过, Kyle (2016) 开发的TAASSC句法分析工具在很大程度上解决了这一难题。它细分了名词短语依存成分的10种类型, 有助于更深入细致地考察名词短语复杂度。TAASSC也细化了子句层面复杂度的指标, 如用子句中直接依存成分的类型取代平均子句长度这一传统指标。因此, 本研究结果对于今后选择二语句法复杂度测量指标具有一定的启示意义。我们建议今后研究宜根据中国英语学习者的学习阶段、语言水平及写作任务等因素, 选取相应的句法复杂度测量指标。







5. 结论



本研究有以下三点发现。第一, 中美博士学位论文摘要在6项句法复杂度指标方面存在显著差异, 仅有从属子句比例差异达到很大程度, 表现为中国博士生显著低于美国博士生。第二, 博士学位论文摘要句法复杂度的学科差异不大。第三, 国别和学科在每子句中复杂名词性短语数量指标上存在交互效应, 效应量接近中等。

本研究对学术英语教学具有一定的参考意义。鉴于中国博士生的并列句比例与从属子句比例失衡, 学术英语写作教学中需鼓励学习者适当使用介词短语等语言资源整合并列句, 把控限定动词和非限定动词的比例, 重视句法多样性的显性训练。

需要指出的是, 本研究所选学科的性质并非截然不同, 可能有部分语料来自非英语本族语者, 也未考虑性别的潜在影响。鉴于母语背景 (Lu&Ai 2015) 和性别 (Mancilla et al.2017) 会影响写作的句法复杂度, 今后研究可考察更多学科、不同母语背景和性别比例均衡的博士学位论文摘要, 以检验本研究结论的适用性。




编者按


参考文献略。欢迎查阅知网或者《解放军外国语学院学报》2019年第1期纸质期刊了解详情。

本文编辑:上海理工大学 孙雨

本文审核:吉林大学  王峰

公众号外联:我们优先推广免费的学术会议、讲座、研修等项目。收费项目与商务合作需支持劳务费,请联系dianzishu@126.com 商谈。



量化研究三门网课推荐 欢迎扫码学习


欢迎加入语言学通讯读者群,添加时请自报实名,单位和研究方向

语言学及应用语言学加群联系人:sflsy0803 孙老师

文学与翻译加群联系人:Nicole2397471433 李老师

继续为各位提供有益的学术资讯

长按二维码赞赏语言学通讯

欢迎加入语言学通讯读者群,添加时请自报实名,单位和研究方向

语言学及应用语言学加群联系人:sflsy0803 孙老师

文学与翻译加群联系人:Nicole2397471433 李老师

 推 荐 阅 读 

学术会议 | “新媒体、自媒体时代的话语分析”学术研讨会 会议(2020年7月3-5日)

科研助力 | Bloomsbury出版社语言学书籍征订(中国官方代理)

科研助力 | 长江学者关于国家社科基金申报的建议

科研助力 | 国家社科基金项目10讲:从选题到结项

科研助力 | 怎样提高国家社科基金项目申报的中标率?

期刊征订 | John Benjamins旗下语言学电子期刊征订(中国官方代理)

新著推荐 | 束定芳等:Cognitive Linguistics and the Study of Chinese

读书小札 |  迈克尔·图兰《短篇小说叙事进程:语料库文体学方法》

文学悦读| 从《百家讲坛》到《中国诗词大会》:再听中南大学杨雨教授谈论古诗词

文化解读 | 郑培凯教授:中国戏曲文化解读

科研助力| 如何理解政治?25部经典重识西方文明

文学悦读 | 诺奖作家写作时,我们也以某种方式参与其中?

文学研究 | 走近文学大师 :陈众议、陆建德等11位专攻学者权威解读

文学悦读 | 北大陈平原教授主讲《中国人的精神与命运》

文化解读 | 中国人缺乏哲学教育?那你可想错了

文化解读 | 福柯、海德格尔、爱因斯坦,他们思考的话题,其实与你息息相关

文化解读 | 复旦大学葛剑雄教授《不一样的中国史》 

八万学者关注了

语言学通讯

科研助力|学术观点|专著推荐|期刊动态|教师研修|招贤纳士|博士招生|读书小札

请留下你指尖的温度

让太阳拥抱你

记得这是一个有情怀的公众号

点“在看”给我一朵小黄花


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存