学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 语言学论文 > 普通语言学论文

基于语料库对英汉高频复合词词频与语义透明度分布对比

来源:学术堂 作者:韩老师
发布于:2014-11-20 共5711字
论文摘要

  1. 引言

  复合词是指两个或两个以上具有相对完整概念意义的自由语素所组成的词。语义透明度是指词汇组成成分的语义在该词词义中的透明程度。因此复合词语义透明度是指“复合词的语义可以从其所组成的各个语素的语义推知的程度”( 王春茂、彭聃龄 1999: 267) 。如: 英语复合词 storybook,汉语复合词“课桌”,其词义在某种程度上都可以从组成该词的语素义中推断出来,因此复合词 story book 和“课桌”都具有一定的语义透明度。

  复合词的语义透明度在心理词典表征( mental lexiconpresentation) 和词汇语义研究中发挥着重要作用。从心理词典的表征过程来看,语义透明度的高低影响着大脑在加工该词时所承载的启动量( 王春茂、彭聃龄 2000:395) ,影响着复合词在大脑表征产出时的正确机率( Fehringer 2012:65-75) ,同时也决定着大脑在理解和表征该词时所使用的路径模式。从词汇语义的研究上看,词汇语义透明度的高低反映着构成语素义和整词语义的关系和紧密程度( 董于雯2011: 178-187) ,体现着语义词化和结构词化的发展过程( 李晋霞、李宇明 2008: 60-65; 方子纯 2013: 41-45) 。

  以往对于复合词语义透明度的研究关注于一种语言特点分析的多,关注两种不同类型语言对比的少。研究中以体现典型性复合词表征过程特征的多,针对体现常用复合词普遍性特征的少。即便偶有针对语料常用性的探讨,也因其研究方法相对传统、单一,而缺乏一定的科学性。我们认为无论是心理语言学还是词汇语义学研究,科学、客观的研究方法以及具有实际意义的语料或研究对象都是研究之关键。因此,本研究以语料常用、普遍性特征为出发点,运用社会科学统计软件 spss16.0,在自建的英汉复合词语料库的基础上,从整词频率( 简称“词频) 和语义透明度类型分布的角度对两种不同类型语言的高频复合词进行对比分析,以期回答下列问题:

  1) 英汉高频复合词的语义透明度分布类型具有哪些共性和个性特征?

  2) 英汉复合词的词频与语义透明度分布是否相关?

  2. 相关理论与研究现状
  
  2. 1 复合词语义透明度的划分

  语义透明度是一个连续统( Cruise 1991: 39) ,由完全透明到完全隐晦是一个逐步渐进的过程。对于复合词语义透明度的划分,研究者们更多的是根据语素义在词义中的体现程度来进行分类的。如 Libben ( 2003: 53) 等人将英语复合词的语义透明度逐级划分为完全透明型,隐晦—透明型,透明—隐晦型和完全隐晦型四类。符淮青( 1985: 22) 将汉语复合词语素义与词义之间的关系概括为: 1) 语素义直接地、完全地表示词义;2) 语素义直接地、部分地表示词义;3)语素义间接表示词义;4) 表词义的语素有的失落原义;5)语素义完全不表示词义五种类型。李晋霞、李宇明( 2008:60-65) 根据词义是否等于部分义之和将汉语复合词划分为完全透明、比较透明、比较隐晦和完全隐晦四种类型。本研究中,我们根据 Libben 等人的划分方法,遵循语素义在词义中的体现程度原则,同时为便于分析研究和操作,将研究中涉及的英汉高频1000 个复合词的语义透明度划分为3 类:完全透明型( Transparent-Transparent) ,也叫 TT 型,即复合词的语义可以全部或大部分从组成语素的语义中推断出来;半透明型( Partially-Transparent) ,也叫 PT 型,即复合词的语义只能从两个语素中的一个语素语义中推断出来; 完全隐晦型( Opaque-Opaque) ,也叫 OO 型,即复合词的语义无法从组成语素的语义中推断出来。

  2. 2 词频与语义透明度研究

  在心理词典表征的研究中,词频与语义透明度经常被研究者看作是判断大脑表征词汇工作过程的变量。如 Mok( 2009: 1039-1081) 在分析了汉语复合词的学习过程后,认为词频越高,其语义透明度则越高。而且,词频和语义透明度高的复合词,其构成语素语义的凸显性也很强。Pollatsek( 2005: 261-290) 以词频和语义透明度为变量,通过分析失语症患者语言产出的正确率,对芬兰语复合词的心理表征特点进行了研究,发现词频和语义透明度对失语症患者复合词的产出过程有明显的影响。在研究中,Mok 和 Pollatsek,为推断出心理词典表征过程的工作模式和路径,都运用了多种因素对复合词进行了操控。这种有选择地挑选典型复合词的研究方法虽可以反映出大脑在不同语义透明度情况下的工作状态,但也会让人错误地认为,大脑在日常工作中的表征状态理应如此。

  在词汇语义学研究方面,词频与语义透明度的研究多集中在对汉语复合词的分析上。研究者们往往通过设定语料封闭域,从判断复合词构成语素的语义与整词词义的关系,来研究常用、高频复合词的语义透明度分布情况。如,董玉雯( 2011: 178-187) 从《现代汉语频率词典》中依据词频,选取了500 个双音节复合词,运用数量统计方法分析了汉语常用类复合词语义透明度的分布类型。该研究虽对语义透明度和词频关系有所触及,但词频对语义透明度究竟会产生怎样的影响,不同类型语言中词频和语义透明度又体现了怎样的关系等方面的问题并没有进行深入的探讨。

  因此本研究拟从心理语言学和词汇语义学视角,通过定量和定性分析的方法将英汉高频复合词的语义透明度和词频关系进行关联与研究,以期为上述问题探寻答案。

  3. 数据搜集与整理

  本研究主要选择两种语言中含有双语素的复合词。研究中英语高频 1000 个复合词是从 Longman Dictionary ofContemporary English( 2004) 整理出的11521 条复合词中挑选而来。在这11521 条复合词中有名词、形容词、动词、副词、代词、介词等多种词性的复合词。我们选择了名词性复合词,因为其比例高达 75%,并且从构词方面来说,Algeo( 1991:73) 认为90%的新生复合词是名词,因此对名词复合词的研究具有一定的代表性和意义。为验证这些复合词的词频,我们参考了英语国家语料库中的词频统计。这 1000个复合词的词频从11433 到140 次不等,能够说明母语使用者经常接触使用的程度和范围,具有一定的普遍性。

  在选择汉语复合词时,我们参考了 A Frequency Diction-ary of Mandarin Chinese( 2009) 。该频率词典以 5 千万现代汉语语料库为基础,其文本选自现代口语、小说、新闻等材料,因此具有一定的权威性、时代性和普遍性。研究中我们依据词典中的词频选取了前1000 个高频双语素复合名词。

  同时,为确立所选复合词的词形与词性的一一对应关系,我们还参考了《现代汉语词典》( 第五版) ,对1000 个双语素复合词的词目语法类别进行了标注,力求做到以常用义所对应的常用名词词性为唯一的研究对象。

  4. 结果与讨论

  4. 1 英汉高频复合词的语义透明度分布根据语义透明度的划分,我们首先对英汉高频1000 个复合词的语义透明度进行了统计,发现英汉高频复合词语义透明度的类型分布很不均匀。TT 型即完全透明型复合词在两种语言中最多,分别占两种语言复合词总数的 57%和55.7%。OO 型即完全隐晦型复合词在英汉两种语言中所占数量最少,分别为 15.3%和 11%。这一结果与先前董于雯( 2011: 189) 对汉语常用复合词词义透明度的统计研究结果一致。我们观察到,在 TT 型复合词中,语义透明度构成类型主要有两类: 1) 词义 C = 语素义 A + 语素义 B; 2)词义 C =语素义 A = 语素义 B。其中第一种组合类型在两种语言中都存在,尤以英语复合词最为突出。如:lunchtime: the time in the middle of the day when peopleusually eat their lunch.lunch: a meal eaten in the middle of the day.time: minutes or hours etc.汉语复合词车主:拥有车子的人,车子的主人。

  车:陆地上有轮子的交通工具。

  主:物主。

  而第二种类型在所研究的英语复合词中没有出现,但在汉语复合词中占33%,如:

  朋友:泛指交谊深厚的人。

  朋:朋友。

  友:朋友。

  从心理词汇表征的过程来看,不管是语义组合 C =A +B 型还是 C = A = B 型,大脑对此类复合词进行语义提取时,都会借助两个组成语素的语义对复合词整词词义进行加工。若两个语素的语义完全透明,则减轻了大脑所需承载的负荷。大脑在提取语义信息后,不需经过任何“空间”、“方位”上的转换,直接译解信息,方便语言使用者间的交流。因此,从这个方面来看,TT 型复合词既符合语言使用的“经济原则”,又符合人类的认知规律,所以自然也就备受语言使用者的青睐,在两种语言的常用词汇中比例就会很高。

  PT 型复合词的语义不能完全从语素语义中推断出来。

  如: 英语复合词shotgun: a long gun fired from the shoulder that shootsmany small round balls at one time,used especially for killingbirds or animals.shot: when someone fires a gun,or the sound that thismakes.gun: a weapon from which bullets are fired.gun 与 shotgun 的复合词语义有重叠,但 shot 的语义与复合词 shotgun 的语义有所不同。

  汉语复合词抱歉:心中不安,觉得对不住别人。

  抱:用手臂围住。

  歉:觉得对不住人。

  语素“歉”与复合词抱歉语义有重叠,但“抱”的语义在复合词中发生了转变。因此上述两个复合词的语义透明度均为 PT 型。

  此外,我们还发现在两种语言的 PT 型复合词中都存在OT 型即语素 A 透明( T) + 语素 B 隐晦( O) 和 TO 型即语素A 隐晦( O) + 语素 B 透明( T) 。英语复合词是典型的右中心型复合词,即位置居右的语素对于复合词整词的语义、形态等方面都具有决定性作用。所以就英语 PT 型复合词来说,OT 型复合词的语义透明度要高于 TO 型复合词。如,OT 型复合词 shotgun 和 TO 型复合词 fire engine,shotgun 的右语素 gun 决定了该词的语义范畴,其本身为透明型语素,因此提升了复合词整词的透明度。而 TO 型复合词 fire en-gine 的右语素 engine 的语义隐晦,所以自然就降低了该词的语义透明程度。与英语不同的是,Huang( 1998) 在分析了《现代汉语词典》24,000 条双音节复合词后,提出汉语复合词的中心语素既非左亦非右,属无中心型复合词,因此任何一个组成语素都不能完全决定复合词在语义、形态方面的特征。如 TO 型复合词“抱歉”和 OT 型复合词“当局”,组成语素均不能决定复合词的语义范畴,复合词的语义需要两个语素义整合后才能提取,因此与英语 OT 型复合词相比,汉语 OT 型复合词的心理表征过程更要依靠组成语素语义的整合。

  OO 型复合词中语义与语素语义没有重合。如: 英语复合词black sheep: someone who is regarded by other membersof their family or group as a failure or embarrassment.black: having the darkest color.sheep: a farm animal that is kept for its wool and itsmeat.汉语复合词旗下:下属、部下。

  旗:用布、纸、绸子或其他材料做成的标志,多半是长方形或方形。

  下:位置在低处的,跟“上”相对。

  black 和 sheep 在英语中很常见,但是由于其构词理据已不为人所熟知,因此在心理词典表征时很难从组成语素的语义中找到与复合词词义的联系。同样,汉语复合词语素“旗”和“下”在心里表征过程时也无法从中找到复合词词义与组成语素语义的关系。从心理词典的表征过程看,这种复合词在语义表征和提取过程中对大脑产生不同程度的认知负荷,并在交际中会产生“耗时”功效,因此自然会影响这类复合词在人们日常语言使用中的出现频率。

  4. 2 词频与语义透明度分布在对两种语言的复合词词频进行统计时,我们发现两种语言的不同语义透明度类型的复合词其整词频率分布状态存在较大差异,如表1。【表1】

论文摘要

  
  英语三种类型的复合词在频率分布上较为分散,词频值差异较大,以 PT 型复合词最为突出。而在汉语不同语义透明度类型的复合词中,其词频方差值相对较小,说明三种语义透明度类型的复合词在词频分布上相对较为集中,均在语言使用的高频范畴内,尤以 TT 型复合词表现最为明显。

  为进一步验证词频与语义透明度之间的关系,我们对语义透明度类型和词频进行了数值标记和级别整理。根据英汉1000 个常用复合词词频数值的均值和方差,两种语言复合词的词频被标成了从1 到5 不同的级别,数值越大,代表词频越高。每个级别中复合词的数量 N =200。同时,根据Libben( 2003) 等人的研究结果,我们将TT 型、PT 型和OO型三类语义透明度逐级降低的复合词也进行了从1 到3 的级别排列,数值越大,则代表语义透明度越低。两种语言复合词的整词频率各被标以上述两个变量,之后进行 Pearson相关系数和双侧检验后,结果如表2 所示。【表2】

论文摘要

论文摘要

  
  在英语高频1000 个复合词中,r =0.007 <1,p =0.833 >0. 01,说明两个变量,即词频和语义透明度类型之间相关度较低,语义透明度的变化不能显着地反映出复合词词频的变化,三种不同语义透明度类型的复合词在 5 个级别的词频数值中都有出现。这说明英语复合词的词频并不因语义透明度类型不同而有变化,二者之间没有直接关系。但在汉语高频1000 个复合词中,r =0.086,p =0.007 <0.01,说明词频和语义透明度类型之间按双侧检验,检验水准为 0.01时,其关系显着,即语义透明度的变化可以显着地反映出复合词词频的变化。语义透明度越高,其复合词的词频就越高,如 TT 型复合词的词频多集中在级别 5 和 4 上。相反,语义透明度越低则词频相对就越低,如OO 型复合词的词频多集中在2 和1 上。这说明汉语高频复合词的词频可以显着地反映出语义透明度类型的变化,两者之间有直接关联。

  英汉复合词词频与语义透明度关系的差异上也充分反映出两种语言词汇结构分布上的不同。在英语语言中,复合构词虽然表现出能产性高、构词力强的特点,但复合词并不是其主要的词汇类型,英语中的单纯词比例可达45%,而复合词的比例只有25%( Dupuy 1974: 46) 。但在汉语词汇结构中,复合词是主要的词汇类型,尤其是双音节复合词,其数量可占词汇总数的73.6%,因此,汉语高频复合词词频变化能够完全地反映出复合词语义透明度的分布状态。

  5. 结论

  我们在英汉复合词语料库基础上对英汉高频复合词的语义透明度进行了定性和定量分析,并将其与两种语言复合词的词频进行了关联,结果表明两种语言复合词的语义透明度分布既有共性又有个性差异。这既反映出人类复合造词过程中的共性———“省力、经济”原则,又体现出两种语言词汇结构分布上的差异———英语以单纯词为主,汉语以复合词为主的特点。同时,这在理论和实践上为多语素词汇在心理语言学和词汇语义学的研究提供了更加科学的依据。

  此外,本研究尚有不足之处有待日后完善。首先是词汇选取样本相对较小; 其次是运用释义对复合词的语义透明度进行划分难免主观。今后在此方面可扩大选词范围,对于语义透明度可采用多次量化的分析,从而进一步提高研究的可信度。

相关标签:
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站