学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 语言学论文 > 社会语言学论文

大数据时代的语言生态观与语言生态危机

时间:2014-10-17 来源:未知 作者:小韩 本文字数:14246字
论文摘要

  1 问题的提出

  近 20 年来,尤其是进入 21 世纪之后,越来越多的国际组织、语言学家、教育学家、语言规划工作者疾呼: 人类语言生态严重恶化,大量语言濒危,尤其是土着语言消失速度在加快; 全球语系、语族、语支、语种及其变体关系失衡,大语种越来越大,小语种则越来越小,通用语越来越通行,地区方言越来越孤岛化,人类语言的万家灯火逐一熄灭; 有人预言: 本世纪末,现有语言十之八九将不复存在; 有人高唱: 五洲同音,四海同语,天地同歌,同一个世界,同一种语言,重现巴别塔语,指日可待。

  其实不然。人以语言为家园,以文化为根基,以信仰为寄托。

  语以载文,文以化人,信以传承。语之不存,文之安乎? 文之不存,信以安乎? 语言灭则文化灭,文化灭则信仰灭,信仰灭则人类灭。

  语言是生命体。语言生态、语言生活、语言生命、语言生机……,其中“生态”、“生活”、“生命”、“生机”系隐喻,隐喻是人类的思维工具、概念的主要载体、意义的传递手段。“语言生态”概念衍生自“生物生态”概念。生物,生命之物。“生态”是“众生之态”,单体独身不成系统,稀物寡种更无法形成态势。

  人类语言的失“态”,如同生物失“态”,弃之不回,去之不归。

  热力学第二定律和第三定律( 即“熵增定律”) 表明,自然界存在着不可逆热力过程,具体表现为从有序走向无序,而且不可能自动复原为初始状,守恒只是理想而非现实。按照热力学第一定律,人类语言种类的数量可以发生变化,但能量保持不变,其结果强者愈强,弱者愈弱,能量由弱者传导至强者并被其吸收。根据热力学第二定律和第三定律,生态变化过程是一种能量耗散过程,生物的消失意味着多样性生态系统的失衡,语言种类的减少意味着语言多样性和文化多样性系统的耗散,文化多样性的衰弱耗散意味着人类知识库的耗散,尤其是人类的地域性非物质表达形式的消失,其后果是物质和精神的双重灾难。热力学三定律不仅对自然生态的发展而且对语言生态的变化结果有着深刻昭示意义,同时要求语言规划工作者更深入地考察人类自然语言的生态实况。

  那么,人类语言生态的实况究竟如何? 人类语言多样性系统是否面临危机?

  2 语言生态观

  2. 1 语言生态观

  生态学是一门研究有机体之间关系以及有机体与其周围环境之间关系的学科。语言生态观是指以生态学的视角和方法来看待和研究语言系统、语系及语族成员之间的关系以及语言与其所处环境之间的关系。语言生态研究涉及语言学和生态学两大领域,具有跨域性交叉研究的属性。

  以有机生命的生态观看待语言和语言生活由来已久,历史上不少学者早已洞察到自然语言所具有的有机生命形态属性,尤其关注语系及语族成员之间的同源关系。例如,Humboldt( 1997) 认为,所有语言都是有机体,语言是人类的天赋属物,具有有机生命的属性。Schleicher( 2008) 认为语言有机体与自然有机体有诸多相似点,语言所遵循的发展规律与生物的路径非常相似。他在 1863 年发表的《达尔文理论与语言学》一文中宣称,他的语言理论符合进化论的观点。他还采用了生物学对植物分类的方法来研究语言的历史亲属关系。Schleicher 的研究表明,印欧语系的谱系图所反映的历史亲属关系与植物群有着十分相似的生态规律。Chomsky 在其半个世纪以来的着述和演讲中始终将自然语言视为人类与生俱来的心脑机制,将人类语言能力尤其是儿童语言习得机制视为人类特有的生物禀赋,将人类认知系统中专司语言知识及其运用的系统视为以基因为载体的“语言器官”( 见梅德明,2008) 。

  2. 2 语言生态观的隐喻意义

  语言生态观是将语言环境视同生物环境的一种隐喻类比。

  按照生物学的观点,维系生物系统长期稳定的要素是多样性生态环境。换言之,多样性生态系统是生物系统的基石,自然界生物的多样性不仅直接影响着而且还决定着生物系统的稳定性和延续性。如果我们依循“生态观”的思路,借用“生物多样性”的词语,对人类语言和文化多样性的重要性进行考察,我们不难发现语言生态观的隐喻意义具有现实性。Baker( 2001: 279-283)高度评价了人类语言和文化多样性的重要性,认为这种多样性改善了人类对环境的适应能力,进而也促进了人类的进步。

  语言生态观念由来已久。Voegelin 等人( 1967) 曾提到“语言生态”这一概念,但首次正式使用“语言生态”一词的是 Hau-gen。1970 年 8 月的一次报告中 Haugen 将语言与环境之间相互关系比作动植物物种与其生存环境之间的生态关系,并提出了“语言生态”的概念。Haugen 的“语言生态”概念主要是指特定语言与所在族群、社会、文化以及地理环境之间相互依存、相互作用的生存发展状态。两年后,Haugen( 1972) 以专文阐述了语言生态,特别强调了语言与其生存环境之间的关系,尤其是语言在环境中的地位和功能,他列出了一系列与语言生态相关的问题,如语言使用者、语言的语域、语言的变体、书面语、语种关系、语言的支持和类型等。Haugen 认为“语言生态”表述还仅仅是个隐喻,语言和有机生物之间虽然存在着诸多相似处,这种相关性有借鉴意义,但不能过分强调。他同时也指出,语言生态既是心理学意义上的生态,同时也是社会学意义上的生态,这种生态主要是由语言的使用者、学习者和传播者决定的。

  Haugen 将语言生态学定义为具体语言与其环境关系的研究,其核心问题是语言所产生的社会影响和心理影响,以及这些影响对语言自身所产生的影响。Haugen( 1987) 在讨论双语教育与语言规划时,用生态隐喻阐述了语言生态多样性与“社会生态”多样性的关系。

  Fill & Mühlhusler( 2001) 认识到生态隐喻的借鉴作用,指出生态隐喻可以加深我们对某一生态环境中居住者多样性以及居住者相互关系的理解,加深对保持和促进生态系统多样性要素的理解。Creese & Martin( 2003) 认为语言生态观是一种关注多种要素之间关系的理念,持语言生态观者注重调查各语言之间的关系、语言与该语言说话者之间的关系、语言与该语言所处社会结构之间的关系。Harmon( 2002) 的研究表明,生物多样性 与 语 言 及 文 化 多 样 性 有 很 高 的 相 关 性。根 据 Maf( 2001) 、Skutnabb-Kangas 等( 2003) 学者的研究,这种相关性具有双向致因属性,即生物多样性和语言文化多样性表现为相互促进、共同进化。

  Hornberger( 2002,2003) 集中关注语言生态隐喻的三个关键要素: 语言进化、语言环境和语言濒危。她指出,语言如同其他物种一样,在与其他语言的相互关系中,在其生存环境中,会经历一个进化、生长、变化、生存和死亡的过程,如同物种一样,语言也会濒危灭绝。在她看来,语言生态学的研究对增强濒危语言的活力,甚至对复兴濒危语言,能起到积极的作用。Horn-berger 认为,语言应该被视为在生态系统中的生命体,在其赖以生存的社会政治环境、经济环境和文化环境中与其他语言共存发展( 2003) 。Hornberger( 2002) 将语言生态观延伸到语言规划领域,指出语言生态隐喻直接影响着语言规划和语言政策,直接影响政策制定者和教育工作者是否重视多语言政策的实施。

  在语言规划和语言政策领域采用语言生态观,其重要意义在于保护和发展语言和文化。

  徐佳在其博士论文( 2010) 中指出,语言多样性与生物多样性之间的关系已成为众多生态语言学研究者关注的焦点问题;Oviedo & Maffi 研究了全球数百个生态区的土着族群、传统民族的语言状况和生物生态状况,结果表明,生物多样性程度高的地区,语言多样化程度也高,二者存在地理相关性; Nettle 对西非地区的语言分布进行了研究,发现越接近赤道地区,语言的数量就越多; Glausisz 发现,雨季的长短与语言数量直接相关; Smith 对墨西哥北部土着美洲族群的研究也证明,语言和文化的多样性与生物多样性存在一定的相关性。

  2. 3 语言生态的自然性与社会性思考
  
  语言生态环境是由语言使用的地域、社会、经济、文化环境、相关语言的语际关系,以及语言使用人群的情感态度三方面构成的复杂体。语言生态系统最显着的特征就是语言的种类多样性和动态平衡性。语言的种类多样性和动态平衡性相互制约、相互影响,促进了语言生态系统的相对稳定。

  有些语言学家试图从纯粹的生态学角度证明生物的多样性与语言的多样性有着直接的关系。如 William Sutherland 在《自然》杂志上发表文章指出: “具有高度语言多样性的地区也同时拥有高度的鸟类和哺乳动物的多样性”( 薄守生、董照辉,2007) 。但是这种相关性是否呈双向性? 换言之,具有高度语言多样性的地区是否也同时拥有高度的鸟类和哺乳动物的多样性? 薄守生、董照辉( 2007) 认为,“把语言多样性比附于生物多样性更是缺乏根据,生物是自然的产物,遵循的是自然规律,语言是社会的产物,遵循的是社会规律。”上述观点有一定的道理,语言的生存、发展乃至消亡的确与社会的政治、经济、文化、教育、战争、宗教、移民、文化等紧密相连。但是,语言生态观并没有排斥社会因素。语言生态观不仅将语言的社会因素视为语言生态系统的组成部分,而且还是构成语言生态系统、影响语言生态系统的最为重要的组成部分。

  从生物生态系统的角度看,多样性的生态系统是最强健的生态系统。从语言生态共生关系的角度看,多语并存对人类来说是一个幸运。人类之所以在地球上得以欣欣向荣的发展,是因为人类为了应对其所处的各种不同环境发展出了多样的文化,人类语言生态的共生共荣关系是人类人文生态环境得以保持平衡的基本条件。促进文化多样性是人类发展的前提,保护语言生态的多样性至关重要。因为语言是文化的载体,文化的传播主要靠语言。多语并存意味着人类多元文化和人文生态系统得到传承和保持。相反,人类一门语言的消亡意味着失去了一种文化,失去了一份极其珍贵的历史文化遗产和可供比较、借鉴的文化信息来源。

  3 语言生态危机

  3. 1 语言生态事实

  从世界语言发展的历史来看,语言的数量是在不断减少的。公元前,全世界约有 15 万种语言,到了中世纪,还有七、八万种,到了 20 世纪,就只剩下 6,000 多种。联合国教科文组织2001 年 2 月 20 日的报告显示: 世界上现存的 6,000 多种语言中大约有一半的语言处在危险之中或濒临消亡。

  自上世纪 70 年代起,语言学、人类学、人种学、社会学、教育学等领域的诸多学者 ( Crystal,2000; Dixon,1997; Dorian,1989; Grenoble & Whaley,1998; Hale et al. ,1992: 1-42; Maffi,2000: 175-190; Robins & Uhlenbeck,1991) 在对土语和小语种进行田野调查的过程中,逐渐对这些语言在日益深化的社会、政治、经济变化中的前景表示担忧,他们向世人警示: 人类语言的多样性受到空前的破坏,人类语言的生态系统越来越脆弱。

  到了 90 年代,随着世界上各种语言资料的积累,欧洲、美洲、亚洲、非洲和大洋洲都传出同一个消息: 世界上的土语和小语种正在以惊人而且越来越快的速度消失,取而代之的是为数不多的几种不断扩张的主要语言( Grimes,2000; Skutnabb-Kan-gas,2000) 。美国《语言》杂志 1992 年第 1 期发表了一组关于濒危语言问题的重要论文,包括 Krauss 的“处于危机中的世界语言”和 Hale 的“语言濒危和语言多样性的人类价值”,这些文章进一步引发了学界对语言濒危问题的关注。不少学者惊呼:语言正在消失,到 21 世纪末,全球现有 6,000 多种语言的半数将不复存在,而数量更多的方言也将成为历史。也有学者更为悲观地指出,百年之内将有 90% 的语言成为人类的绝唱( Krauss,1992: 4-10; Krauss,1998: 9-21; May,2004) 。

  Crystal( 1997) 在其主编的《剑桥语言百科全书》中告诫世人,人类语言消失的速度十分惊人,一个世纪前巴西境内有 1,000 种印第安语,现已仅存 200 种。全世界 6,000 多种语言中有四分之一语言的母语人数已不足 1,000 人,二分之一语言的母语人数不足10,000人,这些语言中的绝大多数在 50 年内将不复存在,只有 1,000 种语言可进入 22 世纪。

  我国是世界上语言资源极其丰富的国家之一,但是我国的语言生态也不容乐观。我国的语言在谱系上分属汉藏语系、阿尔泰语系、南亚语系、南岛语系、印欧语系以及多源混合语类,从类型上可分为屈折语、粘着语和分析语三种。我国在秦统一全国之前有上万个诸侯国,其时的社会语言状况可谓“文字异型、言语异声”。自秦实行“书同文、路同轨”政策之后,因各种原因大部分语言或被融合,或被替代,或自行消亡,如鲜卑语、契丹语、西夏语等曾在历史上起过重要作用的语言早已不复存在。

  根据孙宏开、胡增益、黄行( 2008) 主编的《中国的语言》,时至今日,我国仅存语言129 种,文字60 多种,其中20 多种语言使用人口不足千人。从发展趋势看,有的语言分化了,如蒙古语; 有的语言缩小了使用范围,如仡佬语; 有的语言正趋于消亡,如满语。

  所以,全球普遍存在的语言生态危机在我国也同样存在。我国少数民族语言中,使用人口在10 万以下的“非安全语言”多达99种,约占我国语言总数的77%,其中,有20 多种少数民族语言的使用人口已不足千人,这些语种濒临灭绝已是不争的事实。

  我国的满语正在彻底退出实际的日常交际。满族在清代作为一个统治民族历经三百多年,由使用单语过渡到同时使用满语和汉语,到最终放弃满语而转用汉语,有着深刻复杂的历史发展原因、社会文化原因和语言活力原因。语言就像生物有机体一样,其存在必须有合适的生态环境。语言赖以生存的环境一旦发生了不利的变化,必然会导致该语言的衰弱甚至消亡。满语的濒危是其赖以生存的语言生态环境恶化的结果。

  语言是一个民族及其文化的根本特征和记忆,随着一个民族的语言的消失,承载着这个民族文化的记忆也就荡然无存了。人类的语言生态日益恶化,许多国家和地区的语言多样性受到严重威胁,不平衡、不和谐的语言生活令人担忧。目前,全球 97%的人使用 4%的语种,3% 的人说着 96% 的语种。由于各种原因,数以千计的语言基本上进不了教育体系、新闻媒体、出版物和公共场所,使用者日趋萎缩。随着全球经济一体化、交通及传媒的现代化,以及各国城市化步伐的加快,弱势语言陆续走向濒危已是不争的事实。

  3. 2 语言生态危机致因

  语言生态的概念就是语言多样性的概念,语言生态危机就是语言多样性的危机,就是语言的濒危和灭绝。当前语言生态危机的主要表现为: 1) 强势语言国家化和国际化进程的加快;2) 互联网通用语的一体化发展态势; 3) 土着或少数裔族语言的濒危与消失; 4) 方言的边缘化与消失; 5) 双语社区及双语人的减少与消失; 6) 年轻人对非通用母语及母语文化表达形式的主动抛弃; 7) 语言岛和方言岛的沦落和沉没; 8) 杂交语或混合变种语言的难产或式微。

  语言研究工作者往往只看到语言的消失,而未深入研究语言消失的生态原因。Mühlhusler( 1996,2000) 调查了太平洋圈语言规划和语言生态状况,尤其是皮钦语和克里奥语的语言系统、历史演变和生存状况。他发现太平洋语言圈的根本问题在于语言生态环境的破坏,而摧毁语言生态环境的首要因素是语言帝国主义,而非土着语言数量的减少。

  联合国教科文组织濒危语言问题特别专家组在 2006 年的一份报告中称“语言濒危既可能因外部力量所致,如军事、经济、宗教、文化和教育的逼迫等; 也可能由内部因素引发,如语言族群对母语的消极态度。内部压力往往有其外部根源,二者都阻碍了语言和文化传统的代际传承。许多土着民族把自己的弱势社会地位与其文化相联系,进而认为自己的语言没有保留价值,于是抛弃自己的语言和文化,以期摆脱歧视,过上稳定的生活,增强在社会中的能动性,以及融入全球市场经济。”

  学校教育对语言多样性生态的保护有冲击作用,正规教育具有反传统性。学校教育的统一性模式和标准化范式带来的是工业化、批量化的规格产品,而不是农业化、多样性的个性产品。

  而国际化教育更是一把双刃剑,国际化教育的结果往往是西方化教育,得到强化的往往是西方的语言、文化、价值观和方法论。

  语言多样性受到全球化、城市化、信息化的冲击。今天,语言多样性以前所未有的速度衰减。弱小语言在消失,中型语言在缩减,大型语言尤其是超级语言如英语在加速扩张,挤压了中小型语言的生存空间。

  在全球一体化的今天,英语成为最重要的沟通语言。世界上约有 15 亿人使用英语。英语除了是英国、美国、加拿大、澳大利亚、新西兰等发达国家的母语外,也是世界上 70 多个国家或地区的官方语言或第二语言,更多的国家和地区选择英语作为优先学习的外语。基于全球化的需要,各国在反对英语霸权的同时,不得不主动学习和使用英语。互联网的迅猛发展更加快了英语的全球化,目前互联网上 85% 的网页是英语网页,80% 的信息载体是英语,网络域名几乎成了英语的专利,100%的软件源代码是英语格式。此外,世界上五分之四的电子产品说明书用英文撰写,三分之二的科技论文用英文撰写和发表。
  
  3. 3 语言生态保护行动

  进入 21 世纪后,经济全球化浪潮极大地促进了各种语言和文化的接触与交流,语言消失速度加快,语言濒危引起了越来越多的人类学家、语言学家、社会学家和各国政府的普遍关注。不同的国家或地区根据各自的语言情况,采取了不同的积极保护措施和抢救对策,以延缓濒危语言的消亡。如美国 1990年制定了支持土着居民保护自己语言的法律; 澳大利亚政府对于保留土着民族语言的计划给予资金援助,1927 年曾一度消失的乌尔娜语由于纳入了大学教育计划等,如今已有 50 人能自如地驾驭该语言。英国的威尔士语处在英语的包围之中,在急剧衰落的危急形式下,经过努力而使其恢复了元气。

  在对语言生态危机问题达成共识的基础上,语言学界、联合国教科文组织以及国际社会采取了一系列行动,表现了对濒危语言问题的高度重视。1992 年,国际语言学界在加拿大魁北克拉瓦尔大学举行的第 15 界世界语言学大会将濒危语言问题作为大会的两大主题之一,这是此问题作为主要议题的第一次大型国际性语言学会议。1993 年,联合国大会正式通过《濒危语言方案》,其中包括《濒危语言红皮书》和《濒危语言研究进展情况报告》,旨在汇集世界范围内濒危语言的信息及其研究工作情况。同年,联合国教科文组织确定该年为“抢救濒危语言年”。1994 年联合国教科文组织成立了“国际濒危语言情报交流中心”和亚太地区语言研究部。1995 年,美国和英国也相继成立了濒危语言基金会。1996 年,西班牙巴塞罗那会议通过了《国际语言权利宣言》。1997 年,联合国教科文组织第 29 届大会批准设立“世界语言报告”项目。1998 年,教科文组织总干事向各国的联合国教科文组织发出公开信,要求各国有关机构进行合作,共同完成“世界语言报告”。2000 年,在德国科隆大学召开的国际濒危语言研讨会,汇集了世界各个国家、地区从事濒危语言研究的专家学者共同讨论协商、交换意见,对制定研究和记录濒危语言的先后顺序进行排序。

  语言体现着特定语言社群的世界观、价值观、伦理观、思维方式等精神性、观念性的内容,承载着丰富的自然及宇宙知识,包含着人类关于数学、生物、农业、历史、地理、医学、语言学、民族学等学科的知识。一种语言的消失必然导致许多非物质文化遗产形式的消失,一种语言的灭绝,必然导致许多自然科学知识和社会科学知识的湮灭。正是基于这种认识,联合国教科文组织编制了《世界处在消亡危险中的语言地图集》( 1996 年) ,修订并绘制了《全球濒危语言分布图》( 2009 年) ,组织成立了濒危语言问题特别专家组。经过广泛调查研究,联合国教科文组织出台了《语言活力与语言濒危》报告。为了广泛宣传保护母语的重要性,联合国教科文组织从 1999 年起,将每年 2 月 21 日确定为国际母语日。此外,联合国教科文组织还出台了三个重要文件:《文化多样性全球宣言》( 2001 年) 、《维护非物质文化遗产公约》( 2003 年) 、《保护和促进文化表达形式多样性公约》( 2005 年) 。

  2003 年 3 月,联合国教科文组织在巴黎举行了关于濒危语言问题的专家会议,会议评价了世界各国现有的濒危语言研究项目和推广保护濒危语言的最佳做法,讨论了提高人们的语言忧患意识和促进国际合作的战略措施。会上 David Crystal 以 Crossingthe Great Divide: Language Endangerment and Public Awareness为题作了主旨报告。2012 年 9 月,“亚欧会议语言多样性论坛”在印度尼西亚雅加达举办,会议的主题为“保护和促进亚欧语言多样性,实现可持续发展”。笔者作为中国代表以“中国语言和文化多样性保护与发展”为题,就我国保护和促进语言多样性的经验作了专题发言。2012 年12 月,“中欧语言合作研讨会”在北京举办,会上笔者作了“中国语言与文化多样性保护及多语教育实践”专题报告。2013 年9 月,“东亚峰会双语教育政策与实践研讨会”在新加坡举办,笔者在会上作了题为“促进全球化背景下的中国多语教育: 从语言政策到语言实践”的专题报告。

  3. 4 语言生态危机再认识

  就世界范围来看,语言濒危致因是多方面的,其中语言接触、强势语言挤压弱小语言是导致语言濒危的主要原因。在全球经济一体化步伐日益加快的今天,在人们交往日益频繁的今天,在广播、电视、电话、网络等大众媒体日益发达的今天,一些弱小语言由于不能适应社会交际及信息传递的需求而逐渐丧失其交际作用,最终被强势语言所代替。当然,语言全球化也会引发语言地方化。例如,伴随英语全球化的是英语地方化,世界各地地域文化在英语语言与英语文化的冲击下,产生了地方身份的自我觉醒和自我保护,其结果是成百上千种英语变体———“地方英语”( indigenized English) 的产生。

  语言生态危机的本质是语言多样性和文化多样性的消失。

  Phillipson & Skutnabb-Kangas( 1996: 429-452) 指出,语言生态研究范式基于全球范围的语言多样性,促进多语主义和外语教学,赋予所有人以母语权利。因此,我们要充分认识母语价值。

  人类的语言结构是人类智能成就的证言,反映了一个族群( 民族) 的性格和文化特点。语言所具有的文化载体功能,是人类文明的巨大财富。一种濒危语言代表着一种文化,每个民族的语言和文化都有自己的贡献和特点,谁都代替不了谁。多种语言并存是一种人文生态环境。

  应对语言生态危机,改善语言多样性的自然环境和人文环境需要多角度思维和国家政策和技术支持。Pennycook( 2004)指出,语言保护所面临的困难在于如何有效地协调自然语言的动态本性与国家语言政策的协调能力。一个民族的存在和发展与特定的社会环境与文化有着密切的关系,社会环境和经济条件得到很好的改善,没有战争、没有特大的自然灾害,其语言和文化就能很好地保存下来,威尔士语就是一个典型例子。因此在分析和研究濒危语言时,我们要多角度地研究和分析造成濒危语言的濒危条件以及各种自然因素和人为因素。濒危语言资料的抢救和保存是一个庞大的系统性工程,不仅需要专家学者和有关机构的学术支持和人力参与,而且还需要政府部门的政策支持、技术支持和资金支持。

  至今为止,语言生态调查主要依靠语言工作者的田野调查,通常锁定某一目标语言进行个案调查研究,尤其是锁定某一土着语言或濒危语言,将“活”的语料记录在案、考究分析、归档保存,然后或发布报告,或会议交流。这种传统的调查方式和手段往往只见树木而不见树林,见个景而不见全景,见昔时状态而不见现时状态,从而无法全面、实时、动态地考察地区乃至全球的语言生态,无法及时准确地了解语言的结构变异和功能变化,因而无法为制定有关语言政策特别是语言教育政策和语言保护政策提供科学依据。

  4 大数据时代及语言数据意识

  4. 1 大数据时代的海量数据

  人类已进入了大数据时代。大数据是指在信息爆炸时代无法在允许的时间里用现有的常规软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。

  随着社交网络、移动计算和传感器等信息新渠道和新技术的产生,如 PB 级大规模数据量的不断涌现,过去三年里产生的数据量比以往三万年的数据量还要多。截止到 2012 年,数据量已经从 TB 级别跃升到 PB、EB 乃至 ZB 级别。据估计,互联网上的数据量每两年会翻一番,到 2013 年,互联网上的数据量将达到每年 667EB( 1EB =230GB) 。这些数据绝大多数是“非结构化数据”,通常不能为传统的数据库所用,但这些庞大的数据“宝藏”将成为“未来的新石油”。今天我们在不到 1 秒的时间内可处理的信息量相当于我们的 DNA 用 10 亿年处理的信息量。整个人类文明所获得的全部数据中,90% 产生于过去两年,而 2020 年全世界所产生的数据规模将达到今天的 44 倍。

  Mayer-Schnberger & Cukier( 2013) 指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,最大的转变就是放弃对因果关系的渴求,取而代之的是承认混杂性,关注相关关系。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。以往的思维决断模式是基于“为什么”,而在“大数据时代”,则已可直接根据“是什么”来下结论,由于这样的结论剔除了个人情绪、心理动机、抽样精确性等因素的干扰,因此,将更精确,更有预见性。

  世界的本质就是数据。根据 Kelly 的观点( 1994,2010) ,宇宙的本质是信息。那么信息的本质是什么呢? 那就是数据,生物的 DNA 会消失,而数据化的 DNA 则永存。Kelly 早就预测,未来的人工智能将诞生于由10 亿台中央处理器组成的“全球脑系统”,这个系统包含互联网及附属设备———从扫描仪到卫星以及数十亿台个人电脑。这台全球脑包含的不只是笔记本电脑,它还包括数十亿部手机、数十亿部固定电话,数千万台数据服务器,上亿台平板电脑。整个系统有上万亿个网页,每个网页平均链接数十至近百个网页,网页和网页之间形成数以万亿计的“突触”,而这些“突触”每隔两年翻番,形成难以删除的人类记忆。

  语言生态是由语言、语言人和语言环境所构成的自然-人文系统。如果宇宙的本质是信息,信息的本质是数据,那么语言生态系统的本质也是一种信息系统,构成这一信息系统的是数据。全球语言生态是一个大系统,涵盖所有语系、语族、语支、语种、语言变体、语言人、语际关系,以及语言的地理环境和社会环境。这个大系统由大量中系统和海量小系统构成,中小系统之间以及系统内关系错综复杂,形成无以计数的语言信息“突触”,并产生浩如烟海的过程性、交互性、变异性语言数据。

  4. 2 大数据时代的思维方式

  产生于通信技术创新与发展的大数据使人们得以全面感知、收集、分析和共享语言信息,同时为人们提供了一种全新的看待世界的方法。“让数据说话”的思维方式改变了传统的“八九不离十”的思维方式。

  全球性问题需要全球性思维,全球性思维需要由全球脑来支撑。在小数据时代,看山是山,看水是水; 头痛医头,脚痛医脚。而在大数据时代,看山不是山,看水不是水; 头痛可医脚,脚痛可医头; 宇宙只有统一的法则,而没有中心,形成的是点对面的网状相连关系,而非点对点的线性因果关系。

  大数据时代的思维之道是群蜂之道,信奉群体规律和集群智慧,众愚可成智。群体规律是大数据定律,大数据定律也是必然定律,由无形之手操纵。网状世界,没有中心,没有边缘,没有开始,没有结束,周而复始,互为因果。大数据可避免偏见,消除纠结。人们不受时空和形式的限制,全天候、全方位地进行点对点、点对面的交流。

  以大数据理念观察事物,世界的均衡是暂时的,流变是必然的,均衡的生态系统是僵死的系统,多样化的生态系统是绚丽多姿的系统,是开放多元的系统,也是不断流变的系统。

  以大数据视角看待语言生态,就是以网状的整体论和循环论观点看待语言和语言数据。数据不仅是名词和代词,更是动词和介词,甚至是助词、副词和修饰词。数据既是逗号和句号,也是引号和问号,甚至是省略号和惊叹号。数据既是因之果,也是果之因,甚至是一种多重叠加的并行关系或串行关系。

  4. 3 大数据时代的计算模式

  大数据和云技术使追求全样而非取样本数据成为现实。

  面对海量数据,云计算技术为我们提供了强大的计算能力,使我们并处物质和数字两个世界。

  大数据具有四 V 特征: 第一,数据体量大( Volume) ; 第二,信息类型多( Variety) ,包括文本、音频、视频、图片、社交网络、地理位置等; 第三,价值密度低( Value) ; 第四,处理时效高( Ve-locity) 。数据处理的云计算技术为数据资产提供了保管的场所、访问的渠道和采用的空间。盘活并使用数据资产为语言生态研究、维护和改善提供了保障。

  传统意义上的“数据”是结构化的,而“大数据”含结构化数据、半结构化数据和非结构化数据。数据一部分来自内部( 语言内部) 自身的信息系统中产生的数据,这些数据大多是标准化、结构化的,另一部分来自于外部,包括广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据源于各种社交网络、移动计算和传感器等信息渠道和技术不断涌现和应用,如 Web 文本和点击流数据、电子邮件、呼叫记录、传感器信息、GPS 定位映射数据等等。数据来源越广泛,信息所投射的世界越真实。

  以大数据观念、方法和手段来考察语言生态,必须寻求语言生活的全样本和全形态,尤其是那些可以揭示语言全貌和真貌的“准语言”数据和“类语言”数据,无论是文字还是数字,无论是语音还声音,都是语言工作者必须十分关注的要素。

  4. 4 大数据时代的历史使命

  “大数据”虽然是人类历史上的一次颠覆性的技术变革,但其影响已远远超出技术层面,遍及了国家治理模式、社会组织建构、科学研究活动、企业管理流程、个人生活方式诸方面,其中包括对自然生态和文化生态的研究产生重大影响。

  美国政府整合了国家科学基金、国家卫生研究院、能源部、国防部、国防部高级研究计划局、地质勘探局等六个联邦部门来负责大数据研究。联合国( 微博) 也推出了“全球脉动”项目,希望利用“大数据”来促进全球经济发展。联合国的“情绪分析计划”使用自然语言解密软件来对社交网站和文本消息中的信息做出分析,用以预测相关地区的经济发展趋势和医疗卫生状况,利用数字化的预警信号防患未然。

  身处大数据时代的人文学科不可能置之度外,人文学者也不可能游离于技术进步的浪潮之外。大数据时代语言生态研究需要大量的语言数据技术人才,这些人才必须具备大数据解读能力、整合能力、应用能力和管理能力。大数据时代语言生态研究要求我们重视语言数据信息体系建设,加大语言数据技术研发的力度和速度,加强对特殊语言、濒危语言、目标语言、重点语言等敏感数据的跟踪、记录和监管。在大数据时代进行语言生态研究,我们不仅要加强对智能城市、智能交通、智能医疗、智能教育、智能翻译等领域的语言生活状况进行数据解构和分析,更要关注偏远地区、边缘地区、杂居地区、高山地区、丛林地区、孤岛地区等地方的人类语言生活及其变化。

  5 大数据时代语言生态研究的机遇与挑战

  5. 1 树立羊狼共舞的生态观

  世界之大,可容下所有语言; 世界之广,能给予多样性以应有的空间。狼与羊都有自己的生存空间和生存理由。语言的生态环境应该包括该系统中的所有语言( 含国际通用语和国家通用语) ,包括所有语言变体、土着语、方言、话语人的说话方式等。

  不可否认,“语言生态学”目前还未形成一门独立的学科,没有专门的学科术语,也没有专门的研究机构和教育机构。国际语言学界目前通用的相近名称是“语言的生态学”( ecology oflanguage) 和生物语言学( biolinguistics) ,主要是借鉴生态学或生物学的原理来研究语言和语言问题。虽然学界对生态语言学进行了多年的探索,但其完整的学科体系还没有真正建立起来。对这门学科的基本理论、基本概念、研究内容、研究方法等还没有明确的、统一的认识。但是,人类历史上从来不曾有过学科建设在前、科学研究在后的先例。恰恰相反,随着开创性探索的持续展开,随着研究工作的不断深入,研究领域的不断拓展,以及研究成果的不断涌现,独立学科的建立也就水到渠成了。在大数据时代,本着“羊狼共舞”的生态观,我们完全可以利用高新技术手段对语言生态进行实时的调查和全景式的研究,动态考察地区乃至全球的语言生态,全面了解人类语言的结构变异和功能变化,进而为政府制定语言政策、为教育机构实施语言教育提供科学依据。

  5. 2 大数据在语言生态调查中的作用

  如前所述,今天所说的“大数据”不是传统意义上的以数字为主要载体的信息,“大数据”信息还包括文本、图片、音频、视频等格式。由于传统数据是线性的和结构化的,数据分析有规律可循。而“大数据”包括“结构化”、“半结构化”和“非结构化”三种数据类型,数据复杂,频繁交互,信息涉及方方面面,数据来源既有内部,也有外部。不同类型的数据,不同来源的数据,不同层面的数据,构成了一面透视的、立体的多棱镜。这要求我们打破传统数据源的边界,注重新型数据源,通过各种渠道获取更为接近事实的信息。

  大数据的三要素,即重视数据的全样本而非采样本、重视数据的混杂性而非精确性、重视数据的相关关系而非因果关系,恰恰是当今语言生态调查所欠缺的。如果我们缺乏全球语言生态的全样本,看不清国际通用语、国家通用语、地域方言、土着语言、混合语言之间频频交互的混杂性,忽视语言的“语内”相关性、“语际”相关性、“语境”相关性,我们就无法真正看清语言生态的真实境况。

  大数据的四特征,即数据体量大、信息类型多、价值密度低和处理时效高,恰恰是当今语言生态调查所急需的。随着大数据时代的到来,大数据的三要素和四特征为我们研究地区乃至全球的语言生态提供了有效的工具和方法。

  5. 3 大数据时代语言生态研究面临的挑战

  由于大数据观是建立在“海量数据皆事实”的基础上,因而所有信息的供给方和采集方的群体因素和个体因素都会影响数据的真实性。想要在庞大的数据“干草垛”中找到一根真正意义上的银针,一定要依赖全样本数据采集和全天候数据测量。语言数据的相应形态,语言数据之间的相关性和交互性,都会使语言生态“偶尔露真容”,甚至“显山露水现真貌”。

  大数据时代语言生态研究的另一挑战是数据技术人才的培养。大数据时代的技术人才需要大数据意识、大数据技术和大数据方法。培养大数据技术人才,除了树立大数据理念之外,还要重视数据采集能力、数据分辨能力、数据精算能力、数据整合能力、数据转换能力以及快速实时行动力的培养。

  6 余论: 大数据时代语言生物性和社会性再思考

  大数据时代语言生态研究很大程度上依赖语言数据采集与处理的技术性,从而忽视语言的生物性和社会性。

  自然语言是人类的专利,我们应该给予人类语言应有的生命观和社会观,即关注人类语言的基因和模因,尤其是后者。

  何为“模因”? 模因是一种文化基因,例如语言、观念、信仰、行为方式等,通过人际模仿而自我复制,在人际或代际中传播,发挥着人类文化进化的作用 ( Blackmore,1999) 。在 Dawkins( 1976) 看来,模因具备遗传性、变异性和选择性三个特征。模因的模仿本质以及模因之间的竞争驱动着人类观念的进化。

  大数据时代的网络语言体现了语言的模因现象: 如 IC、F2F、MM 等语言模仿形式,以及“围脖”、“刷屏”、“拼客”、“屌丝”、“部落格”、“秒杀”、“1314”等新造词语。模因论体现了语言的生物性和社会性,值得语言生态研究工作者关注。

  此外,我们还应该充分利用大数据的全景覆盖力和渗透力,关注偏远地区或土着部落语言生态的变化,尤其是社会形态转型时期年轻人的语言行为和语言倾向。美国密歇根大学语言学家 O'Shannessy( 2005,2013) 在澳大利亚北部拉贾马努地区的一个土着部落发现了一种新型语言———轻瓦尔皮瑞语。

  轻瓦尔皮瑞语属新型混合语,该语言的大部分名词源于瓦尔皮瑞语和英语,动词及相关结构则来自克里欧语和澳洲土着英语。轻瓦尔皮瑞语的产生有其深刻的历史性和社会性,不是仅限于澳洲大陆的一种孤立现象,需要我们广泛关注。

  近年来,我国生态语言应用研究取得了一定的突破,学界也发表了一些研究成果。主要进展涉及语言濒危与语言消亡的问题、强势语言与弱势语言的问题、语码混用与语码转换的问题、语言态度与语言转用的问题、人口迁移对语言影响的问题、网络时代语言符号多样性的问题、全球环境下政府语言政策的问题,等等。至于生态语音、生态文字、生态语法、生态词汇、生态语篇、生态修辞、生态语用、生态语言规范、生态语言学教学、生态语言学翻译、语言符号变异的生态研究等等,还需要在大数据时代采用新媒体、新技术和新手段开展更深入的研究。

    相近分类:
    • 成都网络警察报警平台
    • 公共信息安全网络监察
    • 经营性网站备案信息
    • 不良信息举报中心
    • 中国文明网传播文明
    • 学术堂_诚信网站