传统实证社会学的方法困境与应对措施

来源：中国社会科学评价作者：范晓光
发布于：2020-12-09 共12635字

　　摘要：　实证社会学是社会学研究的基本范式之一。从方法论层面来看,传统实证社会学主要存在宏观与微观解释、数据与理论驱动、相关与因果、同质性与异质性、信度与效度等内在张力。万物互联时代的数字化为研究方法的更迭提供了机遇,以研究设计为切入点,测量的客观化与多维化、大小数据的有效匹配和线上线下实验结合等是应对研究方法挑战的可能路径。

　　关键词：　实证社会学; 数字化; 本土化; 因果分析;

　　Abstract：　Empirical sociology is one of the basic paradigms of sociological research.In terms of methodology,traditional empirical sociology displays internal tensions between macro-and micro-explanations,between data and theory,between correlation and causation,between homogeneity and heterogeneity,etc.In the era of the Internet,digitization provides opportunities for a change of research methods.Making research design the entry point for reliability and validity,objective and multidimensional measurement,the effective matching of big and small data,and the combination of online and offline experiments will give us possible means of dealing with the challenges of research methodology.

　　一、问题的提出

　　最近几年,国内学术界对实证研究方法的讨论愈加频繁。社会学学科还出现了一些极为重要的学术争辩,如翟学伟教授对谢宇教授的商榷,以及周晓虹教授对该商榷的商榷。1多数反思是在社会学“本土化”和实证主义的范畴中展开的,2并在某种程度上呈现出人文主义和科学主义的分野。3然而,在笔者看来,除了方法论、议题和范式等层面的讨论,我们还应该在研究设计层面加以探讨。

传统实证社会学的方法困境与应对措施

　　实证研究被视为社会学的基本学术范式之一。边燕杰教授对其多年来关于社会学方法论的理解和思考做了梳理和阐释,明确提出了理论导向的实证研究。4他强调指出:中国社会学能否真正缩小与发达国家的差距,必须有力挖掘和有效累积本土知识,坚持本土知识的国际概念化。然而,实证研究是一个收集资料、甄别资料、分析资料、检验理论的复杂性创新工作。如何从理论出发搜寻合适的资料,并进行适切的分析和解读,同样也是中国社会学提升国际影响力必须直面的问题。

　　以大数据为代表的新数字革命对人类社会生活的冲击仍然在不断“发酵”。互联网的连通性,不仅可能给整个社会带来巨大冲击,而且也加快了社会科学研究范式的迭代。5伴随数字化时代的到来,实证社会科学将面临哪些基础性挑战、实证研究如何在数字化中通过精巧的研究设计直面这些挑战,正是本文要着力回答的。

　　二、传统实证社会学的方法困境

　　对实证社会科学在数字时代所面临新挑战的论述已经颇为丰富,但是国内从方法论角度展开的讨论却不多。需要强调的是,本文所说的数字化是指对个人、群体或组织等的社会事实进行数字刻画和表达,大数据是数字化的主要特征之一。笔者以为,多数挑战并非数字化所催生的,而是从实证社会科学诞生以来就已存在。本文认为包括五组矛盾:宏观与微观解释、数据与理论驱动、相关与因果、同质性与异质性、信度与效度。

　　(一)宏观解释与微观解释

　　孔德在19世纪上半叶创立社会学之初,就试图采用自然科学的方法去研究人类社会,以区别于思辨哲学的实证社会学概念体系;涂尔干在这一基础上完成了《社会学方法的准则》《自杀论》等重要论着,为实证社会学奠定基础。社会学向来都非常强调结构对社会和社会互动的解释,不论这种结构是源自外部的还是社会建构的。

　　早期的实证社会学更为关心宏观层面的结构与社会行为的关联。涂尔干在《社会学方法的准则》中首次提出了“社会事实”(fait social)。所谓的社会事实,是超越个体和行为,对人们的行为产生外部“约制”的普遍性力量。6在《自杀论》中,涂尔干以“自杀”作为分析对象,着重讨论了自杀率等作为“社会事实”的要素是如何形塑个体自杀行为的。在笔者看来,涂尔干眼中的社会事实主要是以社会结构为存在形式的。

　　其后,随着社会学的学术中心从欧陆移至北美,经历了一个从宏观结构逐渐到微观结构的转向。社会学从欧洲传到北美后,首先就面临着学科合法性的挑战。一代又一代的社会学家主要从科学化和实用性两个维度去追求社会学的“美国化”。7在二战前,初创时期的美国社会学,不仅要通过统计量化争取合法性,而且要摆脱玄学和宗教的影响。虽然以帕克为代表的芝加哥学派强调人文主义,但是以奥格本为代表的哥伦比亚学派却对科学化和数量化表现出相当的推崇。二战以后,美国社会学在追求科学性和客观性的路上继续前行,帕森斯的结构功能主义在美国社会学中占据统治地位。帕氏的结构功能主义,实质上是通过构建宏大理论去理解社会世界,仍然是以科学为取向的。作为帕森斯的学生,默顿创造性地提出了中层理论。8虽然中层理论的目的之一是追求科学量化,以消解知识积累与社会学论题越来越细碎化之间的张力,但是不可否认其在方法论层面试图去调和宏观与微观结构之间“脱节”的问题。如何理解“微观—宏观”的转化是社会科学最为重要的理论问题。

　　20世纪90年代以来,在如何解决宏观和微观解释之间“裂痕”(gap)的问题上又有了重要推进。作为默顿和拉扎斯菲尔德高徒的科尔曼,在《社会理论的基础》中提出了“科尔曼之舟”(Coleman’s Boat),力图解释微观行为如何与宏观层次结构关联在一起,他也因此被誉为“结构个体主义”的代表。在该书中,作者运用了一般性框架分析了韦伯的《新教伦理与资本主义精神》如何实现了“微观—宏观”的转换和跃升。9而后,赫斯特罗姆又将社会学的“分析”传统拉回,提出“期望—信念—机会”(D-B-O)因果机制分析模型,试图实现“宏观—微观—宏观”的勾连。10

　　(二)数据驱动与理论驱动

　　理论和数据是实证社会学的两个基本构件。在华莱士所提出的科学环中,基于演绎的理论驱动(theory-driven)的实证分析摆在了重要位置。理论驱动研究有两个不言自明的前提假定:其一是经验事实可能被既定的理论所解释,其二是研究者对理论的内涵和机制有深刻理解。然而,理论驱动的实证研究更擅长于检验现有的理论——即便理论得到了经验资料的支持,我们也很难说该理论被“证实”,更无从谈及令人激动的理论创新。

　　除了理论驱动型研究外,以归纳为基础的数据驱动型(data-driven)研究也是社会科学的传统路径。数据驱动强调从经验资料出发,挖掘数据中的显着规律,进而对理论进行检验和拓展。数据驱动不再以既有的理论为单一起点,对于探索新机制的挖掘有着自身独特的优势。在定量数据的处理中,如何对变量进行符合理论预期的分类,除了直接从理论出发,还可以借助于统计模型来识别。在统计方法家族中,潜类别分析(latent class analysis, LCA)专门用于多维度类别变量的分组,笔者与陈云松合作,运用LCA方法,基于职业地位、收入水平和教育程度,生成了中国城乡居民的客观社会地位,并通过和主观社会地位比较得到主观地位认同偏差。11其中,客观社会地位的分组,主要依据BIC(贝叶斯信息量,Bayesian Information Criterion)、似然检验等相关统计指标加以判断。

　　相较于理论驱动的实证研究,数据驱动研究在传统的社会科学中并不是主流。这背后和社会科学的研究目标有直接关联。因为传统的社会科学是以理论解释为主要目标的。在统计模型和模型中变量的解释力之间,我们一般认为变量的解释力才是关键。此外,社会现象错综复杂,纳入模型的变量始终无法穷尽,也强化了传统实证研究的这种理论驱动审美偏好。

　　(三)相关与因果

　　社会科学分支学科对社会现象的研究多以寻求因果关系为核心。12实证主义强调科学的解释,追求因果解释也就理所当然。以美国社会学为例,几经波折,直到20世纪中叶之后,因果推断(causal interpretations)在新生代社会学家中才重新获得重视。13在早期阶段,因果分析借助于邓肯的路径分析和拉扎斯菲尔德的详细模式去识别因果关系。1480年代以来,在反事实(counterfactual)框架下,时间序列、准实验、工具变量、DID等方法和技术被用于因果分析。15

　　然而,识别因果关系在实证研究中绝非易事。譬如,统计分析的基本逻辑是将数据分割为系统模型和残差项(error),16并对残差项的属性做了若干假定。由于这些假定在模型设定时可能被违反,社会科学家又从统计方法和研究设计两个方面做了各种努力。但是,残差项总归是个“黑箱”,里面包含了我们未知甚至难以穷尽的变量,内生性问题始终存在。同时,与计量经济学、统计学的因果分析不同的是,社会学更加强调宏观社会结构对微观行为的约束,分析资料大多数属于截面的、非实验性的,这使得因果分析方法的前提假定更容易被违背。17

　　尽管因果分析作为实证研究的“终极追求”已是学界共识,但是大数据时代的到来,作为因果关系成立前提条件的相关关系又重回研究视野。有学者对传统实证研究所采用的统计方法提出批评,认为它主要以简单的线性主效应去探寻因果关系,对多重非线性和联合效应重视不足。18例如,在统计模型中,控制变量和核心(单个)自变量的多重交互项会随着变量数的增加呈现几何式增长,而传统方法并没有给予较好的处理。当然,或许可以说这些复杂关联缺乏理论支撑,但仍然不能否认这种模型设定对单个因果关系可能产生冲击。

　　(四)同质性与异质性

　　对社会学“美国化”过程的梳理表明,统计学在实证主义的发展中发挥了极为重要的作用,19其中的大数法则(law of large numbers)和中心极限定律(central limit theorem)是统计推断的基石。由于受到人力、物力和财力的局限,通过抽样调查获取分析资料是社会科学较为普遍的研究方法。凭什么根据一定规则从总体中抽取若干个体所组成的子群能够代表分析总体?为什么有的研究采用分层抽样要优于整群抽样,而有的却未然?之所以会受到来自各方诸如此类的“批评”,其根本源自同质性(homogeneity)与异质性(heterogeneity)之间的矛盾。

　　变异性(variability)是社会科学研究的三大原则之一。20社会统计善于发现各种差异并寻求形成差异的解释,但这又是以同质性为前提的。在社会调查中,随机抽样要解决的是如何通过有限的样本“捕捉”到足够的变异,以代表总体的分布。如果研究对象缺乏变异性,或者说在多个维度上具备共同特征,那么就无须进行复杂的抽样设计,因为任何个体就可以代表总体。而现实世界则复杂得多,即便我们所能观察到的全部特征具有相似性,但也难以确保未被观测的特征也是一致的。

　　而在统计推断中,我们分析自变量对因变量的影响,实质上是把自变量作为干预要素,比较它在因变量上的组别差异。这里存在两个前提假定:(1)个体在受到干预之前,其他特征上的属性是一致的;(2)这种干预对于任一个体的影响效应也是一样的。事实上,这两个对研究对象的假定往往被违背,违背假定1带来了异质性偏误(heterogeneity bias),违背假定2则是内生性偏误(endogeneity bias)。21为了克服异质性对统计分析结果的冲击,倾向值匹配(PSM)、内生转换模型等先后被应用于实证分析中。22

　　同时,实证研究在进行分组比较的时候,主要采用均值法,其理论支撑即是大数法则;但它又通过平均数掩盖了异质性,陷入了“均值人”的泥潭之中。23“均值人”与社会事实的偏差,还受制于特定社会情境。假想两个社会,一个是相对稳态的社会结构,一个是经历社会变迁的社会结构,均值法在后者中的偏差(bias)就可能更大。这也是其他范式对实证主义的批评之一,正所谓“只见森林不见树木”。

　　(五)信度与效度

　　量化和测量是实证社会学必不可少的前提条件,测量又是量化的基础。测量的最大社会功能是“标准化”(standardization)。24社会学的大多数测量应当属于基础测量,其重要特点是始终和质性的概念相对应,也就是测量工具和概念本身是相互独立的,需要研究者在两者之间寻求一个可以接受的共识。25该类测量主要面临着信度和效度之间的张力。

　　以社会分层和流动领域为例,社会流动对FGH命题等一系列理论进行检验的跨国比较研究曾经盛极一时。26而要开展有效的跨国比较研究,必须解决如何测量阶层地位的问题。事实上,各个国家不仅拥有相异的阶级形成历史,在经济发展阶段上也存有差异,因此,相同职业在不同国家可能具有不同的社会意涵,在同一国家不同时期的社会意涵也可能发生变化。20世纪七八十年代,在欧美社会学家的共同努力下,最终形成了以EGP框架、27CAMSIS框架28和Wright框架29为代表的分层框架。

　　以上标准化的阶层框架看似较好地克服了阶级定位的困难,但也遭到了诸多批评。30从方法论的角度而言,对阶层(class)是唯名(nominalism)还是唯实(realism)的争辩,其实表明了在深层次上既有研究对阶层的测量信度和效度的分歧。那么,用一个经过严格标准化的分层框架,在某种程度上以牺牲测量效度为代价所得到的关于各国社会开放性的分析结果,在多大程度上可称为客观事实就难以有效识别。

　　除了横向的跨国比较,信度和效度的张力还表现在跨时期的比较中。仍然以分层框架为例,中国、日本、韩国、中国台湾等东亚学者立足于自身特征,对以上分析框架进行改造,提出了诸多新版本。31有研究发现,目前学界对中国的中产阶层规模缺乏一致的结论。32虽然这些结论所立足的分层框架存在差异,但是不同时期基于职业的阶层地位受到制度结构的影响可能有所不同;而该制度结构是受到市场和官僚调节的。33也就是说,相似职业地位在不同体制下的资源占有会随着时期变化而变化。

　　三、如何应对实证社会学方法的困境

　　针对以上实证社会学研究面临的方法困境,如何去较好地应对它们,既是个理论问题,也是经验问题。正如梅西(Macy)等所说的那样,“……我们缺的不是社会理论,而是数据的‘捉襟见肘’”。34数字时代不仅为实证研究提供了崭新的、海量的、非结构化的数据,而且催生了计算科学算力和算法的快速更迭,它们为应对实证研究方法的困境提供了难得的机遇。35具体来说:

　　首先,基于大数据、人工智能、物联网等新一代数字技术的发展、推广和应用,使得人类社会生活越来越暴露在数字化环境中,并且以数字系统作为社会交往的中介。36由此,数字技术带来的后果之一是在非常短的时间内为社会科学研究积累了海量的“弱设计”式数据,其中自动化记录的个体行为痕迹数据在实质上就是一种数字化。这种数字化为克服研究对象的选择性报告、观测变量的遗漏、研究者的知识“盲区”提供了可能。其次,伴随从数字社会向智能社会的转向,原来普遍存在的“数据孤岛”问题开始引起各国政府的重视,国内在这方面也做了诸多制度上的创新。大量的行政数据除了作为政府决策的依据,还为宏观社会事实的数字化提供了基础。最后,数字化对数据挖掘和分析技术提出了更高的要求。而人工智能等新技术大大提高了数据分析的算力,数据的丰富化也助推算法的改进,为实证社会学借力数字化提供了技术保障。

　　既然数字化为我们提供了数据、算力和算法上的有利条件,那么如何通过研究设计去克服实证社会学的基础性困境?同样作为实证主义阵营的心理学、经济学和数据科学等学科,在研究设计上做了许多有益的尝试。接下来,笔者结合几个具体的研究实例提出三点应对策略。

　　(一)测量的客观化与多维化

　　必须承认的是,实证社会学在科学化方面与心理学、经济学和政治科学都有一定差距。在笔者看来,这与社会学的研究对象及议题都有很强的关联。总体而言,实证社会学的测量的困境在主观变量上更为突出,利用大数据的数字化优势,可以在一定程度上强化主观变量测量的客观化水平,以回应信度与效度的张力。以大数据为主要特征的数字时代为实证研究提供了容量更大、结构更复杂、内容更丰富的数据集。37其中的痕迹数据并非根据研究设计收集所得。许多心理学家对脸书(Facebook)数据进行语言分析,以识别用户的心理特征,勾勒出个性的地理分布。38这种基于客户端的痕迹数据测量社会情绪的科学性和有效性,已经得到了相关研究的检验。39这些研究数据并不是研究者通过传统的问卷调查访谈所得,突破了个体对自身主观态度主观反映的局限,减少了研究者在相关变量操作化测量上的主观建构。

　　除了利用痕迹数据实现主观变量测量客观化,我们还可以通过新的信息采集趋势实现测量的多维化。英国社会学家塞维奇团队在2011年1月到2013年5月之间在英国实施了GBCS项目,共收集了N=325000的大样本;他们利用了BBC的平台进行20分钟的网络调查,被访者回答了经济、社会和文化资本等相关问题。40这个调查数据的体量远远小于严格意义上的大数据,但是收集的资料却是立体化的。研究者除了收集基于电子问卷结构化的内容,还获得了被访者的地理区位、应答时间及时长等信息。而且传统调查中难以接触的精英群体,也在调查中得到了较高的“曝光率”。

　　传统的实证分析往往采取标准化来提高测量的信度和效度,但对测量的完备性和有效性提出了较高的要求。利用数字技术的数字化有利于实现测量的客观化,尽可能降低各种基于学科偏见的主观构建;利用数字技术的多维化可以打破时间和空间的分离,增强测量的情境化。这种策略为突破传统的标准化路径提供了新的方法。

　　(二)大小数据的有效匹配

　　和自然科学研究相比,归纳和演绎在社会科学中很难是统一的。41在实证研究中,其主要表现为模型的过度拟合和结论的普遍性不足。在笔者看来,不同类型数据的有效匹配将有助于弥合两者间的割裂。具体而言,利用大数据的数据优势(内容、形式、容量),明显改善小数据中变量维度的局限,借助于计算科学方法(如机器学习)进行分析,类似于扎根理论归纳人类行为模式,通过小数据的检验后,将这种“局部”的发现扩展至更一般的社会群体。这在一定程度上既突破传统演绎的不足,又使得归纳变得更加有力。

　　目前,数据科学家在这方面取得了许多突破性的进展。譬如,布鲁门斯托克等人利用两个数据集的匹配,成功完成了关于财富不平等评估的研究。42该研究的大数据是从卢旺达最大的手机供应商那里得到的2005—2009年间约150万名用户的匿名记录,包括了每一次通话和每条短信的相关信息。和一般的大数据类似,这个巨大无比的数据不是“全”数据,缺乏完整的研究信息——财产状况的直接测量。首先,研究者对电话用户进行了随机抽样,选取了1000个家庭户,就家庭资产进行电话调查。然后借助于监督式学习(supervised machine learning),通过个人特征(从电话数据中获得)预测电话调查的填答信息,并将这个模型用于预测所有电话用户的家庭资产。最后,实现了对卢旺达的贫困和资产不平等高分辨度的评估。最近,在该研究的基础上,数据科学家又有了新的进展。43

　　毋庸置疑,大数据并不等于全数据,但是其变量的维度和颗粒化程度都远优于传统的小数据;而小数据虽然小,但是往往能够包括一些社会学家极为关心但被大数据遗漏的变量。之所以将大小数据“拼接”,就是要更大程度上发挥优势互补。这里的小数据,除了调查数据,还可以是行政数据,甚至是个案访谈资料(包括文字、影音等形式);而且两种数据的结合可以是“大为小用”“小为大用”,还可以是“相互检验”。要实现大小数据的完美匹配,这个结合点的选择非常关键。它不仅需要发挥社会学想象力,而且需要社会学家和数据科学家的通力合作。

　　(三)线上线下实验结合

　　在社会学中,实验法的运用远没有政治科学、经济学等社会科学那么频繁。实验法被公认为进行因果识别最为有效的手段,它在社会科学中的应用越来越广泛,44而它也因外部效度不足饱受诟病。在数字化的背景下,越来越多的社会科学家开始将传统的线下实验和线上实验相结合,以缓解相关和因果之间的紧张。线下实验可以在实验室进行,也可以是问卷实验、自然实验。这种新的趋势,笔者以为很可能对实证社会学来说是个难得的机会。

　　和普通的多实验结合交叉检验不同,数字时代更加强调在线实验的应用。奈等在探讨多元族群邻里与亲社会行为之间关系的研究中包括了5个子研究设计。45其中,研究2利用2013年美国波士顿马拉松比赛发生爆炸后志愿承担滞留游客住宿的公民居住信息,46以及公开的社区层面的行政数据,分析族群多样性和亲社会行为关联。研究5在网站(Amazon Mechanical Turk)招募400名志愿者进行在线实验,设置不同的邻里情境,并问他们如果出现爆炸(类似于研究2)是否愿意提供必要的志愿服务,基于此探究族群多样性和亲社会行为的解释机制。笔者认为,这种结合不仅有助于弥合心理学的内部效度与外部效度间的紧张,也为社会学提供了提高因果识别的可能。

　　实验法的最大特点是可控性和可重复性。数字化技术大大降低了线上实验的门槛,也为增强社会学因果机制识别、缩小微观向宏观跃升的断裂、扩大社会学理论的外部效度提供更多的可能。然而,囿于网上实验有着自身特定的适用范围,多样化线下实验的引入,并和线上实验相结合,需要有合理的总体设计。

　　结论与讨论

　　中国社会学从恢复重建至今已经走过40年,在学科建设、人才培养和学术成果上都取得了显着的成就。2016年以来,社会学界对本学科如何在“构建中国特色哲学社会科学和中国特色的话语体系”中发挥应有的作用展开了广泛讨论。虽然建立社会科学范式的关键在于本体创新,而不应局限于问题意识、概念和方法的创新,47然而,在当前中国社会科学的发展阶段,就研究方法层面开展讨论仍然是有必要的。

　　本研究从方法论的层面总结了实证社会学方法的五对矛盾——宏观解释与微观解释、数据驱动与理论驱动、相关分析与因果分析,同质性与异质性、信度与效度。其中的一些矛盾和社会学学科特性密不可分,而大数据、人工智能、物联网等新技术带来的数字化,可以用来应对这些困境。为此,本文还着重以研究设计为切入点,结合已有的相关研究,提出了测量的客观化与多维化、大数据和小数据的有效匹配、线上与线下实验结合等应对路径。

　　当然,对于国外同行利用最新的研究方法和巧妙的研究设计去克服传统方法难以解决的问题,我们仍然要保持谨慎的态度。毕竟,他们的问题意识、资料使用都与其特定的社会情境相关。诚如渠敬东教授所批评的那样,“任何技术都不是拿来就好用的,好的技术总是要对应着人性的设定、外部的条件、特定的文化基因以及一个社会长久的发展历史的,没有对这些问题的审慎考量,唯技术论、唯方法主义就是瞎子摸象,就是东施效颦”。48

　　与此同时,数字化对人类社会“反身性”49的强化也必须引起社会学的高度重视。实证社会学的“旧瓶”在数字时代可以从其他学科汲取研究方法上的养分,但不得不承认它在面对个体所理解的情境和能动行为的相互作用上所面临的挑战与日俱增。我们的定见认为,与经济学相比,社会学更擅长于调查,而社会的“反身性”强化对这种比较优势的冲击难以避免。本文所论及的应对传统实证社会学方法论内在“紧张”能否从实质上解决问题,仍有待进一步观察。

　　笔者认为,每一种研究方法都有着其自身出现的理由、发展的脉络和历史的使命。许多人认为,研究方法是服务于研究问题的,我们要从问题出发去选择方法。但是,此处想补充的是,作为方法的使用者(大多数人皆如此),理应看到研究者的个性(抑或气质)对研究方法理解、选择和运用的“调节作用”。笔者所理解的社会学研究方法中的内在紧张以及数字化应对,在缺乏“共识”的社会学中,很可能会受到各种批评;但是,传统的实证社会学在数字时代如何面对可能的挑战,如何缩小与数据科学家间的“鸿沟”,50是个非常值得深思的议题。

　　不可否认,要利用数字化去解决传统实证社会学的困境,是个系统化的工程。首先要获得数据,实际上,获取包括大数据在内的各种数据资料的技术、伦理和法律门槛在国内外都越来越高,数据占有的“马太效应”,51可能会使得学术共同体更加封闭。其次,要有较强的学科交叉的意识和能力。从某种意义上而言,社会学是一门向其他学科输送范式的基础学科,这也恰恰是合法性的根源。数字化作为工具应用于实证社会学,必须要从计算科学、心理学、生物学等学科中去理解数字化,对数字化与学科本身的关系要有清醒的认识,坚持用数字化为实证社会学的基础性关键命题寻求突破。笔者认为,大多数学科终将难逃知识生产“内卷化”的困境,学科交叉是实现实质性突破的重要途径。这就要求学者打破既有的知识结构和学科定见,增强知识迁移能力,从其他学科汲取养分。最后,传统的学术“个体户”或学术“师徒档”已经越来越难以胜任数字化的要求。因为数字化的生产过程要比传统实证研究更为复杂,单个学者很难完成从最初的理论问题提出到最终成果产出这整个长链条,团队的组织化程度增强在所难免。这种组织化不是简单的“1+1=2”的学术研究劳动密集型化,而是知识储备、研究能力、分析工具等多维度的“1+1>2”式有机融合。

　　注释

　　1谢宇:《走出中国社会学本土化讨论的误区》,《社会学研究》2018年第2期;翟学伟:《社会学本土化是个伪问题吗?》,《探索与争鸣》2018年第9期;周晓虹:《社会学本土化:狭义或广义,伪问题抑或真现实——兼与谢宇和翟学伟两位教授商榷》,《社会学研究》2020年第1期。
　　2边燕杰:《论社会学本土知识的国际概念化》,《社会学研究》2017年第5期;梁玉成:《走出“中国社会学本土化讨论的误区”的误区》,《新视野》2018年第4期;洪大用:《超越西方化与本土化——新时代中国社会学话语体系建设的实质与方向》,《社会学研究》2018年第1期。
　　3陈云松、贺光烨、吴赛尔:《走出定量社会学双重危机》,《中国社会科学评价》2017年第3期。
　　4边燕杰:《理论导向的实证社会学研究》,《中国社会科学评价》2015年第2期。
　　5邱泽奇:《迈向计算的社会学》,中国社会学会“计算社会学”专委会筹备会议主旨讲演,北京,2019年11月。
　　6D.A.Nielsen,“Social Fact?” in George Ritzer,ed.,The Blackwell Encyclopedia of Sociology,Oxford:Blackwell Publishing,2006,pp.4422-4424.
　　7陈心想:《社会学美国化的历程及其对建构中国特色社会学的启示》,《社会学研究》2019年第1期。
　　8Robert K.Merton,Social Theory and Social Structure,New York:The Free Press,1968.
　　9J.S.Coleman,Foundations of Social Theory,Cambridge:Harvard University Press,1990.
　　10赫斯特罗姆:《解析社会:分析社会学原理》,陈云松等译,南京:南京大学出版社,2010年。
　　11范晓光、陈云松:《中国城乡居民的阶层地位认同偏差》,《社会学研究》2015年第4期。
　　12王天夫:《社会研究中的因果分析》,《社会学研究》2010年第4期;梁玉成、陈金燕:《社会资本研究中的双向因果问题探索》,《社会发展研究》2019年第3期。
　　13Christopher Bernert,“The Career of Causal Analysis in American Sociology,” British Journal of Sociology,vol.34,no.2,1983,pp.230-254.
　　14王天夫:《社会研究中的因果分析》,《社会学研究》2010年第4期。
　　15陈云松、范晓光:《社会学定量分析中的内生性问题》,《社会》2010年第4期;陈云松:《逻辑、想象与诠释:工具变量在社会科学因果推断中的应用》,《社会学研究》2012年第6期。
　　16彭玉生:《社会科学中的因果分析》,《社会学研究》2011年第3期。
　　17Markus Gangl,“Causal Inference in Sociological Research,” Annual Review of Sociology,vol.36,2010,pp.21-47;John H.Goldthorpe,“Causation,Statistics,and Sociology,” European Sociological Review,vol.17,no.1,2001,pp.1-20.
　　18舒晓灵、陈晶晶:《重新认识“数据驱动”及因果关系——知识发现图谱中的数据挖掘研究》,《中国社会科学评价》2017年第3期。
　　19陈心想:《社会学美国化的历程及其对建构中国特色社会学的启示》,《社会学研究》2019年第1期。
　　20谢宇:《社会学方法与定量研究》,北京:社会科学文献出版社,2006年,第15—16页。
　　21Judea Pearl,“Detecting Latent Heterogeneity,” Sociological Methods and Research,vol.46,no.3,2017,pp.370-389.
　　22陈云松、范晓光:《社会学定量分析中的内生性问题》,《社会》2010年第4期。
　　23叶启政:《实证的迷失:重估社会科学经验研究》,北京:三联书店,2018年,第163—169页。
　　24叶启政:《实证的迷失:重估社会科学经验研究》,第123页。
　　25叶启政:《实证的迷失:重估社会科学经验研究》,第105—106页。
　　26Harry B.G.Ganzeboom,Donald J.Treiman and Wout C.Ultee,“Comparative Intergenerational Stratification Research:Three Generations and Beyond,” Annual Review of Sociology,vol.17,1991,pp.277-302
　　27R.Erikson and John H.Goldthorpe,The Constant Flux:A Study of Class Mobility in Industrial Countries,New York:Oxford University Press,1992.
　　28相关综述参见P.Lambert and D.Griffiths,Social Inequalities and Occupational Stratification:Methods and Concepts in the Analysis of Social Distance,Basingstoke:Palgrave,2018.
　　29Erik Olin Wright,Classes,London:Verso,1985.
　　30Kim A.Weeden and David B.Grusky,“The Case for a New Class Map,” American Journal of Sociology,vol.111,no.1,2005,pp.141-212.
　　31参见范晓光:《边界渗透与不平等:兼论社会分层的后果》,北京:社会科学文献出版社,2014年;H.H.M.Hsiao,ed.,East Asian Middle Classes in Comparative Perspective,Taipei:Institute of Ethnology,Academia Sinica,1999.
　　32朱斌、范晓光:《中产阶层抑或中等收入群体——当前中国中间阶层的再审视》,《江海学刊》2019年第1期。
　　33刘欣:《协调机制、支配结构与收入分配:中国转型社会的阶层结构》,《社会学研究》2018年第1期。
　　34Scott A.Golder and Michael W.Macy,“Digital Footprints:Opportunities and Challenges for Online Social Research,” Annual Review of Sociology,vol.40,2014,pp.129-152.
　　35Matthew J.Salganik,Bit by Bit:Social Research in the Digital Age,Princeton,NJ:Princeton University Press,2018.
　　36David Lazer and J.Radford,“Data Ex Machina:Introduction to Big Data,” Annual Review of Sociology,vol.43,2017,pp.19-39.
　　37L.Qiu,S.H.M.Chan and D.Chan,“Big Data in Social and Psychological Science:Theoretical and Methodological Issues,” Journal of Computational Social Science,vol.1,2018,pp.59-66.
　　38Hao Chen et al.,“Where You Are Is Who You Are?The Geographical Account of Psychological Phenomena,” Frontiers in Psychology,vol.11,2020,http://h-s.doi.org.forest.naihes.cn/10.3389/fpsyg.2020.00536.
　　39Y.Wu,Michal Kosinski and David Stillwell,“Computer-Based Personality Judgments Are More Accurate than Those Made by Humans,” PNAS,vol.112,no.4,2015,pp.1036-1040.
　　40M.Savage et al.,“A New Model of Social Class?Findings from the BBC’s Great British Class Survey Experiment,” Sociology,vol.47,no.2,2013,pp.219-250.
　　41赵鼎新:《社会科学研究的困境:从与自然科学的区别谈起》,《社会学评论》2015年第4期。
　　42Joshua Blumenstock,Gabriel Cadamuro and Robert On,“Predicting Poverty and Wealth from Mobile Phone Metadata,” Science,vol.350,no.6264,2015,pp.1073-1076.
　　43C.Yeh et al.“Using Publicly Available Satellite Imagery and Deep Learning to Understand Economic Well-Being in Africa,” Natural Communications,vol.11,no.2583,2020,p.2583.
　　44Michelle Jackson and D.R.Cox,“The Principles of Experimental Design and Their Application in Sociology,” Annual Review of Sociology,vol.39,2013,pp.27-49.
　　45J.Nai et al.,“People in More Racially Diverse Neighborhoods Are More Prosocial,” Journal of Personality and Social Psychology,vol.114,no.4,2018,pp.497-515.
　　46该信息的填写都在一个由Boston Globe建立的网站完成。
　　47赵鼎新:《从美国实用主义社会科学到中国特色社会科学——哲学和方法论基础探究》,《社会学研究》2018年第1期。
　　48渠敬东:《“末代武士”叶启政》,《北京日报》2018年3月26日,第16版。
　　49梁玉成、政光景:《打破技术治理悖论——从“默顿系统”迈向“牛顿系统”的技术治理转型》,《社会发展研究》2020年第1期。
　　50Ledford Heidi,“How Facebook,Twitter and Other Data Troves Are Revolutionizing Social Science,” Nature,vol.582,no.7812,2020,pp.328-330.
　　51最新综述可参见Achim Edelmann et al.,“Computational Social Science and Sociology,” Annual Review of Sociology,vol.46,2020,pp.61-81,http://h-s.doi.org.forest.naihes.cn/10.1146/annurev-soc-121919-054621.
　　52本文的主要内容曾在浙江大学清源学社“双周午餐会”（2019.11.20）报告。

作者单位：浙江大学社会学系

原文出处：范晓光.数字化与实证社会学研究方法困境化解[J].中国社会科学评价,2020(03):66-75+159.

相关内容推荐