学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 社会学论文 > 社会科学论文

DCI已收录社会科学数据的统计分析

来源:学术堂 作者:韩老师
发布于:2015-02-06 共3572字
论文摘要

  引言

  社会科学数据( Social Scientific Data) 是描述社会科学研究对象、方法、条件、状态和其他因素的事实、数字、文字和符号,主要类型有调查数据、统计数据、记录数据、实验及模拟数据等[1,2]。在大数据背景下,社会科学数据已经越来越被视为国家的一种战略资源[3]。开放及共享社会科学数据,可以再现和验证社会科学研究过程与结果,提升研究成果质量; 可以启发其他研究者利用现有数据提出新的研究问题,推动研究创新; 可以促进社会科学研究成果为公众、企业、政府所用,充分发挥研究成果的潜在价值[4,5]。

  2012 年,汤森路透在 Web of Knowledge 平台上推出了新产品 DCI ( Data Citation Index) ,它搭建了科学研究工作者与全球数据知识库之间联接的桥梁[6]。在 DCI 数据库中,每条数据记录包括数据所属的数据知识库、国家、机构、文献类型、出版年、被引频次、SU 类别等字段。截止 2014 年 6月 12 日,DCI 收录自然科学( 3291397 条) 及社会科学( 551059 条) 数据记录共 3842456 条。

  本文对 DCI 收录的社会科学数据记录的国家/地区分布、机构分布、文献类型分布、学科分布及被引用情况进行统计分析,以期发现其规律、特征,为我国社会科学数据的管理与应用提供参考。

  一、数据采集

  在本文中,所采集的社会科学数据记录包括DCI 在 SU( Subject Area) 分类下的社会科学、人文& 艺术和图书情报学。在 DCI 的高级检索界面下,将社会科学的 24 个子类学科、人文 & 艺术的14 个子类学科、图书情报学科通过逻辑连接词“or”形成一个检索式,即“ su = Women's Studiesor su = Urban Studies or …… or su = InformationScience & Library Science”,按照这个检索式进行检索并采集数据。截止2014 年6 月12 日,通过这种采集方法,获得 DCI 社会科学数据记录 551059条。

  二、数据分析

  为分析社会科学数据的开放共享程度和学术影响力,本文从国家/地区、机构、文献类型、学科类别 4 个方面统计并计算了 DCI 社会科学数据的记录数、被引记录数、被引次数、H 指数 4 个评估指标。记录数指标用于评估社会科学数据的开放共享程度,该指标越大,说明开放共享程度越高。

  被引记录数、被引次数、H 指数用于评估社会科学数据的学术影响力,这 3 个指标越大,说明学术影响力越高。

  ( 一) 国家/地区统计分析

  本文利用从 DCI 中采集的 551059 条记录统计并计算了各个国家/地区的评估指标,并列出记录数靠前的10 个国家,如表 1 所示。从记录数看,美国的记录数最大,为 81261 条,占总记录数的 14.746% ,其次是德国和英国,记录数分别为 13351、2180 条,所占百分比分别为 2. 423% 、0. 396% 。从被引记录数看,美国的被引记录数最大,为 2714 条,其次是澳大利亚和英国,被引记录数分别为 396、256 条。从被引次数看,美国的被引次数最多,为37843 次 ,其次是英国和澳大利亚,被引次数分别为3533、2905 次。从 H 指数看,美国的 H 指数最大,为84,其次是英国和加拿大,H 指数分别为 25、21。

  由此看出,在社会科学数据领域中,美国、德国、英国的数据开放共享程度相对较高。同时,美国、澳大利亚、英国的平均被引记录数、平均被引次数、平均 H 指数分别为 1122、14760、43,明显超过其他国家的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,美国、澳大利亚、英国的数据学术影响力相对较高。【1】

论文摘要

  
  本文利用从 DCI 中采集的 551059 条记录统计并计算了各个机构的评估指标,并列出记录数靠前的 10 个机构,如表 2 所示。从记录数看,美国商务部的记录数最大,为 35484 条,占总记录数的 6. 439%,其次是慕尼黑大学和国际粮食政策研究机构,记录数分别为 9602、5080 条,所占百分比分别为 1. 742%、0. 922%。从被引记录数看,密歇根大学的被引记录数最大,为 418 条 ,其次是美国商务部和美国司法部,被引记录数分别为 396、326条。从被引次数看,美国商务部的被引次数最多,为 8164 次 ,其次是密歇根大学和美国司法部,被引次数分别为 5863、3052 次。从 H 指数看,美国商务部的 H 指数最大,为 45,其次是密歇根大学和美国司法部,H 指数分别为 41、25。

  由此看出,在社会科学数据领域中,美国商务部、慕尼黑大学、国际食品政策研究机构的数据开放共享程度相对较高。同时,美国商务部、密歇根大学、美国司法部的平均被引记录数、平均被引次数、平均 H 指数分别为 380、5693、37,明显超过其他机构的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,美国商务部、密歇根大学、美国司法部的数据学术影响力相对较高。

  ( 三) 文献类型统计分析

  DCI 将其收录的记录分为 3 种文献类型,数据知识库( Repository) 、数据研究( Data Study) 、数据集( Data Set) 。数据知识库是包含数据研究和数据集的数据库或集合,提供原始数据的存储和访问。数据研究是对知识库中保存的研究或实验的描述,包括长期的系列或纵向研究。数据集是数据知识库提供的一个或一组具有内在联系的数据文件,是集合、数据研究或实验的一部分[7]。

  本文利用从 DCI 中采集的 551059 条记录统计并计算了 3 种文献类型的评估指标,如表 3 所示。从记录数看,数据集的记录数最大,为 507220条,占总记录数的 92. 045%,其次是数据研究和数据知识库,记录数分别为 43790、49 条,所占百分比分别为 7. 947%、0. 009% 。从被引记录数看,数据研究的被引记录数最大,为 5841 条 ,其次是数据集和数据知识库,被引记录数分别为 30、9条。从被引次数看,数据研究的被引次数最多,为78509 次 ,其次是数据知识库和数据集,被引次数分别为 6859、71 次。从 H 指数看,数据研究的 H指数最大,为 140,其次是数据知识库和数据集,H指数分别为 7、4。【2】

论文摘要

  
  由此看出,在社会科学数据领域中,文献类型为数据集的数据开放共享程度相对较高,文献类型为数据研究的数据学术影响力相对较高。
  
  ( 四) 学科类别统计分析
  
  本文利用从 DCI 中采集的 551059 条记录统计并计算了各个学科类别的评估指标,并列出记录数靠前的 10 个学科,如表 4 所示。从记录数看,地理的记录数最大,为 376918 条,占总记录数的 68. 399%,其次是社会学和人口统计学,记录数分别为 48260、45750 条,所占百分比分别为 8.758% 、8. 302% 。从被引记录数看,社会学的被引记录数最大,为 2117 条 ,其次是商业与经济和人口统计学,被引记录数分别为 1114、1005 条。从被引次数看,社会学的被引次数最多,为 35505次,其次是人口统计学和商业与经济,被引次数分别为 21992、1884 次。从 H 指数看,人口统计学的H 指数最大,为 96 ,其次是社会学和商业与经济,H 指数分别为 94、85。

  由此看出,在社会科学数据领域中,地理、社会学、人口统计学的数据开放共享程度相对较高。同时,这3 个学科类别的平均被引记录数、平均被引次数、平均 H 指数分别为1412、19793、91,明显超过其他学科类别的被引记录数、被引次数、H 指数,可知在社会科学数据领域中,社会学、人口统计学、商业与经济学科的数据学术影响力相对较高。【3】

论文摘要

  
  三、结论及对我国的启示

  本文从 DCI 中采集了社会科学、人文 & 艺术、图书情报学的数据,利用这些数据从国家/地区、机构、文献类型、学科类别4 个方面进行统计分析,得出了相关结论,并得到对我国的相关启示:

  ( 1) 从国家/地区分析结果可以看出,在社会科学数据领域中,欧美国家的数据开放共享程度和学术影响力相对较高。建议我国完善社会科学研究管理办法,建立我国社会科学数据开放制度,提高我国社会科学开放数据的量与质,在此基础上,逐步建立我国的社会科学数据引文索引库,促进我国社会科学数据的开放与应用。

  ( 2) 从机构分析结果可以看出,在社会科学数据领域中,政府的社会科学数据开放共享程度和学术影响力相对较高。建议我国在遵循《国家保密法》的前提下,建立政府数据中心,加强对政府数据的开放与应用,中心可由政府委托国家图书馆、国家档案馆、公立高校图书馆等建设。

  ( 3) 从文献类型分析结果可以看出,在社会科学数据领域中,文献类型为数据研究的数据的学术影响力相对较高。建议我国的社会科学研究管理部门形成原始研究数据报告与公开制度,并建立相应的原始研究数据中心。如国家社科规划办可形成国家社科基金项目的原始研究数据报告与公开制度,并建立“国家哲学社会科学基金项目原始研究数据中心”。同样,各省( 市、区) 社科规划办也可形成各省( 市、区) 社科基金项目的原始研究数据报告与公开制度,并建立“各省( 市、区) 哲学社会科学基金项目原始研究数据中心”。这样,有利于确保社科基金项目的研究质量,有利于社科研究成果的再利用,有利于哲学社会科学的创新发展。

  ( 4) 从学科类别分析结果可以看出,在社会科学数据领域中,社会学、人口统计学的数据开放共享程度和学术影响力相对较高。建议我国建立以我国社会科学重点学科、重点实验室、重点研究基地为中心及图书馆积极参与的各个学科的数据中心。

相关标签:
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站