CSSCI 数据库中作者机构字段默认就是精确检索。
CNKI 数据库中单位字段提供精确或模糊两种选择。这里要说明的是在机构检索时需要选择“模糊”,因为 CNKI 中“精确”是与所输入检索词完全匹配,而机构地址通常都是某大学某学院某系等信息,选择“精确”就会造成漏检很多。
中文数据库由于没有语言问题,相对来说检索规则也较简单,不再另述其检索技巧。都可以区分核心版和非核心版。需要注意的是,一定要将机构名称的常用名、别名、简写或缩写找全,并配合地址和邮编来检索,这样才能保证检索结果既全面又准确。
4 机构检索在英文数据库中的检索技巧
根据我们多年的实际工作经验,认为初步设定检索式时要尽可能的放大范围以保证检索全面; 同时,既考虑增加检索条件,又要使用算符,确保检索准确性。当机构名称较长时,不容易引起干扰; 机构名称简单,则干扰项会很多。
4. 1 机构名称较长,直接用机构名称检索引起的干扰项较少
以华北水利水电大学为例,检索该机构 2013 年发表的论文在数据库中收录情况。
该机构的正式英文名称及邮编为:North China University of Water Resources and ElectricPower ,Henan Zhengzhou 450011地址字段输入邮编 450011,浏览可发现该机构的其他不规范写法,例如:“水利”有用 Water Resources 或 Water Conservancy,“水电”有用 Electric Power 或 hydroelectric Power,“学院”有用 U-niversity 或 institute.
以 SCI 为例,SCI 数据库中地址字段检索时默认词与词之间的精确顺序,构造检索式如下:ad = ( N* China ( Univ* or inst* ) Water ( Conservan*or Resource* ) ( Elect* or Hydroelec* ) Powe* or 450011)以 EI Compendex 为例,EI Compendex 数据库检索时默认词与词之间就是“and”关系,不指定检索词的顺序。这个原则适用于地址字段。所以实际检索时要具体情况具体分析。考虑到该机构名称较长,模糊检索,干扰项也不会太多。所以直接将检索式变更为 EI 中格式即可,如下:( N* China and ( Univ* or inst* ) and Water and ( Con-servan* or Resource * ) and ( Elect * or Hydroelec * ) andPowe* ) wn AF or 450011 wn AF
4. 2 机构名称简单,直接用机构名称检索引起的干扰项很多
当机构名称较短时,就会有很多干扰项。如检索“河北大学”,该机构正式名称及地址如下:Hebei University,Hebei Baoding 071002在 SCI 地址字段输入 Hebei Univ* 检索,会发现以 Hebei Univ* 打头的各种干扰项,如: HEBEIUNIV TECHNOL 、HEBEI UNIVERSITY OF TECH-NOLOGY、HEBEI UNIVERSITY OF SCIENCE TECH-NOLOGY 、HEBEI UNIV ECON BUSINESS 等等;在 EI 地址字段输入 Hebei Univ* 检索,会发现只要地址字段中包含了 Hebei 和 University 两个词,就满足了检索条件,导致检索结果极不精确,除了上述干扰项,还会有诸如: HEBEI MEDICAL UNIVER-SITY、HEBEI NORTH UNIV、HEBEI UNITED UNIV等等。
这时,一方面可以通过增加检索条件,如将机构名称与地址或邮编组合检索来缩小范围使得检索结果更精确。也避免了漏检同时将地址和邮编都写错的情况。
以 2013 年 SCI 收录为例:原检索式: ad = ( hebei univ* ) and py =2013 检索结果:1023 条修改为: ad = ( Hebei Univ* and ( Baoding or 071002) )and py = 2013,检索结果: 469 条可以看出修改后的检索式大大提高了准确率。
然后再在这个相对准确的结果中去确认就容易得多。
以上操作都是基于先将范围最大化从而不会漏检,保证检索结果更全面的角度出发。
另一方面,巧妙使用数据库中的算符以提高准确率。
以河北北方学院 2013 年发表论文的 SCI 收录情况为例:机构正式名称及地址: Hebei North University,hebeiZhangjiakou 075000North 在数据库中有可能以 NORTH 或 N 或 Northern出现。
构造原检索式: ad = hebei n* univ* and py =2013 检索结果: 450 条情况 1: 粗略浏览检索结果发现干扰项 HEBEI NORMALUNIVERSITY 很多,去除干扰项,检索式修改为: ad = ( hebein* univ* not hebei norm* univ* ) and py = 2013 检索结果: 59 条但这样会将地址字段既有河北北方学院又有河北师范大学的条目也去掉,所以补充修改检索式为:( ad = ( hebei n* univ* not hebei norm* univ* ) or ad= ( hebei nort* univ* and hebei norm* univ* ) ) and py =2013 检索结果: 60 条情况 2: 使用地址与名称组合检索。如上文中介绍,在 SCI 地址字段检索时,算符 SAME 有将检索词限制于同一地址检索的功能,所以做对比如下:原检索式: ad = ( hebei n * ( univ * or coll * ) and( zhangjiakou or 075000) ) and py =2013 检索结果: 60 条修改为: ad = ( hebei n * ( univ * or coll * ) same( zhangjiakou or 075000) ) and py =2013 检索结果: 58 条可见,使用 same 算符后检索结果更精确。
再以 EI 数据库中地址字段检索举例说明:原检索式: Hebei north* univ* wn af 发表时间: 2013 年检索结果: 640 条( 可以单独检索 hebei n univ* 以补充全面)如上文介绍,位置算符 NEAR 或 ONEAR 可以使检索结果更准确。可以修改检索式如下,以便看出其中差别:#1 Hebei NEAR north NEAR university wn af 发表时间:2013 年 检索结果: 92 条#2 Hebei ONEAR north ONEAR university wn af 发表时间: 2013 年 检索结果: 76 条#3 Hebei NEAR /0 north NEAR /0 university wn af 发表时间: 2013 年 检索结果: 74 条#4 Hebei ONEAR /0 north ONEAR /0 university wn af 发表时间: 2013 年 检索结果: 74 条注释: #1 和#2 中没有指定相邻几个词时,默认是 4 个词。即 NEAR 等同于 NEAR/4.
可以看出,检索结果变少,范围缩小。以上检索默认数据库打开 Autostemming 功能,自动进行词干检索,如 north 的变形 northern 也包含在检索结果内。这个功能也可以通过使用词干搜索符号 ( $ )实现。修改检索式为:#5 Hebei ONEAR /0 $ north ONEAR /0 $ university WNAF 发表时间: 2013 年 检索结果: 74 条但是,由于 NEAR 或 ONEAR 算符不能与* 、?、( ) 、{ } 、“”同时使用,尤其是截词符* ,这就使得检索结果不全面,如检索式#1 到#5 均无法检索到 uni-versity 的缩写 univ.
以上仅是为了说明算符的重要性,在实际检索时要将上述几项合并使用。
5 建议
( 1) 有关单位规范机构和地址名称及其英文翻译名称,科技工作者在撰写论文时也要采用正式的机构和地址的中英文名称,减少不规范因素,这样就不会漏查; 检索人员应多学习数据库的着录规则,了解不同数据库的着录格式,在构建检索策略时更加全面更加精确,提高查全查准率。
( 2) 相关工作人员在做机构检索时,可以按照下述方式进行: 与委托单位科研处沟通,获知该机构的正式名称与地址,以及是否有曾用名称、地址邮编的变化等信息,这样在检索之前全面了解被检索机构的各种信息; 充分利用数据库不同的着录规则去检索,获取到相关检索结果并反馈给科研处; 请科研处人员确认并发布,收集极个别的遗漏信息再单独补充。这样完成的机构检索就既全面又准确了。
参 考 文 献
[1] 张 冰。 科技期刊学术论文中作者单位名称着录存在问题及建议[J]. 内 蒙 古 大 学 学 报 ( 自 然 科 学 版) ,2009 ( 2) :225 - 228.
[2] 谢 群。 在 WebofScience 中准确进行中文机构检索的方法研究[J]. 图书馆论坛,2011( 1) : 155.
[3] 于澄洁。 EiCompendex 数据库作者机构检索技巧[J]. 图书馆杂志,2010( 12) : 29 -30.
[4] [ EB/OL].webofknowledge. com/WOKRS5132R4. 2 / help.[2014 - 11 - 30].
[5] [EB/OL].[2014 - 11 -30].
[6] 孙 君,陈 陶。 提高文献查全率和查准率的有效途径_省略_算符_位置算符和通配符的灵活运用_孙君[J]. 现代情报,2006( 10) : 167 - 169.
[7] 韩 欣,刘子忠。 ESI 计量分析数据库的功能与科学评价---以中国地学研究机构的科学评价为例[J]. 地质科技情报,2010( 1) : 138 - 142.