首页 > 行业知识

什么是主题词表?为什么数据库和期刊对其越发重视?

栏目:行业知识作者:小编 发布时间:2021-12-15 14:31:11阅读次数:
       据说从前有个大夫,嘱咐十个患者“回去把膏药贴在手上”。结果第二天一看,有的贴在手掌心,有的贴在手背,有的贴在手腕,有的贴在指头上,甚至还有一位把膏药贴在了小臂。——题记   

什么是主题词表?为什么数据库和期刊对其越发重视?(图1)



       据说从前有个大夫,嘱咐十个患者“回去把膏药贴在手上”。结果第二天一看,有的贴在手掌心,有的贴在手背,有的贴在手腕,有的贴在指头上,甚至还有一位把膏药贴在了小臂。

——题记

什么是主题词表?为什么数据库和期刊对其越发重视?(图2)

       


上面这个小故事清楚地表明,语义不清将会造成多么严重的误会。人类社会是这样的复杂,人类语言是这样的丰富。我们似乎很享受这种微妙的状态,玩儿起各种文字梗来毫不客气。然而这对于科学研究和信息管理来讲可算不得什么好事。因为科学总是追求一种严谨的、确定的逻辑。所有的理论概念必须是确信且有界的。尤其是,概念和它的语言形式之间最好形成一一对应的关系。这样不仅讨论起来方便,更是科学文献信息化管理的必然要求。然而,即使是科学语言也不能完全避免歧义、模糊、用语不准确的情况。例如,美国国家医学图书馆(英文简称NLM,也就是编辑老师们熟知的Medline数据库的拥有者)在其官网上就有这样的表述:医学信息来自非常广泛的时间跨度和多样化的专业领域,以至于其术语实际上分属于几个不同的系统,结果其复杂程度和对沟通造成的障碍“几乎与印度的语言情况一样”。更不用说科学的发展日新月异,既有的理论概念不断发展变化;新的理论概念不断涌现出来。这就需要人为设定一套标准化词表,对一部数据库中的文献进行标注。这对于海量文献的搜素是十分必要的,毕竟谁都想在检索中一下找到最为相关的结果,而不想被无关信息的海洋所淹没。

       在现代文献数据库中,主题词表(Subject Headings),亦称叙词表(Thesaurus),正是为了解决这样的需求。从历史上看,“叙词表”指的是“同义词词典”,是诗人作家们炼字炼句的工具书。如果同义词还不够用的话,那么还得能查询近义词、反义词,最好还能查到在语义上具有上下层级关系的词语。现如今,主题词表已经变成一种由特定领域内表达事物概念的术语及术语之间的各种语义关系组成的,在信息检索系统中应用成熟、功能完善的知识组织工具。


什么是主题词表?为什么数据库和期刊对其越发重视?(图3)


很多数据库都会强调自己的主题词表设计合理、功能强大,能够很好地满足使用者的需求。比如,食品科学领域的FSTA数据库就强调,其独有的FSTA主题词表,堪称食品、营养学科之百科全书。该数据库收录内容广泛,涉及食品科学与技术、生物技术、微生物、毒理学、纳米技术、食品安全、转基因技术、公共健康、食品添加剂、营养学、饮料、食品包装以及宠物食品等所有与人类营养相关的各个专题。这是强调其覆盖范围的广泛性。而以物理、电气工程、计算机与控制、生产制造为主要学科领域的INSPEC数据库则更强调其主题词表在功能上的强大。他们声称,所有数据均已被数据专家人工添加了独有的叙词。根据科研不同需求,数据专家针对不同的数据类型添加各种代码和标识来提高检索效率。在此基础之上,其分析工具Inspec Analytics还可以实现引用数据分析、全球机构分析、研究热点趋势分析、前沿科技术语分析、上下游及交叉研究发展分析等功能。

在各大数据库的叙词表之中,最有影响力的恐怕要数MeSH,即《医学主题词表》(Medical Subject Headings)了。它是国际上公认最权威的叙词表,由美国国立医学图书馆(NLM)编制,广泛应用于生物医学及健康相关文献的标引、检索、图书编目及数据库建设。


什么是主题词表?为什么数据库和期刊对其越发重视?(图4)


MeSH最早出版于1960年,由各个领域的学科专家不断更新。每年都会增加数百个新概念,并进行数千次修改。对于MeSH,叙词是一种在文献标引与检索中用以表达文献主题的规范化主题词,其它与叙词含义相同或相近的关键词统称为入口词。叙词由一个或多个概念组成,概念又包含一个或多个同义术语。在 2017 年的版本中,MeSH共有28472个叙词、约十万个入口词,约3万个“概念”和20多万个“补充概念”,形成了共有16个大类、层级最深达13级的等级结构,并采用树状结构表代替传统的分类表。总之,MeSH提供了一种可靠的方式来查找具有不同术语但相同概念的内容,因此即便模糊的搜索也可以得出精确的结果。

实际上,MeSH 已成为世界各国生物医学信息资源的通用信息组织标准,世界上大部分的生物医学文献数据库都以 MeSH 为基础建立,我国也不例外。《中文医学主题词表检索系统》(MeSH的中文翻译版,又称CMeSH)、《中国药学主题词表》、《中国中医药学主题词表》,《军用医学主题词表》、《航空航天医学主题词表》、《肿瘤专业文献分类主题一体化词表》等叙词表都与美国的 MeSH 词表在结构上保持一致。



什么是主题词表?为什么数据库和期刊对其越发重视?(图5)

可见,主题词表和科技术语的规范化是紧密联系在一起的。科技术语的规范化是反映期刊质量的一个重要参照标准,尤其是出现在摘要和关键词当中的术语,运用是否规范、准确、恰当,是很能够体现作者、编辑的学科素养的,亦是体现期刊学术水准的一个方面。然而很多中国期刊论文的关键词,都是从文章标题中直接摘取,缺乏规范性。可喜的是,我们看到现在越来越多的期刊对术语的规范化进行要求,甚至明确提出要以某个数据库的主题词表(如MeSH)为准。这样不仅可以提高学术规范性,而且便于数据库进行技术处理,对中国期刊进入国际数据库也大有帮助。

想了解更多数据库知识,请扫描下方二维码,联系科置科学小秘书。


什么是主题词表?为什么数据库和期刊对其越发重视?(图6)


相关文章

  • 岂止于心——APA PsycInfo数据 法国文豪雨果有句名言:世界上最广阔的是海洋,比海洋更广阔的是天空,比天空更广阔的是人的心灵。是的,人的心灵如此广阔,对人类心灵的洞察——心理学研究——也得同样广阔才行。心理学是一门研究人类心理现象及其影响下的精神功能和行为活动的科学,它同时与人类自身...
  • 如何利用Twitter有效推广学术期刊? 随着互联网的快速发展,各种新兴的现代社交媒体平台被越来越广泛地应用到学术交流与宣传中。借助于各种社交媒体的巨大影响力,学术信息能够获得更迅速的传播,并得到更多科研人员的关注。因此,各类社交媒体现在逐渐成为了学术期刊提升关注度、知名度和影响力的新渠道。...
  • 言者无意,听者有心——如何在学术写作中使 我们生活在一个纷繁复杂的社会,人群之间难免出现差异和不平等。人群间的不平等或直接或间接地反映在我们使用的语言之中——不仅是口头语言,就连学术语言也难以独善其身。当学者在撰写一篇论文,并需要指代特定人群的时候,一不小心,就有可能对他人造成冒犯。言者无意...
  • 提升期刊影响力的学术社交媒体平台,你使用 互联网和数字技术的加速发展,改变了人们的阅读习惯以及获取信息的方式。在此背景下,我国学术期刊想要在国际期刊界占据一席之地,除了更为积极地争取优质稿源之外,利用各类大众社交媒体与学术社交媒体平台对期刊进行推广宣传也十分有必要,继而扩大期刊在全球范围内的...
  • 期刊名称有变动,需要重新申请ISSN号吗 我们都知道,一本规范的期刊一定有自己唯一的ISSN号。ISSN号和期刊名称一一对应,就好像是期刊的身份证号一样。那么,一旦确定了ISSN号,期刊还有机会改名吗?改名需要重新分配ISSN号吗?本次推送我们就来介绍ISSN国际中心有关名称登记和更改的有关...
  • 学术期刊如何注册DOI? DOI为英文Digital Object Identifier的缩写,其中文名称为“数字对象唯一标识符”。DOI为网络上的数字化信息(如文章、报告、书籍或视频等等)提供了全球唯一且永久的身份标识,这个身份识别符不会随着时间和空间的改变而改变。如果数字...
  • CI指数和“超越指数”超越了什么? 无论是是一项研究、一篇文章、一位学者,还是一本期刊,都需要客观评价。在现有的体系下,如果我们不得不去使用一套量化指标来计算一本期刊的质量,那么最好还是在算法上多下下功夫。——题记在刚刚过去的2022年7月5日,中科院文献情报中心宣布,在今后的JCR中...
  • 成为中文核心期刊,需要录入哪些国际数据库 中文核心期刊目录,又称北大核心期刊目录,由北京大学图书馆联合学术界众多权威机构、专家共同评选而成,是我国最具影响力的三大核心期刊目录之一,被称为“中国的SCI”。中文核心期刊目录具有严格而复杂的遴选体系,涉及了期刊文章的被摘量、被引量、影响因子、基金...