您的当前位置:首页正文

医学信息检索方法综述

2021-10-18 来源:星星旅游
医学信息检索方法综述

龚颖芸

(南京医科大学,211166)

摘要:医学信息检索从早期基于纸质出版物到现在网络化的检索,发生了巨大的变化。掌握医学信息检索的基本方法,特别是一些重要数据库使用的基本操作,在科研领域有很大的实际意义。

关键词: 信息检索 信息检索方法 医学信息检索方法

引言:信息检索是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。[1] 信息检索作为一种信息素养的基本功,在科研中对课题的开展、论文的写作等方面起着举足轻重的作用。时至今日,各类出版物种类之多,数量之大已经到了前所未有的地步,特别是随着计算机技术和通信技术的不断发展,计算机网络已经成为世界上最大的信息资源库,网络中的信息具有资源量大、分布广、离散程度高、组织形式多样化、更新速度快、规范化程度不高等特点[2],掌握科学的信息检索方法去高效获取所需的高质量信息显得富有重要意义。本文立足于医学本科生的基础科学研究,概述了一些常用的可行性高的医学信息检索方法。

1.信息检索的分类

1

信息检索按存储和检索的内容划分为文献信息检索、数据信息检索、事实信息检索;按系统中信息的组织方式划分为全文检索、超文本检索和多媒体检索。[3] 与本科生基础科研相关性最大的信息检索类型是文献信息检索,即以文献为检索对象,将存储于数据库中的关于某一主题文献的线索查找出来的检索。[3] 全文检索寂静在国内外许多数据库中普及。

2计算机检索方法[4]

(1)布尔逻辑检索,基本运算形式有①逻辑“与”,一般用AND或“*”号表示②逻辑“或”,一般用OR或“+”号表示③逻辑“非”,一般用NOT或“-”号表示。布尔运算符的优先级为:-、*、+,使用括号可改变运算顺序。此法对于检索多个关键词及它们之间的逻辑关系很是准确。

(2)位置逻辑检索,用一些特定的位置逻辑算符来限定检索词之间的关系,使检索提问式尽可能表达检索着真正的检索意图,从而既提高检准率,又提高检全率。主要的位置逻辑算符有①(W)-with。在(W)两侧的检索词顺序不能改变,而且两个检索词之间不能有其他的词或字母,但是允许有空格或标点符号。②(nW)-nWords。在(nW)两侧的检索词顺序不能改变,两个检索词之间最多允许插入n个词。③(N)-Near。在(N)两侧的检索词顺序可以调换,而且两个检索词之间最多可以有10个词④(nN)-nNear。在(nN)两侧的检索词顺序可以调换,而且两个检索词之间最多可以插入n个词⑤(F)-Field。在(F)两侧的及爱你所词顺序可以调换,而且两个检索词之间的词的个数也不限,但是它们必须同时出现在文献记录的同一个字段内。在实际运用中,位置逻辑检索用起来不是很方便,但在强调特殊限定的时候可以一用。

2

(3)截词检索,指在检索词中保留相同的部分,用截词符号代替可变化的部分,以提高检全率。截词符号一般用“?”代表0个或1个字符,用“*”代表n个字符。

(4)字段检索,指将检索词匹配的限定在某个或某些特定的字段范围内进行。

(5)精确检索,将一个短语(词组)当作一个独立的运算单元,往往用双引号括起来,进行严格匹配提高查准率。

(6)加权检索:加权检索是为了弥补布尔逻辑检索不能揭示检索概念与检索课题相关程度的缺陷。

3文献数据库概念及分类

文献数据库是指记录各种文献信息的数据库,它是计算机可读的、有组织的相关文献信息的集合。几种主要的文献数据库有题录数据库、文摘数据库、图书馆馆藏目录数据库、全文数据库、光盘数据库、多媒体数据库和网络数据库。

4外文数据库

4.1PubMed检索系统

PubMed(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi)是目前世界上使用最广泛的免费Medline检索系统,它提供Medline、PREMedline等数据库的检索。

3

4.1.1主要检索方法[5]

4.1.1.1主题检索

在PubMed主页的提问框中键入英文单词或短语(大写或小写均可)后回车或点击“Go”,PubMed即时用词汇自动转换功能进行检索,并将检索结果直接显示在主页下方。例如:键人“liver cancer operation”后回车或点击“Go”,PubMed开始检索并将检索结果显示出来。如果检索结果不符合要求,可以在提问框中增加或删除词语。或者在Details状态下来修改检索式,也可使用Limits选择限定条件后再进行检索。此外,用户可根据需要使用通配符“*”或双引号进行截词检索或强制检索。为提高文献检出的准确率,推荐使用主题词检索。例如需检索哮喘的药物治疗方面的文章,可先在开始菜单中选择MesH Database,输入检索词,但此外不能输入有运算符的语句,如“asthma AND therapy”。在MesH菜单中选择规范的主题词,“Asthma”,根据检索需要.再选择相应的副主题词“drug therapy”在search PubMed中形成“Asthma/drug therapy[MesH]”的检索式,执行检索。4.

4.1.1.2著者检索

在提问框中键人著者姓氏全称和名字的首字母缩写。格式为:著者姓空格名字首字母缩写.例如smith ja,然后回车或点击Go,系统会自动到著者字段去检索,并显示检索结果。如果在录入了著者的姓氏,系统将首先在MeSH转换表中查找该著者的姓。查到后,系统检索主题字段和题名与文摘字段。否则,系统将在全部字段中检索。如果在著者姓名前后使用双引号,并用著者字段标识——[au]加以限定,如“smith ja”[au],系统只

4

检索著者字段。

4.1.1.3刊名检索

在提问框中键入刊名全称或MEDLINE形式的简称、ISSN号,例如:Jchild Psychol Psychiatry,或0021—9630,然后回车或点击Go,系统将在刊名字段检索,并显示检索结果。

4.1.1.4高级检索功能

为了得到更为准确的检索结果.用户可充分利用PubMed所提供的高级检索功能。在PubMed首页检索框下,系统提供了5个功能按钮,通过利用这5个功能,能够使用户的检索更为高效。

4.1.1.4.1 Limits功能

有如下限制检索功能:将检索范围限制在某个作者范围;将检索范围限制在某个期刊;设定搜索包含全文、免费全文、文摘的论文:将检索范围限制在出版、收录的某时间段:将搜索范围限定在特定的性别组、年龄组;将搜索范围限定在人类或动物学:将检索范围进行子集限制;对论文类型进行限定。

4.1.1.4.2 Preview/Index功能①预览检索结果数量在检索框中输入检索词后,点击后,用户能够得到该检索词检索结果数量,如需缩小检索范围可在此基础上在检索框中继续添加检索词,点击,能够再次得到新的检索词的检索结果数量。通过该功能用户可以根

5

据需要来调整检索策略;②字段限制在页面下端的检索界面中,从下拉菜单中选择检索字段,在检索框中输入检索词,根据检索需要,点击布尔逻辑运算符添加到检索词中进行再限制检索,其目的能够缩小检索范围。使用户能够快速地找到需要检索的文章,最后点击进行检索结果预览;③Index选词功能在检索框中输入检索词,点击,系统显示词表.并显示该检索词检索结果数量.在词表中选择检索词。选择布尔逻辑算符,选中的检索词将出现在页面上方检索框,并按选中布尔逻辑运算符进行运算。

4.1.1.4.3 History功能

History功能中保留着所有的查询方案与查询结果。History界面能够为用户提供历史中的检索方案、检索时间以及检索结果。与Preview/Indea功能中的预览功能不同,预览功能只能显示最近检索的三条记录,而History功能能够为用户提供最近的100条检索记录。需要注意的是当检索记录超过100条时.系统将会依次将最早的记录删除。点击,系统将删除History功能及Preview/Index功能中保留的记录。4.1.1.4.4 Clipboard剪切板功能

剪切板功能能够为用户提供暂时保存检索论文的服务。将论文添加到剪切板后用户能够采用打印或保存等方式对剪切板中保存的检索论文进行处理。剪切板能够同时保存最多500条记录,当8 h内用户没有任何操作。保存将会自动删除。

4.1.1.4.5 Details功能

Details功能用于用户查看检索策略。在Query Translation框内显示了用户在检索框中

6

输入检索词检索,系统实际所采用的检索策略。在Query Translation框下依次为Result、Translations、Database以及User Query 4部分。Result显示了检索结果总条数,点击该数字可回到检索结果界面。Transition显示检索框中检索词在实际检索中所转换的检索式。Database显示进行检索的数据库。User Query显示了用户检索时在检索框中所输入的检索词。

4.1.2检索技巧

4.1.2.1 多项单词逻辑组合检索PubMed支持布尔逻辑算符“AND”、“OR”、“NOT”进行再限制检索,其目的能够缩小检索范围,使用户能够快速地找到需要检索的文章。

4.1.2.2截词检索截词符号为“*”表示0至多个字符,如检索词为“gene*”。PubMed可将以gene开头的,但结尾不尽一样的所有单词为检索词的文章检索出来。此外。也可将截词符号“*”放在某一单词的中间或其它部位进行检索。截词检索方法有利于不同写法的字或词的论文检索或者是当用户对某一医学词的写法拿不准时时行论文检索。

4.1.2.3短词检索对需要以词组形式出现的2个或2个以上的检索词,为保证系统不执行检索词自动转换功能.这就需要在检索词组上加双引号.从而将双引号内的词组作为一个整体进行论文检索。

PubMed还提供其他数据库的全文链接,即便是没有被PubMed全文收录的文章也可以通过链接获取原文。

5中文数据库

7

5.1中国知网(CNKI)

CNKI系列数据库是全文数据库,用户可以根据需要进行单库检索和跨库检索。

5.1.1CNKI特色

①收录范围广有期刊、会议文献、学位论文、报纸、图书、年鉴等。②CNKI中国引文数据库是国内最大的引文数据库。③采取分词技术,具有全文搜索引擎。④KNS5.0进一步完善了字索引和词索引相结合的索引技术,为查准查全查精提供了更多的选择。字索就是为被检索的内容逐字建立索引文档;词索引则根据系统所建立的中文分词词库中的词,对将被检索的内容进行词切后所建立起来的词索引文档。字索引和词索引在检索时对内容的处理当时不同,因而会导致检索结果上的不同。作者、机构、中英文刊名、基金等采用字索引。主题、提名、关键词、摘要、引文、全文等采用词索引。

5.1.2专题全文数据库检索方法

5.1.2.1.初级检索

系统默认进入“初级检索”界面,该方式有“全文”、“篇名”、“作者”、“机构”、“关键词”、“中文摘要”、“引文”、“中文刊名”、“基金”九个检索字段。

1) 选择检索学科专题范围,可根据需要“全选”,也可选一个、几个专题或子专题。

2) 选择检索时间范围。

8

3) 选择检索字段,输入检索词。

4) 选择检索结果输出方式,可选择按“相关度”或“更新日期”排序输出,默认为“无”排序输出。

5) 点击“检索”开始检索。

5.1.2.2. 高级检索

在屏幕左上角点击“高级”即可进入高级检索方式,该方式有四个检索输入框。

1) 选择检索的学科专题范围、时间范围(与“初级检索”相同)。

2) 选择检索字段,并在相应检索输入框中输入检索词;选择字段之间的逻辑关系(AND,OR)。

3) 选择检索结果输出方式(与“初级检索”相同)。

4) 点击“检索”开始检索。

5.1.2.3.按学科专题检索

逐级打开各学科专题目录,可以检索到全文数据库中各学科专题包含的所有文章。何一种检索方式,若检索结果太多,可进一步用“二次检索”缩小检索范围。

9

对任 5.1.3题录数据库检索方法

5.1.3.1.初级检索 系统默认进入“初级检索”界面,检索方法与专题全文数据库“初级检索”方法相同。

5.1.3.2. 高级检索

检索方法与专题全文数据库“高级检索”方法相同。

5.1.3.3.按刊名浏览检索

逐级打开各学科专题目录,可以按学科浏览《中国知网》中包含的期刊,通过期刊目录可以进一步浏览各期刊所收录的文章。

5.1.4检索结果及输出

在“全文数据库”检索到的结果,点击“文献篇名”,可以得到文献的题录文摘信息;点击“下载”,可以用“CAJ全文浏览器”打开文献全文;点击文献的“中文刊名”链接,可得到该期刊本期文献目录,进一步点击文献名,可以打开本期文献全文。

在“题录数据库”检索到的结果,单击“篇名”,可显示该文献的题录信息。

5.1.4.1.全文的存盘、打印:一般用“CAJ全文浏览器”的存盘、打印功能,下载存盘的文件名后缀一定要用“.caj”,这样才能用“CAJ全文浏览器”打开阅读。 如果希望存盘

10

的文件用写字板或Word软件打开阅读,则要在用“CAJ全文浏览器”进行全文浏览时,用“粘贴”到剪贴板的方式下载存盘(文本格式,需重新编辑,且只有部分文章能选择复制)。

5.1.4.2.题录、文摘的存盘、打印:在“全文数据库”检索到的文献目录中,选择需存盘或打印的文献,点击正上方的“存盘”或“打印”按钮,可以将选择的文献题录文摘信息列在同一屏上,这样利用网络浏览器的存盘、打印功能,可以将选中的文献的题录文摘信息存盘和打印。[6]

5.2万方数据资源系统

它以科技信息为主,集经济、金融、社会、人文等各行各业领域信息于一体,主要由科技信息系统、数字化期刊和企业服务系统三个子系统构成。其中,科技信息系统主要包括学位论文、会议论文、科技文献、科技成果、专利技术、机构名人、政策法规、中外标准、论文统计科技要闻等资源。

其检索方法与中国知网无很大差异,在此不再赘述。

5.3中国生物医学文献数据库(CBM)

数据库收录1978年以来1600多种中国生物医学期刊汇编以及会议论文的文献题录,年增长量约40万条。

5.4维普资讯网(VIP)

11

6纸质出版物

6.1.常用法:常用法分顺查法和倒查法。

顺查法:是按由远至近按年的顺序查找。这种方法主要是要知道某一专题是何时开始研究,某一药品或方法在何年发现或发明。

倒查法:由当年开始倒查若干年的文献,这种方法主要是收集最新资料。

6.2分段法:这种方法是划定一定时间,先查若干年(如 5~10年),经过筛选和鉴别,若仍不满意,再向前查若干年(如10~20年甚至30年),直到满意为止。这种方法一般是在选定科研课题后,要制订计划、准备材料开始实验前采用。

6.3追溯法:根据已查到的几篇文献,再按后面附的参考文献查找,以此类推,不断扩大文献线索继续查下去。这是一般科研工作者最常用的一种文献检索方法。

6.4检索途径

书名途径:从书名、刊名检索文献。

分类途径:根据书刊分类检索文献。

作者途径:根据作者姓名顺序检索文献。

12

主题途径:根据规范化了的主题词(名词或词组)对所需要的文献进行检索。主题法的优点是专指性强,在检索时应注意选用适当的主题词,才能提高查准率、查全率。

主题词一定要用正式通用的学术名,不能用俗名或商品名。主题词的概念不能太广 或太狭。太广不易查准,太狭则不易查全,使漏检率增高。选用或查找主题词,应从事物“名词”着眼,不要从事物的“过程”去找。因为“过程”多半是作为第二级或副主题。

关键词途径:根据关键词进行文献检索。关键词与主题词的差别在于:主题词是以标准化、规范化的主词来标引文献中的主要内容,而关键词是以文献题目中较重要的词作为主词来标引文献。若不能从文献题目中选用主词,则必须从文献正文中选用,这样分为“题内关键词”和“题外关键词”。

关键词的优点:名词、动词、形容词、副词等都可作关键词,主词不用规范化,只要能代表文献中一定内容就可选用。

关键词的缺点:由于主词是由作者自己选定的,各主词形式不定、拼法不定,有同义词、近义词、复合词等。这样同一内容的文献就分散开来,不能集中于一处。另外,有些内容不同的文献却又集中于一处了。结果,查得的文献必须经过仔细筛选。

纸质出版物的检索在计算机网络的显著优势面前使用逐渐减少,但是,在一些条件的限制下,纸质出版物依然能够发挥它的独特作用。特别是在图书馆中,针对一种杂志进行信息检索也很适用。关键是将多种方法有机结合,使得信息检索质量好效率高。

7.电子期刊

13

登录Nature,Cell,Science可以查询已收录的文献,还可以将最新出版讯息订阅到邮箱,方便随时关注某一领域的最新动态。

8.搜索引擎的使用

使用Google及其旗下的Google学术同样可以进行较高质量的信息检索。注意,键入的关键字词以英文为宜。

9检索结果输出

检索结果的输出方式多元化,除提供存盘、打印方式下载数据,而且可以利用E-mail发送检索结果,或将检索结果直接输出到文献信息管理软件,如医学文献王、Endnote、NoteExpress等。

参考文献:

[1] 周晓政. 医药信息检索和利用[M].南京:东南大学出版社,2006:22.

[2] 付佳, 闫实. 医学信息便捷检索方法[J]. 牡丹江医学院学报,2009,30(1):61-62.

[3] 周晓政. 医药信息检索和利用[M].南京:东南大学出版社,2006:22-23.

[4] 周晓政. 医药信息检索和利用[M].南京:东南大学出版社,2006:42-44.

14

[5] 昊蓉,羡秋盛,刘一洋. PubMed数据库检索系统及相关检索方法[J].实用医药杂志,2010,27(3):276-277.

[6] tsg. 中国知网使用方法简介[OL]. 淮南联合大学图书馆网站:淮南联合大学网络信息中心(2008-06-07)[2011-06-05].

http://www.hnuu.edu.cn/tsg/index3.jsp?entityid=1005&fid=4563

[7]中华康网.医学文献检索方法[OL].中华康网:中华康网(2007-03-26)[2011-06-05] .http://www.cnkang.com/yaox/yxky/wxjs/200703/72177.html

15

因篇幅问题不能全部显示,请点此查看更多更全内容