您的当前位置:首页正文

信息检索简答题

2021-06-30 来源:星星旅游
信息检索大题

1. 搜索引擎有哪些类型,其主要组成是什么?

答:类型:按检索机制划分,可分为全文搜索引擎、目录搜索引擎、元搜索引擎。 按检索内容划分,可分为综合型搜索引擎、专题型搜索引擎。

2. 已知名叫孙钱章的作者99年出版了一本书,但不知书名及其他信息,该如何找?写出

书名及出版社。

答:可以各种检索工具检索,比如可以用“读秀图书搜索与文献传递系统”进行检索,点击“图书”选项,在检索框中输入“孙钱章”,选择“年代”为1999年,得到检索结果为《知识经济概论》,北京市:警官教育出版社。

3. 举例说明布尔逻辑运算中“逻辑与”和“逻辑或”的检索特点。

逻辑“或”是用于表示并列关系的一种组配,用来表示相同概念的词之间的关系,用OR或“+”算符表示。例如检索式A OR B,表示检索的文献记录中只要含有A或者B中的任何一个即算命中。这种组配可用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。

4. 分别列举搜索引擎、馆藏检索工具、文摘索引检索工具、全文检索工具、数据检索工

具和专利检索工具各两个。

搜索引擎:Google搜索引擎 Yahoo搜索引擎

馆藏检索工具:清华大学 OPAC —— Innopac 华中农业大学 OPAC —— ILAS Ⅱ 文摘索引检索工具:知网节 维普中文科技期刊数据库 全文检索工具:Elsevier全文数据库 百度

数据检索工具:国科图OPAC “万方”数字化期刊 专利检索工具:SIPO 专利检索 USPTO 专利检索 5. 必考)谈谈如何提高文献检全率和检准率?

答:提高检全率的方法:

(1) 降低检索词的专指度,可从词表或检出文献中选一些上位词或相关词补

充到检索式。

(2) 调节检索式的网罗度,如删去某个不甚重要的概念面。 (3) 进行族性检索,可用分类号或采用一组近义词、同义词或者相关词用OR

连接在检索中。

(4) 进行截词检索,可以采用后截断、前截断、前后截断等方法。 (5) 增加检索途径,如将主题途径与非主题途径结合起来使用。 (6) 取消限制过严的前后缀符、限制符。

提高检准率的方法:

对于需要提高检准率的课题,主要从缩小检索范围入手,可采用以下方法。

(1) (2) (3) (4) (5) (6) (7) 提高检索式的专指度,增加或换用下位词和专指度较强的自由词。 用AND连接一些进一步限定主题概念的相关检索项。 限制检索词出现的可检字段。

用位置算符控制检索词的词间顺序与位置。 利用限制符、前缀符限制输出文献的外表特征。 利用NOT限制与情报提问不相关的文献的输出。 进行加权检索,从定量的角度加以控制。

6. 例举至少4种以上搜索引擎的高级检索技巧。(12分)

(1)、CALIS中文书刊信息查询 命题:消费与心理

包括“检索区”和“限定区”:

“检索区”设有3组检索框,最多可输入3个检索词,输入“消费”“心理”;逻辑运算可分别选择“与”、“或”、“非”,选择“与”;当选用“分类号”字段时可点击“中图分类号表”,选中的分类号将自动填写到检索词输入框中。

“限定区”用来对“检索区”中输入的检索条件加以限制,包括检索的数据库范围、文献类型、内容特征以及出版时间(选2009年6月到2011年1月)等。 (2)、维普中文科技期刊数据库 命题:经济发展与老龄化 系统提供5组检索框,最多可进行5个字段的组配检索,逻辑选项菜单中的“并且”、“或者”、“不包含”分别对应“与”、“或”、“非”3种逻辑运算。选择“与”。

“扩展检索条件”按钮用于对检索的学科范围、时间跨度、期刊种类等进行限定。限定学科范围在人文社科,时间跨度为2009年6月到2011年1月。

“直接输入检索式”窗口供用户参照范例编好检索式后,直接输入进行检索。 检索结果页面与“快速检索”相似。 (3)、CNKI中国期刊全文数据库 命题:心情与健康

多字段组合检索,对每个字段提供前、后2个输入框,可分别输入检索词,其间的关系类型包括: 并且:与 逻辑关系 或者:或 不包含:非 位置关系 同句:2个标点符号之内 同段:5“句”之内 逻辑关系选“并且:与”,位置关系选“同句:2个标点符号之内”。 (4)、中美百万册数字图书馆(CADAL)中文书刊 命题:费孝通与社会学

系统提供3组检索框,并提供书名、作者、关键字、出版机构和描述5个检索字段,各字段间可进行逻辑运算,在下拉菜单“并且”、“或者”、“不包含”中选一即可。

文献类型为“单选”,系统默认选“全部”。 关键字为“费孝通”、“社会学”,逻辑算符为“并且”进行检索。 (5)、超星数字图书馆

可进行多条件的组合查询,以实现目的性较强的检索。

命题:社会心理学

系统提供3种检索途径,可分别采用“书名”、“作者”或“主题词”字段进行检索,字段间的逻辑关系包括“并且”、“或”2种,可通过下拉菜单选定。

字段选择“书名”(《社会心理学》)。

7. 举例写出包含限定关系、并列关系、位置检索和限字段检索的检索式。(12分)

限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定。 限定关系检索式为: A AND B,或者 A * B 例如:社会学AND心理学 并列关系检索式为:A OR B,或者 A+B 例如:社会学OR心理学 排除关系检索式为:A Not B,或者 A-B 例如:社会学Not心理学 位置检索:是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库原始记录中词语的相对次序或者位置关系为对象进行组配运算。(W)算符是“With”的缩写,表示此算符两侧的检索词必须按此前后邻接的顺序排列,顺序不可颠倒,而且检索词之间不允许有其他的词或字母,但允许有空格或连字符号。例如:输入gas(W)condensate可检索出包含gas condensate 和gas-condensate的记录 字段限定检索:是用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,是提高检索效果的一种有效检索方法。例如:(minicomputer/DE, TI OR personal computer/ID, TI)AND PY=2008 AND LA=English

8. 举例说明信息检索的主要步骤及要点(10分)

命题:社会心理

信息检索的主要步骤: (1)、分析检索课题

①找出课题所涉及的研究对象、内容、方法、理论、技术及其相关问题,形成课题研究的概念集合,从中找出主题概念。 ②明确课题所需要的信息类型。 ③确定检索的时间范围。

④明确检索目的,了解课题对查全、查准、查新等方面的指标要求。

该题要研究的是社会成员的心理,此研究为缓解当今精神世界匮乏现状提供依据。 (2)、选择检索系统 ①学科范围。 ②系统类型。 ③系统功能

选择“读秀学术搜索”系统。 (3)、确定检索词 ①切分。 ②删除。 ③替补。 ④组合。 ⑤增加。

确定检索词为“社会心理” (4)、构造检索式(试验性检索) (5)、调整检索策略(正式检索) 当检索结果信息量过多时,

①采用专指性强的主题词(主题词表),减少同义词、同族相关词等相关性不强的检索词; ②增加限制概念,采用“AND”算符连接检索词或进行二次检索; ③使用字段限制,把检索词限定在题目、主题词等主要字段; ④缩短检索年限,限制检索结果的文献类型、语种及出版国; ⑤使用“NOT”算符,排除无关概念; ⑥调整位置算符,由松变紧; ⑦改模糊检索为精确检索。 当检索结果信息量太少时

①根据词表的分类结构体系扩展关键的检索词,用“扩展”按钮增加同义词和相关词并用“OR”算符连接这些词;

②降低这些词的专指度,可从词表或检索文献中选择上位词或泛指词补充到检索式中; ③减少检索年限、文献类型、语种及出版国的限制,如增加回溯检索年限; ④取消某些限制过严的字段限制、位置算符限制; ⑤在词干相同的单词后使用截词符(?或*); ⑥改精确检索为模糊检索;

⑦同时使用拼写正确的词,以及拼写错误的词或存在多种普遍错别字的词作为检索词。 (6)、输出检索结果 要点: (1)、首先了解该数据库的收录范围、文献类型、语种和重点领域,尤其是要注意数据库是否收录特种文献和事实型数据。 (2)、尽量使检索式简单,一般先检索最基本的概念,然后对基本概念进行限制,逐渐缩小检索范围,直到检到满意的文献为止。要避免使用一些范围较宽的词(如“computer”)和较长的短语等。 (3)、避免使用of、the、or、from等这些无实际意义的词,尽管某些情况下系统会自动删除这些词。 (4)、如果用一个主题词检索不到文献,试用副主题词或数据库主题词表中的其它相关词检索。 (5)、做完一个检索后,不管检索式是长是短,都要按下“清除”(clear)键清除检索式,然后才能进行下次检索。

9、第一次检索的结果有172条文献,你建议一下他采用何种方式来缩小检索范围。 答:(1)提高检索式的专指度,增加或换用下位词和专指度较强的自由词。

(2)用AND连接一些进一步限定主题概念的相关检索项。 (3)限制检索词出现的可检字段。

(4)用位置算符控制检索词的词间顺序与位置。 (5)利用限制符、前缀符限制输出文献的外表特征。 (6)利用NOT限制与情报提问不相关的文献的输出。 (7)进行加权检索,从定量的角度加以控制。 注意:只选其中一两种办法阐释。

10、什么是信息检索?类型有哪些? 定义:是通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。 类型:文献检索、数据检索、事实检索

11、简述“超星电子图书馆”、“书生之家数字图书馆”、“中国学术期刊全文数据库”、“维普中文科技期刊数据库”和“万方数字化期刊”收藏资源的特点

1)、超星电子图书馆:收录的电子图书内容丰富,包括经典理论、哲学、社科、经济、语言文字、文学、数理化、生物、工业技术、计算机等50余个学科门类,现拥有中文电子图书80万种,论文300万篇,全文总量4亿余业,并且每天仍在不断地更新与增加

2)书生之家数字图书馆:主要收录1999年以后出版的新书,其收录量为每年中国出版的新书品种一半以上,目前拥有图书15万种,数量可观,学科门类齐全。

3)中国学术期刊全文数据库:该库的产品分为十大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、政治军事与法律、教育与社会科学综合、电子技术与信息科学、经济与管理。个专辑分为若干专题,共168个专题。

4)维普中文科技期刊数据库:按照《中国图书馆分类法》进行分类,所有文献被分为8个专辑:社会科学、自然科学、工程技术、医药卫生、农业科学、经济管理、教育科学和图书情报。8大专辑又被细分为36个专题 。

5)万方数字化期刊收藏资源的特点:目前集纳了理、工、农、医、人文五大类70多个类目,2500多种科技类核心期刊,实现全文上网。该系统收录的期刊种类主要有7个:基础科学、农业科学、社会科学、哲学政法、医学卫生、教科文艺、经济财政。

因篇幅问题不能全部显示,请点此查看更多更全内容