您的当前位置:首页正文

信息检索重点复习资料

2024-08-26 来源:星星旅游
信息检索重点复习资料

第一章信息检索概述

信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

信息素养:人们在解答问题时利用信息的技术和技能。

信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。

信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索 2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。

信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。 存储是检索的基础,检索是存储的目的。

信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。

信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。

信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。

信息检索的历史:最早的信息检索主要依靠信息分类。

1手工检索 2机械信息检索 。 3脱机批处理检索 是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索 后四者统称为计算机信息检索

信息检索的三个经典模型 :1布尔模型 2向量空间模型 3概率模型

1浏览型模型:扁平式模型、结构导向模型、超文本模型 2检索型模型:结构化模型、基于内容的检索型模型。

信息检索模型是信息检索的核心。

信息检索系统:是具有信息存储和信息查询功能的一类服务设施。

信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS.

信息检索物理结构1计算机硬件2软件3数据库

信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。

数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合,由字段、记录和文档构成。

数据库的载体分:联机数据库,光盘数据库,网络数据库。 按内容与功能划分:指南数据库,交易数据库,全书数据库,书目数据库,字典数据库,数值数据库,图像数据库。书目和全文使用频率最高。

信息检索系统评价的核心的检索性能评价。

信息检索评价指标:1覆盖范围2查全率3查准率4响应时间5用户负担6检索结果输出格式。

检索效果指标主要有:1查全率2查准率3漏检率4误检率5新颖率6检索速度等。最主要指标是查全率和查准率。

查准率P:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。

查全率R:是指检出的文献数量占数据库中全部相关文献数量的比例。

提高检索效果的措施:选择质量较高的检索系统、提高检索着的检索水平。

第二章

网络信息检索的基本方法:1布尔逻辑检索 它是一种比较成熟、较为流行的检索技术,逻辑检索的基础是逻辑运算,它的运算符有 逻辑“与”AND * 查准,逻辑“或”OR 、+、| 查全,逻辑“非”NOT 、-。 lycos;Google的默认运算符是布尔逻辑与

2邻近检索 又被称为位置限制检索,是用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索。Dialog系统常用的位置算符1)(W)表示此算符两侧的检索词必须按此前后的顺序排列2)(nW)表示在此算符两侧检索词间可插入n个实词或虚词3)(N)检索项在记录中出现的顺序可以调换4)(nN)表示位置可以调换,两个词间插入词最多数目是n个 4)(F)表示在此运算符两侧的检索词必须同时出现在文献记录的同一字段内6)(S)表示在此运算符两侧的检索词只要出现在文献记录的同一字段内,此文献即被命中7)(L)运算符表示两侧的检索词在同一个叙词单元,且它们之间有一定的从属关系8)(NOT)它与邻近运算符W,N,S,F,L等组合使用,而产生相反的含义

3短语检索 短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度,因而也称为“精确检索”

4截词检索 所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分 .根据截词符在检索词中的位置,可分为前截词,中间截词和后截词。“?”代表0到1个字符;“*”代表0到多个字符。

5字段限制检索 为了提高查全率或查准率,需要将检索范围限制在特定的字段中,

6括号检索 7自然语言检索 8多语种检索 9模糊检索 10区分大小写检索

信息检索的主要技术:1全文检索技术 全文检索技术必须具备一个全文数据库,全文数据库是将一个完整的信息源全部内容转化为计算机可以识别,处理的信息单元而形成的数据集合。全文数据库的特点:a信息量大 b信息检索的灵活性和适应性c检索语言的自然性d数据相对稳定等 不足:查准率较低2多媒体信息检索技术 音频检索分三种:a语音检索b音乐检索c音频检索 3超文本超媒体检索技术 超文本检索 是信息的组织方

法与手段 超文本超媒体的缺陷:信息以超文本方式链接,用户检索的主动性变为被动性,导致检索过程中含有极大的盲目性和偶然性;在链接的过程中,容易偏离检索目标,导致检索“迷航”其发展趋势:由超文本向超媒体发展,由超媒体向智能超媒体发展,由超媒体向开放超媒体发展。 4智能信息检索技术 采用人工智能进行检索的技术,与传统信息检索相比,它最大的特点是检索过程中引入了资源对象的语义处理。智能化是网络信息检索未来发展的主要方向。 5可视化信息检索技术 基础是计算机图形学和认知心理学。 6跨语言信息检索技术 跨语言信息检索技术的核心问题是“翻译”。 7文本聚类技术 常用的聚类方法有:层次聚类法,平面划分法,网格聚类法,模型聚类法等。

检索策略:是为实现目标而实行的全盘计划,在操作上主要指数据库的选择和检索式的编制。

(网络)信息检索的技巧:1、分析信息需求 即要确切了解所要查询的目的和要求,确定需要的信息类型 2、选择合适的检索工具 不同目的的检索应选择不同的搜索引擎,选择合适的检索工具主要从工具的类型、收录范围、检索问题的类型、检索具体要求等方面综合考虑。3、确定检索点与检索词 关键词选择的建议:1)使用名词或物体做关键词2)检索式使用2~3个关键词为宜3)使用截词检索4)通过or连接同义词、近义词等不同表达式5)对专有名词使用大写字母指定检索6)对固定短语使用短语检索7)用括号将各个概概念分开。4、正确构造检索式 许多搜索引擎都提供简单查询和高级查询,建议使用后者。5、及时调整检索策略(扩大检索范围,缩小检索范围)6、检索结果的输出(下载,打印,复制,显示,E-mail发送等)。

第三章

搜索引擎的概念及工作原理:它是一种web上应用的软件系统,它以一定的策略在

web上搜集和发现信息,在对信息进行处理和组织后,为用户提供web查询服务。当用户输入关键字查询时,该搜索引擎会告诉用户该关键词的信息和网址,并提供连接;同时,用户可通过一层层分类目录找到所需信息。搜索引擎既用于检索的软件又提供查询、检索网站。

搜索引擎:有三个功能模块,或三个子系统:及网页搜索、预处理和查询服务。

搜索引擎的分类:1按信息内容的组织方式划分a目录式搜索引擎 Yahoo是目前最流行的目录式搜索引擎,提供主题目录检索。B机器人搜索引擎。2按专业范畴划分a综合性搜索引擎b专业性搜索引擎3按检索功能划分a独立搜索引擎b元搜索引擎两者的区别:前者拥有独立的网络资源采集标引机制和相应的数据库;后者一般没有独立数据库,多提供统一链接界面,形成一个由多个具备独立功能的分布式搜索构成的虚拟平台。

元搜索引擎:它是多个独立搜索引擎的集合,通过一个统一的检索界面对多个搜索引擎进行检索操作。在进行检索时调用一个或者多个独立搜索引擎的数据库。

搜索引擎排名影响因素:最重要五个因素a关注关键词锚文本的外部链接b链接所在页面的热门程度即外部链接的数量和质量c链接资源的多样性d标题标签中关键词的使用e链接域名的可信度 前五位负面因素:a恶意隐藏作弊b从链接中介购买链接c指向搜索引擎作弊的站点或网页的链接d基于User Agent的伪装e频繁的服务器故障或站点无法访问

综合性搜索引擎评价指标主要有:1收录范围(学科范围,地域范围,语言范围,资源范围)2分类3检索功能与效果4对检索结果的处理5页面组织6其它功能与服务

重要的中英文综合性搜索引擎Google ,Yahoo ,Bing ,Ask ,AllTheWeb.com ,Alta Vista,百度,搜搜,搜狗,雅虎中国

中外文学搜索引擎:谷歌学术搜索,百度国学搜索 (提供目录浏览和关键词检索),Scirus

数字化图书馆与传统图书馆有何区别和联系?

数字化图书馆与传统图书馆既有区别又有联系,主要体现在两方面:一、数字化图书馆是传统图书馆服务和技术的发展和延伸,扩大了图书馆收藏文献信息的范围,文献载体向多元化方向发展,延伸了图书馆服务的时间和空间,服务内容和形式呈现多元化,适应了读者多元化,动态化的需求,有效地拓展了传统图书馆的功能。二、传统图书馆及其馆藏是数字图书馆形成的基础和主要信息来源,数字图书馆作为一种信息环境,离不开各个具体图书馆的支持,数字图书馆相当一部分信息来源于传统图书馆纸质文献的数字化,除部分信息是由信息生产者直接以电子形式提供,构成数字图书馆的信息外,其它大部分文献信息,特别是非电子型文献必须依靠具体图书馆收集、整理、组织和提供。

第四章 国内重要的综合性信息检索系统:

一、中国知网 国家知识基础设施(CNKI)工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起。

最大连续动态《中国期刊全文数据库》(CAJ)

中国知网数据库种类:源数据库 、合作数据库、特色文献数据库、知识仓库。

CNKI有哪些主要的数据库 中国工具书网络出版总库CRFD,中国学术期刊网络出版总库CAJD,中国博士学位论文全文数据库CDFD,中国优秀硕士学位论文全文数据库CMFD,中国重要会议论文全文数据库CPCD,中国年鉴网络出版总库CYBD,中国重要报纸全文数据库CCND。

中国知网的检索:1导航检索 可从不同的角度和途径导出数据库的相关内容,提供浏览和下载;2逻辑检索 a初级检索b高级检索c专业检索;3智能辅助检索 是通过数据库的辅助系统,发现同义检索词、查找同名作者的其他文献、智能查找该文献的相关文献。

CNKI的检索结果可按相关度、发表时间、被引频次、下载次数等指标进行排序。

二、维普资讯网(VIP) 目前成为集外文献、企业咨询、动态新闻服务、行业信息资源等多种服务为一体的科技文献资源门户网站。

VIP的主要资源有:中文科技期刊数据库、中文科技期刊引文库、外文科技期刊数据库、中国科技经济新闻数据库、中国科学指标数据库。

维普咨询网的检索方式:快速检索、传统检索、高级检索、期刊检索。

三、国家科技图书文献中心(NSTL)的建设宗旨是:根据国家科技发展需要,按照“统一采购、规范加工、联合上网、资源共享”的原则,采集、收藏和开发理、工、农、医各学科领域的科技文献信息资源,面向全国开展科技文献信息服务。其任务是代表国家利益,以资源共建共享为核心,构建国家科技文献资源战略保障服务体系。 NSTL是目前中国最大的科技文献资源收藏体系。

NSTL提供的科技信息服务1期刊浏览与检索2文献检索 a检索方式普通检索、高级检索、期刊检索、分类检索。B各种数据库的收录范围与可检字段 3引文检索 国际科学引文数据库(DISC)提供快速检索、期刊检索、来源文件检索和引文检索。4代查代借和全文传递5网络信息资源揭示服务a热点门户b开放获取期刊集成检索试用系统。6一站式服务系统——科技信息资源与服务集成揭示系统7参考咨询服务8预印本服务9全文文献10其他服务

四、中国高等教育文献保障系统(CALIS)是经国务院批准的我国高等教育“211工程”、“九五”、“十五”总体规划中三个公共服务体系之一。其建设目标是:建设一个以“211”工程立项高校为主体的高校书刊联合目录、七个地区级书刊联合目录库,引进和共建一体系国内外文献数据库,初步实现共同检索、馆际互借、文献传递、电子资源导航、文献协调采购、联机合作编目等功能,基本建成中国现代高等教育文献保障体系的基本框架。

CALIS的数据资源主要有:外文数据资源和中文数据资源两大类。

CALIS的联合目录公共检索系统(OPAC)采用Web方式提供查询和浏览。

CALIS OPAC选择多库分类检索,OPAC中的数据,按语种划分,可分为中文、西文、日文、俄文四个数据库;按文献类型划分可分为普通图书、连续出版物、古籍。检索完成后,如文献太多,可进行二次检索。

五、中国科学院国家科学数字图书馆(CSDL) 主要是为自然科学、交叉科学和高技术领域的科技自主创新提供文献信息保障、战略情报研究服务、公共信息服务平台支撑和科学交流与传播服务,同时通过国家科技文献平台和开展共享来支持国家创新体系其他领域的信息需求。

CSDL的主要服务项目有:1原文传递与馆际互借2论文查收查引检索及评价3定题、专题检索服务4科技查新5在线参考咨询(问图书馆员)

我国其他的综合性信息检索系统还有 :中国经济信息网和中国咨询行等。

第五章

国外重要的综合性信息检索系统

一、学术资源整合平台(WOK)是基于互联网建立的动态信息资源整合平台,提供自然科学、工程技术、社会科学、艺术与人文等多个领域中的高质量信息,采用“一站式”服务。

美国科技信息研究所(ISI).

WOK的核心是Web of Science . Web of Science由七个数据库组成:1科学引文索引扩展版(SCIE)2社会科学引文索引(SSCI)3艺术与人文科学引文索引(A&HCI)4科学会议录引文索引(CPCI-S)5社会科学与人文科学引文索引(CPCI-SSH)6化合物索引(IC)7全新化学反应(CCR-Expanded)

WOK的其他资源1专利信息2研究信息快讯3专门学科的数据库4免费的外部数据库5科研分析资源和信息分析工具。

WOK支持的运算1布尔逻辑运算符2截词检索3短语检索

WOK的检索方式1“检索”方式2“被引参考文献检索”方式3“化学结构检索”方

式4“高级检索”方式

期刊引证报告数据库(JCR)通过将引文和文献数制成表格并加以综合,为评估和比较期刊提供了独特的视觉。

WOK的个性化服务:1定制起始页2保存检索式3设置检索历史跟踪服务4设置引文跟踪5创建RSS Feed 、创建并维护经常阅读和设置目录电子邮件跟踪服务的定制期刊列表等。

二、世界上最大的联机检索系统(Dialog)是世界上最大最早的专业情报检索系统。它提供的服务项目有:各种类型的信息检索、定题服务、原文订购等。

Dialog拥有900多个数据库,数据库类型主要有四种:1文献型2数值型3名录字典型4全文型,涉及40多个语种。

Dialog支持的运算:布尔逻辑、位置限制检索、短语检索、截词检索。常用指令B S T

三、ScienceDirect OnLine(SDOL)是Elsevier的核心产品,是应用很广泛的全文期刊数据库。

SDOL采取浏览与检索相结合的方式1期刊论文浏览2快速检索3高级检索4专家检索(逻辑运算符、位置限制运算符)

四、联机计算机图书馆中心(OCLC)是全球最大的不以盈利为目的的、维护和管理电子资源系统并提供计算机图书馆服务的会员制合作和研究组织,其宗旨是为广大用户发

展对全世界各种信息的应用以及降低获取信息的成本。

FirstSearch(第一检索)现称信息第一站,FirstSearch基本组包括12个数据库,其中最具影响力的是世界上最大的,由一万多个成员馆参加的脸很编目数据库WorldCat,它包括11种资源类型,400多种语言,覆盖了从公元前1000年到现在的资料,目前有1亿多条记录。

FirstSearch的检索1基本检索2高级检索3专家检索

五、Gale数据库检索系统 目前提供200多个联机数据库服务,分两类1收录特定专题的文献信息,数据量不断增加,定期更新举例a传记资源中心b文学资源中心2是对世界上一些著名图书馆所珍藏的历史文献数字化后建成的数据库 a数字馆藏

Gale检索方式:1基本检索2主题词检索3出版物检索4高级检索5异构跨库检索

检索算符:1逻辑算符 特色算符 1位置算符(“Wn”“Nn”)2范围算符

六、CSA ILLumina 是一个多学科、多信息类型的信息服务平台。检索方式1快速检索2高级检索3检索工具(history/combine 命令式检索 词表检索 查看索引文档)4Browse(浏览)。

如何查找某学科有哪三大引文索引刊物:进入JCR网站,选定学科,搜索期刊。

第六章

国外专业性书目信息检索系统

一、化学信息检索系统(SciFinder)三种检索模式 Explore Rerferences,Explore Substances和 Explore Reactions分别对书目数据库(CAplus和MEDLINE) 化合物数据库(CAS Registry)和化学反应数据库的检索(CASREACT)。

Explore Substances模式:1化学结构检索2分子式检索3物质检索。

SciFinder检索结果集合:1浏览集合中的记录2记录去重与排序3查看相关信息

二、生物学文摘(BA) BP主界面上提供6种检索方式 1基本检索2高级检索3题录检索4检索工具5字段检索6多字段检索 ;四个主要检索词是:关键词、作者、题名和期刊。

三、工程索引(Engineering Village EV2)是基于网络的信息服务系统,在应用科学、技术和工程研究领域有广泛影响。 集合的数据库有:自建的Compendex、Engineering IndexBackfile和Referex Engineering,工程技术研究所(IET)出版的Inspec、报告数据库NTIS、专利数据库Ei Patents等。

检索方式:1简单检索2快速检索3专家检索4词表检索5标签检索

四、美国医学文摘(Medline)是当今世界最具权威的综合性生物医学数据库之一。其内容涵盖3种重要的纸本医学文献检索工具:医学索引 、牙科文献索引、国际护理索引。

Internet上国内最常见使用的免费医学检索网站是NLM开发的PubMed官方网站,其记录来源包括:medline premedline 和出版商提供的电子文献。

索引方法:1基本检索(主题途径检索、著者途径检索、期刊途径检索、)2MeSH数

据库检索。

PubMed提供概要、简介、文摘、引文、MEDLINE等五种显示检索结果内容的记录格式。它的保存方式是:网页格式和纯文本方式。

五、荷兰医学文摘(Embase)简称EM.检索途径和方法1检索方式(1快速检索2高级检索3药物检索4疾病检索5论文检索)2EMBASE主题词表检索3期刊检索4作者检索5Scirus搜索引擎

六、教育资源信息中心(ERIC)是世界上最大的访问量最大的教育数据库。包括两部分内容:教育资源和当前教育期刊索引。

ERIC的检索方法;1初级检索2高级检索3ERIC叙词表检索

七、公共事务信息数据库(PAIS International)检索方法:1快速检索2高级检索(菜单式检索、命令行检索) public affairs information service。涉及的方面:公共政策、社会政策、社会科学书目检索工具。按出版物文献、图表、学者、网站信息分别列出检索结果。

八、图书情报学专业数据库(LISA 和LISTA) 1图书馆学与情报学文摘(LISA)2图书馆学与信息科学与技术数据库(LISTA)(基本检索、高级检索、辅助检索功能)

九、法律信息检索系统(LexisNexis)LexisNexis公司数据库产品有:1律商联讯2法律数据库3国会大全4统计大全5环境大全6学术大全等。

LexisNexis在线服务数据库主页特点是无检索框。主页上资源分为左右两列,左列是

一次文献资源,右列是二次文献资源为主。检索方式1 search 2 research tasks 3 search advisor 4get a Document。

位置限制检索W/N(1~255)关键词距离不超过n个单词;w/s限定关键词出现在同一个句子中;w/p限定关键词出现在同一个段落中;W/SEG关键词出现在文章同一部分;PRE/N关键词同时出现在文件中,第一个字的位置必须比第二个字超前n个单词。

第七章internet上多媒体信息的检索

多媒体信息检索的概念:多媒体信息的特征元数据提取、索引建库,相似度匹配运算,识别和返回用户所需信息,通过与用户之间的反馈,不断优化、调整显示结果。

多媒体信息检索方法和原理:1基于文本 原理是依据人工分析判断,选择记录能反映信息内容特征和物理特征的关键词,建立多媒体信息的索引和标识,用户检索信息时,系统按关键词匹配查找相识的多媒体文件。其优点是便于普及使用,缺点是人们选择关键词时存在较强的主观性。2基于内容多媒体信息检索系统Content-Based Retrieval(CBR) 原理:提取特征并进行量化,表示成向量空间,建立索引库,将用户提问转化成向量,并与已有信息的向量空间进行相似度匹配计算。优点具有较强的客观性,缺点是不便于大众化使用。

基于文本的搜索有:Google 图片搜索、音乐搜索与视频搜索,Yahoo 音乐搜索与图片搜索,Yahoo Video Search,百度mp3、图片与视频搜索

基于内容的多媒体信息检索一种新的检索技术,是对多媒体对象的内容及上下文语义环境进行检索。

基于内容的多媒体信息检索为什么不能普及网络资源:多媒体信息数据量大,特征空间维度高,用户与系统信息存在语言鸿沟及对数据解释缺乏一致性等问题。

常用多媒体文件特征:①图像:颜色、纹理及时空关系等②视频:对象运动特征、颜色和光线变化等 音频:时域、频域、时频、短时帧和音频特征等

搜索图片、图像 格式:image:文件名 搜索多媒体信息 格式:media: text

基于内容的图像检索 :原理分析图像的内容,提取颜色、形状纹理及时空关系等信息,建立图像的特征索引库,而后将用户的检索提问与特征索引库进行匹配计算,返回检索结果。

QBIC:Query By Image Content http://wwwqbic.almaden.ibm.com/

IBM Almaden研究中心开发的第一个商用基于内容的图像及视频检索系统;提供对静止图像及视频信息基于内容的检索手段;系统结构及所用技术对后来的视频检索有深远的影响

VisualSEEK(WebSEEK):主要特点是用到了图像区域的空间关系查询和直接从压缩数据中提取视觉特征

其它:TinEye、Titomo、VAST(_视觉语义图像查询系统)、ImageRover、Scour、Amazing Picture Machine 、Lycos、Image Suurfer

基于内容的视频检索:通过对非结构化的视频数据进行结构化分析和处理,采用视频分割技术,将连续的视频流划分为具有特定语义的视频片段,作为检索的基本单元,在此

基础上进行代表帧和动态特征的提取,形成描述镜头的特征索引,镜头组织和特征索引,采用视频聚类等方法研究镜头之间的关系,把内容相近的镜头组合起来,逐步缩小检索范围,直至查询到所需的视频数据。 视频分割、代表帧和动态特征提取是基于内容的视频检索的关键技术。

informedia卡内基·梅隆大学的informedia数字视频图书馆系统 卡内基·梅隆大学的informedia数字视频图书馆系统

Open v:http://www.openv.com/ 以视频搜索技术为核心的视频媒体平台

可检索国内多家主流电视台的节目、国内各大主流视频网站及播客网站的内容

可以通过关键词搜索,可以搜索文件中的某句话或某段文字

VideoQ 哥伦比亚大学 http://www.videoq.com/允许用户使用视觉特征和时空关系来检索视频 ,集成文本和视觉搜索方法, 自动的视频对象分割和追踪,丰富的视觉特征库,包括颜色、纹理、形状和运动. 还有Google video search、Yahoo video search、

基于内容的音频检索

从音频数据中提取听觉特征信息,音频特征分为:听觉感知特征和听觉非感知特征(物理特性),听觉感知特征包括音量、音调、音强等 有:1上海交通大学的音乐数据检索系统 2FindSounds 3MaART

第八章

专利的种类:发明、实用新型、外观设计。

专利的含义:狭义的专利是专利权的简称。它是由专利机构依据发明申请所颁发的一种文件。广义的专利包含1专利权 指国家专利主管机关依据专利法授予申请人的一种实施其发明创造的专有权。2专利技术3专利说明书。

专利文献:是包含已经申请或被确认为发现、发明、实用新型和工业品外观设计的研究、设计、开发和试验成果的有关资料,以及保护发明人、专利所有人及工业品外观设计和实用新型注册证书持有人权利的有关资料的已经出版或为出版的总称。

专利文献的特点:数量巨大、内容广博、反应最新的科技信息、格式统一、形式规范。

专利分类法:1《国际专利分类法》(International Patent Classification,IPC)

2美国专利分类体系(United States Patent Classification System,USPC)

3欧洲专利分类系统(European Patent Office Classification,EPO Classification,简称 ECLA)4 日本专利分类法 .

专利分类号:部、类、小类、主组、分组。F 04 D 29 / 00 .

专利文献结构:专利说明书是专利文献的主体内容.专利说明书主要由扉页、权利要求书、说明书及附图组成。

我国专利文献编号体系:1申请号2专利号3公开号4授权公告号。

商业性专利数据库的检索系统有:汤姆森路透(有DWPI、TDA)、Dialog(CLAIMS、IMS)

网上免费专利信息资源的检索:1知识产权管理机构建立的网站 2专利门户类网站或专利资源导航类网站 3知识产权教育、研究和培训机构网站 4学科专利信息中心 5专利信息咨询服务企业与代理机构网站。

免费专利综合性搜索引擎:google专利搜索 、百度专利搜索。 免费专门检索专利的搜索引擎;FreePatentsOnline、IP-Discover、免费专利在线。

商标:是区别商品或服务来源的一种标志,每一个注册商标都是指定用于某一商品或服务上的。检索途径:分类检索、关键词检索、图像检索。

国际上的尼斯协定将商标分为45类。

商品分类:1本国独立实行的商品分类表 2国际统一的商品分类表。

世界知识产权组织(WIPO)。

商标信息的主要来源:1商标主管部门提供的商标信息 2商业性商标数据库 3专门商标搜索引擎 4某企业商标数据库。

官方商标网站:中国商标网、美国专利与商标局商标电子检索系统、英国商标检索等。

商业性商标数据库有:Dialog的Trademarkscan系类数据库、Thomson公司的商标数据库、其他商业性的商标信息检索系统。

专门的商标搜索引擎:Tradermakia、桑尼维尔专利和商标中心、托马斯网等。

白色文献:公开出版发行且具有国际标准刊号或书号的正式出版物。

黑色文献:不对外公开、具有完全保密性质的文献。

灰色文献:指不经营利性出版商控制,而由各级政府、科研院所、学术机构、工商界等所发布的各类印刷版与电子版文献资料。

学位论文是:学位论文是高等学校和研究机构的毕业生为取得学位资格撰写的学术性研究论文。

我国内地学位论文信息检索: 中国知网“ 中国博士学位论文全文数据库”、中国知网“ 中国硕士学位论文全文数据库”、万方“ 中国学位论文全文数据库”、CALIS学位论文中心服务系统、NSTL学位论文、国家图书馆博士论文数据库、中国科学院学位论文检索系统。

台湾地区学位论文信息检索:台湾师范院校联合博硕士论文系统、中国台湾地区的博硕士论文咨询网、中文电子学位论文网、电子学位论文采集与拓展系统。

香港地区学位论文信息检索:香港大学论文在线、香港科技大学电子学位论文数据库。

国外学位论文信息的检索:美国博硕士论文库(PQDT)、网络化的博硕士学位论文数字图书馆(NDLTD)。

如何检索会议论文:1会议论文数据库2协会的网站或数据库3专门的会议论文或论文

集门户4查找即将召开的会议信息。

会议论文数据库:CALIS的会议论文数据库、万方学术会议论文数据库、CNKI中国重要会议论文全文数据库、NSTL的中外文会议论文库、OCLC FerstSesrch会议论文与会议录索引。

科技报告:围绕某个课题的科技活动所取得的阶段性进展或最终性成果的记录与书面报告,是科研生产活动的第一手资料。

科技报告分类按出版形式分为:报告、札记、备忘录、论文、译文。按研究进度:初期报告、进展报告、中间报告、最终报告。按保密程度分:保密报告、非保密报告、解密报告。

如何检索科技报告:

一科技报告的获取渠道1大综合性检索系统都将科技报告作为重要文献加以收录;2政府网站;3通过研究的资助机构查找;4报告的发布机构;5用搜索引擎;6利用免费的研究报告数据库。

二商业性的科技报告数据库:万方数据中的科技成果类数据库、NSTL的国外科技报告数据库、NTIS美国政府报告数据库(可通过剑桥科学文摘CSA和美国工程索引EI等数据库检索美国四大政府报告数据库)。

三免费提供科技报告的国内外网站:国家科技成果网、中国报告大厅、DTIC、 FedWorld。

第九章网络信息检索与利用的有关问题

网络信息选择与评价的必要性(为什么):1信息数量庞杂无序(信息分布广、类型多、质量参差不齐 有虚假信息)2信息不稳定性强(内容可靠性低)3网络安全存在隐患(病毒)。

网络信息选择与评价的主体 1 专家 参照一定的评价标准,由各行业专家或从事信息咨询服务的图书馆员评价和推荐的网络信息。 如:美国图书馆协会的参考与读者服务协会自1999年以来每年推荐最佳的免费参考网站。美国《时代(Times)》杂志自2003年起每年都会评选最佳网站。

2网络信息资源用户 从用户的角度,可从功能、设计、内容等方面; 通过对使用经验的交流、推荐,实现对网络信息的评价。

3第三方第三方机构通过特定工具对网络信息开展的测评。 如:评测机构与网站(赛迪,中国软件评测中心 ,Alexa)、网络管理与维护的相关组织(中国互联网协会,CNNIC)

网络信息选择与评价的客体 1网络信息来源的选择即对网站的选择与评价(直接统计、间接统计) 2网络信息内容的选择和评价

网络信息选择和评价的标准:1权威性(网站及其建站机构的权威性和知名度)、2内容(内容应当客观、切题、标题清楚、组织规范、逻辑性强、有明确的范围和边界、有足够的深度和广度、有自己的特色)、3时效性(网站内容及其链接应当新颖、应明确地说明其创建和更新周期)、4网页设计(应以合理的方式综合使用图像、声音和文字、界面的友好性、清晰直观)、5适用性(应保证用户能用较短的时间、点击较少的链接找到所需信息)、6用户

对象(信息的专业化程度应能满足目标用户的特定需求)、7访问次数或被链接次数(网络信息的被访问和被其他网页链接的次数)。

网络信息的评价维度:1what & why? 评价对象的内容、目的、范围、观、2by whom?网站创建者、作者或机构的身份、权威、信誉、名声、资质3where? 网络信息的来源如发布者的身份、 渠道是否公开、4for whom?网络信息能否满足受众的需求、5when? 时效性:流通性、 更新频率、 持续性。6how? 影响力:覆盖率、准确性、客观性、清晰、组织风格、可用性。 7in what way? 信息显示方式:格式、布局、界面、搜索功能、能否访问。8how much? 使用成本、是否有许可证9 in comparison to? 与其他相似网页的可比性。

网络信息的评价标准分为:1网站性能评价标准(a网址b形式c稳定性d浏览与检索功能e编排设计f链接g传输速度)2网站内容评价标准(a权威性b客观性c独特性d时效性e有序性f交互性g费用h写作质量l网络信息安全)

网络信息资源的评价方法:1定性评价法2定量评价法3综合评价法。

网络信息检索和获取涉及的费用问题:1面向个人用户的网络内容收费方式(a按在线阅读或下载的数量计费b按一定是时间段计费c提供特定费用、时间段和使用权限的套餐)2支付方式(a购买专门充值卡b手机支付c货币支付等) 2 面向集体用户的网络内容收费方式(a单一机构采购b集团采购c国家许可)

网络信息利用中的知识产权的问题:涉及对象的问题和使用行为所涉及问题。

网络信息利用中的知识产权的四个特征:法定性、专有性、地域性、时间性。

网络信息检索与利用的重要工具:1个人文献管理软件 个人文献管理软件是一种帮助用户组织、管理与课题相关飞参考文献,建立个人文献数据库的软件。应用最广的是Refworks系统。使用方法a建立个人数据库b创建/组织文件夹c添加记录d查看编辑记录e记录关联与移动f记录去重g添加附件和笔记h记录批处理i生成引文l建立新的书目输出格式m与他人共享文献信息 2问题回答类工具 中文三大问答工具 :爱问知识人、百度知道、雅虎知道堂。 国外回答问题工具Ask(最大提问系统)、AllExperts(综合性) Ask ERIC(教育类) Ask Alice(健康) AskJack(体育) Ask Joan of Art(艺术)3自动翻译工具

10章信息检索的应用—科技查新

《科技查新规范》的定义:查新是科技查新的简称,是指查新机构根据查新委托人提供的需要查证其新颖性的科学技术内容,按照本规范操作,并作出结论。

科技查新的有关术语

查新机构是指具有查新业务资质的信息咨询机构。

查新项目是指被查证(待查证)的科学技术项目。

查新点是指需要查证的内容要点。

新颖性是指在查新委托日以前查新项目的科学技术内容部分或者全部没有在国内外出版物上公开发表过。

查新委托人是指提出查新需求的自然人、法人或者其他组织。

查新人员是指参与查新工作的人员,包括查新员、审核员及其他工作人员。

查新员是指具有中级(含)以上专业技术职称和查新资格,负责查新全部过程的查新人员。

审核员是查新审核员的简称,是指具有高级专业技术职称和查新资格,负责审核查新员所做的查新工作是否规范,并向查新员提出审核意见的查新人员。

查新工作的意义及作用:为科学评价科研成果提供客观依据、提高情报工作地位,促进情报人员自身建设、为科技人员进行研究开发提供可靠而丰富的信息。

查新工作的基本程序:1查新委托人提出查新申请(查新委托人的义务 、查新委托人的行为规范、 查新委托人的权利、查新委托人的法律责任。) 2查新机构受理查新课题(受理条件 有下列情况之一,查询机构不得受理委托:超出查询机构的收理范围、缺少必要的数据库或文献资源)3查新机构根据查新委托人的课题进行检索(检索准备 、选择检索工具“包括期刊、专利、论文、成果、新闻等文献类型)中,必查数据库应不少于10个;国外通用基本数据库在以国际联机为主要检索手段进行查新时,必查数据库应不少于10个”、确定检索方法和途径实施检索 )4撰写查新报告 5查新委托人领取报告和交纳查新费用

在对课题进行检索的检索准备有:1明确检索目的 2确定新项目的核心内容 3确定检索类型和范围4制定周密科学的检索策略。

查新质量评价:查新工作质量可以通过以下“查新质量评价指标体系”进行评价。

科技查新中的文献检索技巧:某专题图书的查找、期刊论文的检索、标准文献的检索。

1查图书2查期刊论文3查学位论4查会议论文5查专利、研究报告等6学术资源导航的利用7学科信息门户的利用8搜索引擎的利用9各类免费信息的获取10免费信息增值服务。

如何提高查新质量?

答:查新质量主要表现在文献检索质量和查新报告质量两个方面。要提高文献检索质量,就要提高检索的全面性和准确性;要提高报告质量,要从提高对比分析质量、结论质量、表述质量几个方面着手。

查新报告的内容:报告编号、项目名词、委托人、委托日期、查新机构名称、查新完成日期、查新项目名称、查新机构的详细信息、查新目的、查新项目的科学技术要点、查新点与查新要求、文献检索范围与检索策略、检索结果、查询结论、查新员与审核员声明、附件清单、备注。

查找国内外引文与学位论文、会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。

(1)查找国内外引文可用引文索引数据库,如查找国外引文可选择《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)、《艺术与人文科学引文索引》(A&HCI),即著名的三大引文索引SCI、SSCI、AHCI;查找国内引文可选择中国科学引文数据库(Chinese Science Citation Database,简称CSCD)、中文社会科学引文索引 (Chinese Social Science Citation Information,简称CSSCI)等。

(2)查找国内外学位论文可用学位论文索引与摘要数据库,如CALIS的《学位论文库》,万方数据资源系统中的《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDT(ProQuest Dissertations &Theses),美国学位论文网络数字图书馆NDLTD (Networked Digital Library of Thesis and Dissertations)等。

(3)会议论文数据库包括:会议论文索引与摘要,如CALIS会议论文数据库,万方数据资源系统《中国学术会议论文数据库》,OCLC会议数据库——《在会议上提交的文章索引》(Papers First),《会议出版物索引》(Proceedings),Web of Knowledge的会议录引文索引CPCI(Conference Proceedings Citation Index)。

引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。

从哪些方面全面地查找关于某一主题的研究成果?

(1)图书的查找,包括图书馆目录、网络书店、读秀、Google Books等图书搜索引擎的使用等;

(2)期刊论文的查找,包括检索国内外的期刊数据库、引文索引库和OA期刊,利用Google Scholar查找等;

(3)学位论文的查找,包括国内外学位论文库的查找;

(4)会议论文的查找,可以通过搜索引擎或专门的会议文献数据库查找相关会议文献;

(5)专利等信息的查找,包括国内外专利数据库、专利局网站的使用;

(6)有关机构和网站等资料的查找等。

除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?请至少给出5种,每种举一例。

学科信息门户(如CALIS的学科导航库、SOSIG等)、数字图书馆(如国家数字图书馆)、开放获取资源(如OA期刊、机构知识库等)、专业机构的网站、专业人员的个人网站或博客、国内外政府机构的网站、国家精品课程网站、国外大学的免费课程资源网站等。

美国图书馆协会(ALA)网络信息选择标准

1免费或大部分免费(重要部份和重要量的数据免费存取)、2内容的质量与深度、3网站信息的有用性与独特性、4时效性(经常更新、链接有效)、5清楚的表达、6适当满足既定受众、7提供到其他网站的适当的链接、8对细节的注意(如不能有语法错误)、9网站的稳定性、10便于使用(如易于下载、打印等,易于使用的导航)、11提供好的搜寻引擎、12注意用户服务(如提供正确的、可以联系上的电子邮件地址)、13吸引人的版面设计等

美国威斯康星大学10C标准:内容、可信度、批判性思考、版权、引文、连贯性、审查制度、可连接性、可比性、范围。

电子图书有哪些特点?

存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编

辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。

信息检索对实际工作中有哪些指作用?学习<信息检索与利用>有何意义和作用?

(一)有利于迅速适应信息社会的发展

面对21世纪信息社会所带来的挑战,必须加快我国信息教育的步伐,尽早掌握信息检索的本领,才会在未来的竞争,扣取得更大的主动权。信息检索是实践证明了的一种掌握信息、获取信息的窍门,提高综合能力的有效办法。掌握了信息检索的方法和技能,就可以使人们的大脑从繁重的记忆活动中解放出来,就可以充分地利用图书馆和文献中心的丰富文献和电子计算机信息检索系统,在知识的海洋中有目的地、迅速地获取信息,吸收信息,进行知识创新和成果创造性的工作。

(二)有利于增强信息意识

具有了信息意识才能促进智力资源的开发和创造性能力的提高,使科研工作顺利发展。科学研究是在继承前人或别人成就的基础上进行新知识创造的探索性工作,只有意识到这一问题,才能够在任何科学研究开始之前进行情报资料的收集、掌握和分析工作。

(三)有利于消除学科语言障碍

通过“信息检索”课程的学习,可以在—定程度上消除自然语言和科学专业语言之间的障碍。

(四)有利于实现终生学习

古人说:”餐人以鱼,其食—饷,授人以渔。其食—生”,一个学生在学校学习的知识毕竞有限,当走上工作岗位之后,仍需要终生学习,不断地更新知识,才能适应科技的迅速发展,适应社会发展的需求。掌握信息检索的方法与技能,是做到无师自通、不断扩展知识面、不断调整其知识结构、很快地找到—条吸取和利用大量新鲜知识捷径。

因篇幅问题不能全部显示,请点此查看更多更全内容