Ⅰ 常用的信息检索方法有哪些
信息检索方法包括:普通法、追溯法和分段法。
1、普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。普通法又可分为顺检法和倒检法。
2、追溯法是利用已有文献所附的参考文献不断追踪查找的方法,在没有检索工具或检索工具不全时,此法可获得针对性很强的资料,查准率较高,查全率较差。
3、分段法是追溯法和普通法的综合,它将两种方法分期、分段交替使用,直至查到所需资料为止。
(1)2检索词的提取方法有哪些扩展阅读
检索原因
信息检索是获取知识的捷径
美国普林斯顿大学物理系一个年轻大学生名叫约瀚·菲利普,在图书馆里借阅有关公开资料,仅用四个月时间,就画出一张制造原子弹的设计图。
他设计的原子弹,体积小(棒球大小)、重量轻(7.5公斤)、威力大(相当广岛原子弹3/4的威力),造价低(当时仅需两千美元),致使一些国家(法国、巴基斯坦等)纷纷致函美国大使馆,争相购买他的设计拷贝。
二十世纪七十年代,美国核专家泰勒收到一份题为《制造核弹的方法》的报告,他被报告精湛的技术设计所吸引,惊叹地说:“至今我看到的报告中,它是最详细、最全面的一份。”
但使他更为惊异的是,这份报告竟出于哈佛大学经济专业的青年学生之手,而这个四百多页的技术报告的全部信息来源又都是从图书馆那些极为平常的、完全公开的图书资料中所获得的。
Ⅱ 信息检索主题词如何提取
弄清楚信息检索目标所属的学科,确定检索的范围,根据检索范围选取词意更为具体的词作为主题词,尽量用书面词语,少用口语化词语和词意宽泛的词语。
有些信息可以供不同的课题和学科参考,在选取主题词时,可以选取与之相近或者相关的词语作为主题词。
有些信息可以直接从标题中提取主题词。
Ⅲ 常用的处理检索词的方法有哪些
常用的信息检索方法包括:普通法、追溯法和分段法。
检索词受控词和非受控词两者各有优缺点,受控词的检索效率高,一旦选定宽度适当的概念,系统就能检出这一概念的全部内容。
而且,由于标引人员已事先解决了自然语言中的同义、近义关系,使检索相对容易,但由于其先组性质,受控词不能及时反映新事物的发展,概念数量有限,结构复杂,不能适应数量众多、要求各异的信息用户,也不易为非专业人员掌握。
检索词分类:
从词的性质来划分,检索词可以划分为四类:表示主题的检索词、表示作者的检索词、表示分类的检索词和表示特殊意义的检索词。
标题词:指经规范化处理得先组定组式的词汇。
单元词:指从信息内容中抽出的最基本的词汇。
叙词:指从信息的内容中抽出的、能概括表达信息内容基本概念的名词或术语,它是经规范化处理的自然语言词汇。
关键词:指从信息单元的题目、正文或摘要中抽出德能表征信息主体内容的具有实质意义的词语,它是未经规范化处理的自然语言词汇。
Ⅳ 专业文献的检索方法
《赵坤文献检索与管理实用教程》网络网盘免费下载
链接:
赵坤文献检索与管理实用教程(高清视频)网络网盘
Ⅳ 如何选定合适的检索词
在文献信息检索过程中,要想得到令人满意的检索效果,关键是能够构造出全面描述、正确揭示信息需求的检索式。检索词是检索式的基本组成元素,如果选词不当就很容易造成漏检和误检,因此,能否选准、选全检索词直接影响到检索效果的优劣。那么,如何选定合适的检索词呢?
常用的方法是:从给定的课题名称出发,经过切分、删除、补充等步骤,确定检索词,最终通过组配,构成能全面、明确表达信息需求的检索式。
1、切分
对课题语句进行切分,以词为单位划分句子或词组。如:“改革开放三十年的得与失”,可以切分为:改革开放|三十年|的|得|与|失|。
2、删除
删除不具有检索意义的虚词、其他非关键词及过于宽泛和过于具体的限定词,只保留明确反映课题实质的核心词。不具备检索意义的词有介词、连词、助词等虚词如果应用在检索式中,会形成检索噪声,必须删除。过分宽泛的词,如:研究、探索、利用、影响、作用、发展等,没有触及问题的实质,而过分具体的词会造成挂一漏万,删除后会获得更高的查全率。
如上例中, “的”、“与”是不具检索意义的虚词,首先删除。“得”、“失”过于具体,如果用作检索词,就会漏检诸如“成就与失误”、“回顾与展望”等相关文献,因此也在删除之列。
3、补充
补充还原词组、同义词和近义词。很多时候,还要考虑上下位概念的扩展检索。
许多名词是由词组缩略而成,可以采用与之相反的操作——补充还原。如: “教改”可以还原为“教学改革”,“音质”还原为“声音质量”等。
最常用的补充检索词的方法是补充同义词和近义词。如上例中,增加“30年”作为检索词。再如,检索“互联网”方面的文献,要补充“Internet”、“因特网”两个检索词。
对于需要较高查全率的检索课题,可以以降低检索词的专指度为出发点,补充选用检索词的上位词。反之,对于需要较高查准率的检索课题,则要提高检索词的专指度,增加或换用下位词进行检索。如检索“香菇的栽培技术”的相关文献,应考虑香菇的上位概念:食用菌。在课题“轻金属的焊接”中,轻金属是一个上位概念,其下位概念包括:铝、镁等具体的金属,如考虑查全,应把轻金属、铝、镁等概念用逻辑或算符连接起来,作为一组词进行检索。
确定检索词后,分析各词之间的逻辑关系,运用布尔逻辑算符、截词符、位置算符等检索算符把各检索词组配起来,即可构成准确表达信息需求的检索式。
如上例中,检索式为:改革开放AND(三十年OR 30年)
需要说明的是:检索式的复杂与否,取决于课题需要。描述简炼的课题,检索式可能会很复杂;名称冗长的课题,检索式反而可能会很简单。
检索词是表达信息需求的基本元素,其选择恰当与否直接影响到检索效果。对于给定的检索课题,应首先深入分析课题内容,在提取核心词的基础上进行扩展,然后构造较为完善的检索策略和检索式,才能获得令人满意的计算机检索效果。
您可能也喜欢:
Ⅵ 如何选择检索词
搜索结果质量如何, 与关键词的选择十分密切。可以从下面几点去考虑选择合适的关键词。
(1)准确。关键词表述准确是获得良好搜索结果的必要前提。提高关键词的准确性,需要注意两个方面:一是避免错别字;二是避免有歧义的字、词。对于简单、通俗,容易产生歧义的关键词,应采取添加一些限制性的修饰词,将搜索目的表述完整一点。
比如将“苹果”改写为“水果苹果”,搜索结果会变得满意很多。另外,采用搜索语法组合关键词,也可有效地提高搜索质量,比如“饮食营养科学”,用英文双引号使长关键词作为一个不可切分的整体,就可提高搜索结果的精度。
搜索语法大都很简单,使用搜索引擎前,花上一点时间了解其语法规则,这有助于快速、高效地查找所需的信息资料。
(2) 力求简练。目前的搜索引擎在处理自然语言方面的能力不是很强。因此,在提交搜索请求时,用户最好把自己的想法提炼成简单的而且与希望找到的信息内容主题关联的查询词。
比如前面举过的例子“初一学生关于爱国的名人名言”,如果删去不影响搜索结果的“初一学生”,屏弃多余的“关于”,去掉意义重复的“名人”。
提炼成言简意赅的“爱国名言”。这样,从搜索意图出发,选择、提炼检索词的主题信息,形成一个清晰、准确的概念,即可避免因检索词冗长而造成检索失败。
(3) 具有代表性。关就是说关键词要能成为被查询事物的典型标志,时间、人物、地点一般可以成为增加关键词代表性的有效限制因素。比如,查找职称外语考试的考纲,如果直接把关键词定为“职称外语考试大纲”, 网络搜索引擎检索的结果是120,000 篇信息。
如果加上一个时间限制词“2007 年”,加上一个地域限制词“中国”,再加上一个特性限制词“专业技术人员”, 最后把关键词改成 “2007 年中国专业技术人员职称外语考试大纲”,网络搜索的结果就只有4 940 篇了。因此,最具代表性和指示性的关键词对提高搜索效率至关重要。
Ⅶ 如何提取检索词
从给定的课题名称出发,经过切分、删除、补充等步骤,确定检索词,最终通过组配,构成能全面、明确表达信息需求的检索式。
1、切分
对课题语句进行切分,以词为单位划分句子或词组。如:“改革开放三十年的得与失”,可以切分为:改革开放|三十年|的|得|与|失|。
2、删除
删除不具有检索意义的虚词、其他非关键词及过于宽泛和过于具体的限定词,只保留明确反映课题实质的核心词。不具备检索意义的词有介词、连词、助词等虚词如果应用在检索式中,会形成检索噪声,必须删除。过分宽泛的词,如:研究、探索、利用、影响、作用、发展等,没有触及问题的实质,而过分具体的词会造成挂一漏万,删除后会获得更高的查全率。
如上例中, “的”、“与”是不具检索意义的虚词,首先删除。“得”、“失”过于具体,如果用作检索词,就会漏检诸如“成就与失误”、“回顾与展望”等相关文献,因此也在删除之列。
3、补充
补充还原词组、同义词和近义词。很多时候,还要考虑上下位概念的扩展检索。
许多名词是由词组缩略而成,可以采用与之相反的操作——补充还原。如: “教改”可以还原为“教学改革”,“音质”还原为“声音质量”等。最常用的补充检索词的方法是补充同义词和近义词。如上例中,增加“30年”作为检索词。再如,检索“互联网”方面的文献,要补充“Internet”、“因特网”两个检索词。
对于需要较高查全率的检索课题,可以以降低检索词的专指度为出发点,补充选用检索词的上位词。反之,对于需要较高查准率的检索课题,则要提高检索词的专指度,增加或换用下位词进行检索。如检索“香菇的栽培技术”的相关文献,应考虑香菇的上位概念:食用菌。在课题“轻金属的焊接”中,轻金属是一个上位概念,其下位概念包括:铝、镁等具体的金属,如考虑查全,应把轻金属、铝、镁等概念用逻辑或算符连接起来,作为一组词进行检索。
确定检索词后,分析各词之间的逻辑关系,运用布尔逻辑算符、截词符、位置算符等检索算符把各检索词组配起来,即可构成准确表达信息需求的检索式。
Ⅷ 计算机检索的常用方法有哪些
明确检索要求和检索目标
计算机检索的第一步准备工作是明确检索要求和检索目标。
明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。
确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。
4.3.2 课题分析
1. 课题概念的分析方法 分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。
2. 隐含概念的分析方法 有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。
3. 核心概念的选取 有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。
为了提高文献的检准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不同拼法的词,以避免漏检有关的文献。
4.3.3 检索词的扩展、选择和处理
目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。
1.相同概念的检索词的扩展 扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法
(1) 同义词方法。在同一概念的范畴内,从语言角度,选择不同的名称、不同的拼写方法和单复数形式。不同的名称包括学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。
(2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括"?"和"*"两种。具体采用什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符
("?") 和有限截词 ("??"和"?? ?")等多种,"?"有时还用做字符屏蔽符。
(3)主题词表方法 许多数据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果的准确性,而且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。
2.检索词的选择和处理 运用上述方法得到的词,首先应加以选择,即注意选用本专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题"东西方社会保障制度比较研究"的概念组面和检索词为:
概念组面1:"社会保障" social security 概念组面2:"制度研究"system? Research
4.3.4 数据库的选择
不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。
选择数据库,我们一般应该遵循以下几条原则
1.按照课题的检索要求和目的,选择收录文献种类多、专业覆盖面宽、年代跨度对口的数据库;
2.当需要查找最新文献信息时,选择数据更新周期短的数据库;
3.当还需要获取原文时,选取原文获取较容易的数据库;
4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。
5.当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低的数据库。
4.3.5 检索策略构成和调整方法
在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。
检索策略,又称提问逻辑,就是对多个检索词之间的相互关系和检索顺序作出的某种安排。构成检索策略就是运用计算机情报检索系统可以接受的方法,包括布尔逻辑算符、位置逻辑算符等方法,表达课题检索要求的过程。
1.布尔逻辑算符 规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)"。
(1) 或(OR)运算符。也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系。
(2) 与(AND)运算符。也可用"*"代替,用来组配不同检索概念。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符。
(3) 非(NOT)运算符。也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索范围,提高检索结果的查准率.
2. 位置算符 位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等。位置算符是调整检索策略的一种重要手段。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同。例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种。
3.字段限制 字段限制也是调整检索策略的一种重要的手段。它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法。如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制。例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码。这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"="。
4. 检索策略的调整 检索策略输入检索系统后,系统响应的检索结果有时不一定能满足课题检索的要求,例如:或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。
调整检索策略之前,首先要分析造成检索结果不理想的原因。对于输出篇数过多的情况,应分析是否是由下述原因造成的:①选用了多义性的检索词;②截词截得过短;③输入的检索词太少;④应该使用"与(AND)"的使用了"或(OR)";⑤优先运算符"()"使用错误。对于输出篇数过少的情况,应分析是否是由下述原因造成的:①检索词拼写错误;②遗漏重要的同义词或隐含概念;③检索词过于冷僻具体;④没有使用截词算符;⑤位置算符和字段算符使用的过多;⑥使用过多的"与(AND)"算符。
针对上述原因,如果是属于需要扩大检索范围,提高文献查全率,调整检索策略的方法有:①减少"与(AND)"算符,增加同义词或同族相关词使用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。
如果是属于缩小检索范围,提高文献查准率的,调整检索策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限定检索词在指定的基本字段,或者指定的辅助字段出现,限制检索结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用"非(NOT)"算符,排除无关概念。
4.3.6 输出格式和方式的选择
所谓输出格式的选择是对记录字段的选择。所谓输出方式的选择是指对屏幕显示、打印和存盘的选择。 一般情况下,如果输出的是中间结果,属于基本字段的题目(TI)、文摘(AB)、叙词(DE)和识别词(ID)字段是必须的,这些字段有利于观察结果,对检索策略做进一步调整。如果是最终结果,可以根据时间、经费条件选择其中适用的格式。
输出方式的选择,要注意的问题是,数据库是否只允许打印、存盘选中的记录;在选定打印、存盘后,是否还须进一步选择"当前记录""全部记录""选中记录";另外如果是存盘,是否还有文件扩展名的限制。
另外给你推荐本书:参考下http://wenku..com/view/646426c58bd63186bcebbca4.html
Ⅸ 提炼出检索词并说出检索方法.
检索词 :王熙凤的语言特色 资料 博硕论文
方法:直接法,又称常用法,分为顺查法,倒查法和抽查法