Ⅰ 常用的信息檢索方法有哪些
信息檢索方法包括:普通法、追溯法和分段法。
1、普通法是利用書目、文摘、索引等檢索工具進行文獻資料查找的方法。運用這種方法的關鍵在於熟悉各種檢索工具的性質、特點和查找過程,從不同角度查找。普通法又可分為順檢法和倒檢法。
2、追溯法是利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒有檢索工具或檢索工具不全時,此法可獲得針對性很強的資料,查准率較高,查全率較差。
3、分段法是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
(1)2檢索詞的提取方法有哪些擴展閱讀
檢索原因
信息檢索是獲取知識的捷徑
美國普林斯頓大學物理系一個年輕大學生名叫約瀚·菲利普,在圖書館里借閱有關公開資料,僅用四個月時間,就畫出一張製造原子彈的設計圖。
他設計的原子彈,體積小(棒球大小)、重量輕(7.5公斤)、威力大(相當廣島原子彈3/4的威力),造價低(當時僅需兩千美元),致使一些國家(法國、巴基斯坦等)紛紛致函美國大使館,爭相購買他的設計拷貝。
二十世紀七十年代,美國核專家泰勒收到一份題為《製造核彈的方法》的報告,他被報告精湛的技術設計所吸引,驚嘆地說:「至今我看到的報告中,它是最詳細、最全面的一份。」
但使他更為驚異的是,這份報告竟出於哈佛大學經濟專業的青年學生之手,而這個四百多頁的技術報告的全部信息來源又都是從圖書館那些極為平常的、完全公開的圖書資料中所獲得的。
Ⅱ 信息檢索主題詞如何提取
弄清楚信息檢索目標所屬的學科,確定檢索的范圍,根據檢索范圍選取詞意更為具體的詞作為主題詞,盡量用書面詞語,少用口語化詞語和詞意寬泛的詞語。
有些信息可以供不同的課題和學科參考,在選取主題詞時,可以選取與之相近或者相關的詞語作為主題詞。
有些信息可以直接從標題中提取主題詞。
Ⅲ 常用的處理檢索詞的方法有哪些
常用的信息檢索方法包括:普通法、追溯法和分段法。
檢索詞受控詞和非受控詞兩者各有優缺點,受控詞的檢索效率高,一旦選定寬度適當的概念,系統就能檢出這一概念的全部內容。
而且,由於標引人員已事先解決了自然語言中的同義、近義關系,使檢索相對容易,但由於其先組性質,受控詞不能及時反映新事物的發展,概念數量有限,結構復雜,不能適應數量眾多、要求各異的信息用戶,也不易為非專業人員掌握。
檢索詞分類:
從詞的性質來劃分,檢索詞可以劃分為四類:表示主題的檢索詞、表示作者的檢索詞、表示分類的檢索詞和表示特殊意義的檢索詞。
標題詞:指經規范化處理得先組定組式的詞彙。
單元詞:指從信息內容中抽出的最基本的詞彙。
敘詞:指從信息的內容中抽出的、能概括表達信息內容基本概念的名詞或術語,它是經規范化處理的自然語言詞彙。
關鍵詞:指從信息單元的題目、正文或摘要中抽出德能表徵信息主體內容的具有實質意義的詞語,它是未經規范化處理的自然語言詞彙。
Ⅳ 專業文獻的檢索方法
《趙坤文獻檢索與管理實用教程》網路網盤免費下載
鏈接:
趙坤文獻檢索與管理實用教程(高清視頻)網路網盤
Ⅳ 如何選定合適的檢索詞
在文獻信息檢索過程中,要想得到令人滿意的檢索效果,關鍵是能夠構造出全面描述、正確揭示信息需求的檢索式。檢索詞是檢索式的基本組成元素,如果選詞不當就很容易造成漏檢和誤檢,因此,能否選准、選全檢索詞直接影響到檢索效果的優劣。那麼,如何選定合適的檢索詞呢?
常用的方法是:從給定的課題名稱出發,經過切分、刪除、補充等步驟,確定檢索詞,最終通過組配,構成能全面、明確表達信息需求的檢索式。
1、切分
對課題語句進行切分,以詞為單位劃分句子或片語。如:「改革開放三十年的得與失」,可以切分為:改革開放|三十年|的|得|與|失|。
2、刪除
刪除不具有檢索意義的虛詞、其他非關鍵詞及過於寬泛和過於具體的限定詞,只保留明確反映課題實質的核心詞。不具備檢索意義的詞有介詞、連詞、助詞等虛詞如果應用在檢索式中,會形成檢索雜訊,必須刪除。過分寬泛的詞,如:研究、探索、利用、影響、作用、發展等,沒有觸及問題的實質,而過分具體的詞會造成掛一漏萬,刪除後會獲得更高的查全率。
如上例中, 「的」、「與」是不具檢索意義的虛詞,首先刪除。「得」、「失」過於具體,如果用作檢索詞,就會漏檢諸如「成就與失誤」、「回顧與展望」等相關文獻,因此也在刪除之列。
3、補充
補充還原片語、同義詞和近義詞。很多時候,還要考慮上下位概念的擴展檢索。
許多名詞是由片語縮略而成,可以採用與之相反的操作——補充還原。如: 「教改」可以還原為「教學改革」,「音質」還原為「聲音質量」等。
最常用的補充檢索詞的方法是補充同義詞和近義詞。如上例中,增加「30年」作為檢索詞。再如,檢索「互聯網」方面的文獻,要補充「Internet」、「網際網路」兩個檢索詞。
對於需要較高查全率的檢索課題,可以以降低檢索詞的專指度為出發點,補充選用檢索詞的上位詞。反之,對於需要較高查准率的檢索課題,則要提高檢索詞的專指度,增加或換用下位詞進行檢索。如檢索「香菇的栽培技術」的相關文獻,應考慮香菇的上位概念:食用菌。在課題「輕金屬的焊接」中,輕金屬是一個上位概念,其下位概念包括:鋁、鎂等具體的金屬,如考慮查全,應把輕金屬、鋁、鎂等概念用邏輯或算符連接起來,作為一組詞進行檢索。
確定檢索詞後,分析各詞之間的邏輯關系,運用布爾邏輯算符、截詞符、位置算符等檢索算符把各檢索片語配起來,即可構成准確表達信息需求的檢索式。
如上例中,檢索式為:改革開放AND(三十年OR 30年)
需要說明的是:檢索式的復雜與否,取決於課題需要。描述簡煉的課題,檢索式可能會很復雜;名稱冗長的課題,檢索式反而可能會很簡單。
檢索詞是表達信息需求的基本元素,其選擇恰當與否直接影響到檢索效果。對於給定的檢索課題,應首先深入分析課題內容,在提取核心詞的基礎上進行擴展,然後構造較為完善的檢索策略和檢索式,才能獲得令人滿意的計算機檢索效果。
您可能也喜歡:
Ⅵ 如何選擇檢索詞
搜索結果質量如何, 與關鍵詞的選擇十分密切。可以從下面幾點去考慮選擇合適的關鍵詞。
(1)准確。關鍵詞表述准確是獲得良好搜索結果的必要前提。提高關鍵詞的准確性,需要注意兩個方面:一是避免錯別字;二是避免有歧義的字、詞。對於簡單、通俗,容易產生歧義的關鍵詞,應採取添加一些限制性的修飾詞,將搜索目的表述完整一點。
比如將「蘋果」改寫為「水果蘋果」,搜索結果會變得滿意很多。另外,採用搜索語法組合關鍵詞,也可有效地提高搜索質量,比如「飲食營養科學」,用英文雙引號使長關鍵詞作為一個不可切分的整體,就可提高搜索結果的精度。
搜索語法大都很簡單,使用搜索引擎前,花上一點時間了解其語法規則,這有助於快速、高效地查找所需的信息資料。
(2) 力求簡練。目前的搜索引擎在處理自然語言方面的能力不是很強。因此,在提交搜索請求時,用戶最好把自己的想法提煉成簡單的而且與希望找到的信息內容主題關聯的查詢詞。
比如前面舉過的例子「初一學生關於愛國的名人名言」,如果刪去不影響搜索結果的「初一學生」,屏棄多餘的「關於」,去掉意義重復的「名人」。
提煉成言簡意賅的「愛國名言」。這樣,從搜索意圖出發,選擇、提煉檢索詞的主題信息,形成一個清晰、准確的概念,即可避免因檢索詞冗長而造成檢索失敗。
(3) 具有代表性。關就是說關鍵詞要能成為被查詢事物的典型標志,時間、人物、地點一般可以成為增加關鍵詞代表性的有效限制因素。比如,查找職稱外語考試的考綱,如果直接把關鍵詞定為「職稱外語考試大綱」, 網路搜索引擎檢索的結果是120,000 篇信息。
如果加上一個時間限制詞「2007 年」,加上一個地域限制詞「中國」,再加上一個特性限制詞「專業技術人員」, 最後把關鍵詞改成 「2007 年中國專業技術人員職稱外語考試大綱」,網路搜索的結果就只有4 940 篇了。因此,最具代表性和指示性的關鍵詞對提高搜索效率至關重要。
Ⅶ 如何提取檢索詞
從給定的課題名稱出發,經過切分、刪除、補充等步驟,確定檢索詞,最終通過組配,構成能全面、明確表達信息需求的檢索式。
1、切分
對課題語句進行切分,以詞為單位劃分句子或片語。如:「改革開放三十年的得與失」,可以切分為:改革開放|三十年|的|得|與|失|。
2、刪除
刪除不具有檢索意義的虛詞、其他非關鍵詞及過於寬泛和過於具體的限定詞,只保留明確反映課題實質的核心詞。不具備檢索意義的詞有介詞、連詞、助詞等虛詞如果應用在檢索式中,會形成檢索雜訊,必須刪除。過分寬泛的詞,如:研究、探索、利用、影響、作用、發展等,沒有觸及問題的實質,而過分具體的詞會造成掛一漏萬,刪除後會獲得更高的查全率。
如上例中, 「的」、「與」是不具檢索意義的虛詞,首先刪除。「得」、「失」過於具體,如果用作檢索詞,就會漏檢諸如「成就與失誤」、「回顧與展望」等相關文獻,因此也在刪除之列。
3、補充
補充還原片語、同義詞和近義詞。很多時候,還要考慮上下位概念的擴展檢索。
許多名詞是由片語縮略而成,可以採用與之相反的操作——補充還原。如: 「教改」可以還原為「教學改革」,「音質」還原為「聲音質量」等。最常用的補充檢索詞的方法是補充同義詞和近義詞。如上例中,增加「30年」作為檢索詞。再如,檢索「互聯網」方面的文獻,要補充「Internet」、「網際網路」兩個檢索詞。
對於需要較高查全率的檢索課題,可以以降低檢索詞的專指度為出發點,補充選用檢索詞的上位詞。反之,對於需要較高查准率的檢索課題,則要提高檢索詞的專指度,增加或換用下位詞進行檢索。如檢索「香菇的栽培技術」的相關文獻,應考慮香菇的上位概念:食用菌。在課題「輕金屬的焊接」中,輕金屬是一個上位概念,其下位概念包括:鋁、鎂等具體的金屬,如考慮查全,應把輕金屬、鋁、鎂等概念用邏輯或算符連接起來,作為一組詞進行檢索。
確定檢索詞後,分析各詞之間的邏輯關系,運用布爾邏輯算符、截詞符、位置算符等檢索算符把各檢索片語配起來,即可構成准確表達信息需求的檢索式。
Ⅷ 計算機檢索的常用方法有哪些
明確檢索要求和檢索目標
計算機檢索的第一步准備工作是明確檢索要求和檢索目標。
明確檢索要求就是要搞清楚本課題屬於什麼學科,所需文獻的類型及語種,查找文獻的年代,所需文獻的最佳篇數,允許支配的檢索費用。這些要求對選擇資料庫、構造檢索策略都是十分重要的。
確定檢索目標也是進行計算機信息檢索前應搞清楚的准備工作。例如:如果屬於開題調研,則應盡可能地檢索出與之相關的全部文獻,即要求較高的查全率;以便充分地做好開題的准備工作;如果屬於探索性、開創性的課題,則只需要查出一些啟發性的文獻,對查准率和查全率要求都不一定有很高的要求。
4.3.2 課題分析
1. 課題概念的分析方法 分析課題就是分析出課題所涉及的主要概念,並找出能代表這些概念的若干個詞或片語,進而分析概念之間的上、下、左、右關系。對於新學科、交叉學科和邊緣學科的課題,則要搞清楚這些概念之間的關系。概念分析的結果應以概念組為單元的詞或片語的形式列出,以便下一步制訂檢索策略時使用。
2. 隱含概念的分析方法 有些課題的實質性內容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關的內容需要從課題所屬的專業角度作深入分析,才能提煉出能夠確切反映課題內容的檢索概念。例如:"社會保障"包含"養老保險"、"失業保險"、"醫療保險"和"社會救濟"等概念,如果要檢索社會保障方面的文獻,應該析出上述概念,才能保證文獻的查全率。
3. 核心概念的選取 有些檢索詞中已經含有的某些概念,在概念分析中應予以排除。例如:課題"公司勞動獎勵、職工培訓和養老保險制度管理的理論和實踐",如果把"勞動獎勵","職工培訓","養老保險","公司","制度","管理"六個概念全部組配起來,則會造成大量文獻漏檢。實際上,勞動力資源管理已經包含了勞動獎勵、職工培訓和養老保險三個方面,而且,勞動力管理必然是針對該三個方面而言的。因此,本課題只須採用"勞動力資源"和"管理"這兩個本質概念即可。
為了提高文獻的檢准率,應該從相應的規范詞表中選擇所需的檢索詞。並且在確定檢索詞時,除了要考慮反映主題概念的同義詞、近義詞等相關的檢索詞外,還要注意選擇被選用檢索詞的縮寫詞和不同拼法的詞,以避免漏檢有關的文獻。
4.3.3 檢索詞的擴展、選擇和處理
目前的計算機信息檢索系統,還不具備智能思考的能力,還不會對所輸入的檢索詞以及涉及的所有詞進行自動、全面的檢索,因此,必須在概念分析的基礎上列出與概念有關的詞,從中做出選擇,並利用截詞等方法對檢索詞予以歸並。
1.相同概念的檢索詞的擴展 擴展相同概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法
(1) 同義詞方法。在同一概念的范疇內,從語言角度,選擇不同的名稱、不同的拼寫方法和單復數形式。不同的名稱包括學名和俗名、簡稱和全稱,商品名和物質或產品名,事物的代碼和事物的學名。不同的拼寫方法,以英語為例,包括英式英語和美式英語的區別。
(2)截詞方法。當某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數英語單詞的單復數變化和英美不同拼寫形式),可以採用截詞方法擴展檢索詞。這種方法要求在詞干後使用截詞符。截詞符一般包括"?"和"*"兩種。具體採用什麼形式,各個系統都有明確的規定。例如:在DIALOG系統中,截詞符號有無限截詞算符
("?") 和有限截詞 ("??"和"?? ?")等多種,"?"有時還用做字元屏蔽符。
(3)主題詞表方法 許多資料庫都編有自己的主題詞表。在資料庫編有主題詞表的情況下,應該盡量從詞表中選擇檢索詞。使用主題詞表,不僅可以使檢索詞更加規范,提高檢索結果的准確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關詞,使獲得的檢索結果更為理想。
2.檢索詞的選擇和處理 運用上述方法得到的詞,首先應加以選擇,即注意選用本專業通用的術語(應避免使用冷僻詞和根據中文術語自譯生造的詞),然後以概念為單位,構成組面(facets)。例如:課題"東西方社會保障制度比較研究"的概念組面和檢索詞為:
概念組面1:"社會保障" social security 概念組面2:"制度研究"system? Research
4.3.4 資料庫的選擇
不同資料庫的學科範圍不同,檢索指令不同,收費的標准也不同。所以,在檢索之前應該閱讀有關資料庫的使用介紹,以便選擇資料庫時做到心中有數。
選擇資料庫,我們一般應該遵循以下幾條原則
1.按照課題的檢索要求和目的,選擇收錄文獻種類多、專業覆蓋面寬、年代跨度對口的資料庫;
2.當需要查找最新文獻信息時,選擇數據更新周期短的資料庫;
3.當還需要獲取原文時,選取原文獲取較容易的資料庫;
4.在同時有多個資料庫可供選擇的情況下,應首先選擇比較熟悉的資料庫。
5.當幾個資料庫的內容交叉重復率比較高時,應選擇檢索費用比較低的資料庫。
4.3.5 檢索策略構成和調整方法
在實際檢索過程中,僅需一個檢索詞就能滿足檢索要求的情況並不很多。通常我們需要使用多個檢索詞構成檢索策略,以滿足由多概念組配而成的較為復雜課題的要求。
檢索策略,又稱提問邏輯,就是對多個檢索詞之間的相互關系和檢索順序作出的某種安排。構成檢索策略就是運用計算機情報檢索系統可以接受的方法,包括布爾邏輯算符、位置邏輯算符等方法,表達課題檢索要求的過程。
1.布爾邏輯算符 規定檢索詞之間的邏輯關系的算符,稱為布爾邏輯算符。布爾邏輯算符包括邏輯"或(OR)"、"與(AND)"和"非(NOT)"。
(1) 或(OR)運算符。也可用"+"代替,是用來組配具有同義或同族概念的詞,如同義詞、相關詞等。其含義是,檢出的記錄中,至少含有兩個檢索詞中的一個。OR算符的基本作用是擴大檢索范圍,增加命中文獻量,提高檢索結果的查全率,OR運算符還有一個去重的功能。在實際檢索中,同一組面中含義相同的詞,相互之間都使用OR運算符。另外,在使用截詞方法檢索具有相同詞乾的檢索詞時,這些詞之間也自動地隱含了邏輯"或"的關系。
(2) 與(AND)運算符。也可用"*"代替,用來組配不同檢索概念。其含義是檢出的記錄必須同時含有所有的檢索詞。AND算符的基本作用是縮小檢索范圍,減少命中文獻量,提高檢索結果的查准率。在實際檢索中,不同概念組面之間以及同一組面內的不同含義的詞之間通常使用AND算符。
(3) 非(NOT)運算符。也可用"-"代替,但在檢索時建議使用NOT,以避免與詞間的分隔符"-"混淆,NOT算符是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其後的詞。NOT算符的基本作用是縮小檢索范圍,提高檢索結果的查准率.
2. 位置算符 位置算符又稱鄰接算符(adjacent operators),適用於兩個檢索詞以指定間隔距離或者指定的順序出現的場合,比如,以片語形式表達的概念;彼此相鄰的兩個或兩個以上的詞;被禁用詞或特殊符號分隔的詞等。位置算符是調整檢索策略的一種重要手段。按照兩個檢索詞出現的順序和距離,可以有多種位置算符,而且對同一種位置算符,檢索系統不同,規定的位置算符也不同。例如,Compendex光碟資料庫使用的位置算符"(N)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序可以顛倒)、"(F)"(表示其兩側的檢索詞必須在同一欄位(例如同在題目欄位或文摘欄位)中出現,兩詞的詞序可以顛倒)、"(S)"(表示其兩側的檢索詞必須在同一句子中出現,兩詞的詞序可以顛倒)和"(W)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序不可以顛倒)四種。
3.欄位限制 欄位限制也是調整檢索策略的一種重要的手段。它是限定檢索詞必須在資料庫記錄中規定的欄位范圍內出現的文獻,方為命中文獻的一種檢索方法。如果想指定在題名等欄位中查找所希望的檢索詞,就需要使用欄位限制。欄位限制適用於在已有一定數量輸出記錄的基礎上,通過指定欄位的方法,減少輸出篇數,提高檢索結果的查准率的場合。由於欄位限制採用前綴和後綴的形式,因此又稱為前綴限制和後綴限制。例如Compendex光碟資料庫基本欄位限制的用法是在需要指定欄位的檢索詞後加上後綴運算符"/"和段碼。這個資料庫輔助欄位限制的用法是在需要指定欄位的檢索詞(有時檢索詞須放在雙引號內)之前加上段碼和前綴運算符"="。
4. 檢索策略的調整 檢索策略輸入檢索系統後,系統響應的檢索結果有時不一定能滿足課題檢索的要求,例如:或者檢出的篇數過多,而且不相關文獻所佔比例很大,或者檢出的文獻數量太少,有時甚至為零,這時就需要調整檢索策略。
調整檢索策略之前,首先要分析造成檢索結果不理想的原因。對於輸出篇數過多的情況,應分析是否是由下述原因造成的:①選用了多義性的檢索詞;②截詞截得過短;③輸入的檢索詞太少;④應該使用"與(AND)"的使用了"或(OR)";⑤優先運算符"()"使用錯誤。對於輸出篇數過少的情況,應分析是否是由下述原因造成的:①檢索詞拼寫錯誤;②遺漏重要的同義詞或隱含概念;③檢索詞過於冷僻具體;④沒有使用截詞算符;⑤位置算符和欄位算符使用的過多;⑥使用過多的"與(AND)"算符。
針對上述原因,如果是屬於需要擴大檢索范圍,提高文獻查全率,調整檢索策略的方法有:①減少"與(AND)"算符,增加同義詞或同族相關詞使用邏輯或(OR)將它們連接起來;②在詞干相同的單詞後使用截詞符(?);③去除已有的欄位限制、位置算符限制(或者改用限製程度較小的位置算符)。
如果是屬於縮小檢索范圍,提高文獻查准率的,調整檢索策略的方法有:①減少同義詞或同族相關詞;②增加限制概念,用邏輯與(AND)將它們連接起來;③使用欄位限制,或者限定檢索詞在指定的基本欄位,或者指定的輔助欄位出現,限制檢索結果的文獻類型、語種、出版國家;④使用適當的位置算符;⑤使用"非(NOT)"算符,排除無關概念。
4.3.6 輸出格式和方式的選擇
所謂輸出格式的選擇是對記錄欄位的選擇。所謂輸出方式的選擇是指對屏幕顯示、列印和存檔的選擇。 一般情況下,如果輸出的是中間結果,屬於基本欄位的題目(TI)、文摘(AB)、敘詞(DE)和識別詞(ID)欄位是必須的,這些欄位有利於觀察結果,對檢索策略做進一步調整。如果是最終結果,可以根據時間、經費條件選擇其中適用的格式。
輸出方式的選擇,要注意的問題是,資料庫是否只允許列印、存檔選中的記錄;在選定列印、存檔後,是否還須進一步選擇"當前記錄""全部記錄""選中記錄";另外如果是存檔,是否還有文件擴展名的限制。
另外給你推薦本書:參考下http://wenku..com/view/646426c58bd63186bcebbca4.html
Ⅸ 提煉出檢索詞並說出檢索方法.
檢索詞 :王熙鳳的語言特色 資料 博碩論文
方法:直接法,又稱常用法,分為順查法,倒查法和抽查法