❶ 信息檢索常用的方法有哪些各有何優缺點
分類(瀏覽)檢索分類(瀏覽)檢索(Browse)一般按照人為設定固定類目收錄相關信息,檢索時只需按照類目層層遞進,遂層深入即可得到相關信息。一般有按主題或字順的方式組織分類。其優點是簡單明了,無需任何檢索基礎知識都能檢索到相關信息,缺點是人為的分類無法做到足夠的細致,手工加工使用信息發布時間有所延遲。關鍵詞檢索關鍵詞檢索(Search)一般有簡單檢索(Simple Search/Quick Search)、高級檢索(Advance Search)和專家檢索(Expert Search)之分。簡單檢索簡單檢索一般提供一個檢索詞輸入框,用於輸入在預設欄位中出現的檢索詞,有的系統也可直接輸入專家檢索的檢索式,如Google首頁的檢索方式。高級檢索高級檢索一般可有多個輸入框,並可選擇檢索欄位及各輸入框之間的邏輯關系。還可有各種限制條件的設置。專家檢索專家檢索可用於輸入檢索式檢索。用於有過專門檢索技巧學習的用戶使用,需要了解檢索系統的邏輯組配檢索、截詞檢索和欄位檢索等各種檢索技巧。
❷ 什麼是基本檢索
即簡單檢索、快速檢索。檢索的可選項少或者沒有,輸入查詢詞,就能快速得到結果。但檢索的准確性差、精度低。
基本檢索方法
一、布爾檢索
利用布爾邏輯算符進行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種方法。常用的布爾邏輯算符有三種,分別是邏輯或「OR」、邏輯與「AND」、邏輯非「NOT」。用這些邏輯算符將檢索片語配構成檢索提問式,計算機將根據提問式與系統中的記錄進行匹配,當兩者相符時則命中,並自動輸出該文獻記錄。下面以「計算機」和「文獻檢索」兩個詞來解釋三種邏輯算符的含義。
(1)「計算機」AND「文獻檢索」,表示查找文獻內容中既含有「計算機」又含有「文獻檢索」詞的文獻。
(2)「計算機」OR「文獻檢索」,表示查找文獻內容中含有「計算機」或含有「文獻檢索」以及兩詞都包含的文獻。
(3)「計算機」NOT「文獻檢索」,表示查找文獻內容中含有「計算機」而不含有「文獻檢索」的那部分文獻。
檢索中邏輯算符使用是最頻繁的,對邏輯算符使用的技巧決定檢索結果的滿意程度。用布爾邏輯表達檢索要求,除要掌握檢索課題的相關因素外,還應在布爾算符對檢索結果的影響方面引起注意。另外,對同一個布爾邏輯提問式來說,不同的運算次序會有不同的檢索結果。布爾算符使用正確但不能達到應有檢索效果的事情是很多的。
二、截詞檢索
截詞檢索就是用截斷的詞的一個局部進行的檢索,並認為凡滿足這個詞局部中的所有字元(串)的文獻,都為命中的文獻。按截斷的位置來分,截詞可有後截斷、前截斷、中截斷三種類型。
不同的系統所用的截詞符也不同,常用的有?、$、*等。分為有限截詞(即一個截詞符只代表一個字元)和無限截詞(一個截詞符可代表多個字元)。下面以無限截詞舉例說明:
(1)後截斷,前方一致。如:comput表示computer,computers,computing等。(2)前截斷,後方一致。如:computer表示minicomputer,microcomputers等。
(3)中截斷,中間一致。如comput表示minicomputer,microcomputers等。
截詞檢索也是一種常用的檢索技術,是防止漏檢的有效工具,尤其在西文檢索中,更是廣泛應用。截斷技術可以作為擴大檢索范圍的手段,具有方便用戶、增強檢索效果的特點,但一定要合理使用,否則會造成誤檢。
三、原文檢索
「原文」是指資料庫中的原始記錄,原文檢索即以原始記錄中的檢索詞與檢索詞間特定位置關系為對象的運算。原文檢索可以說是一種不依賴敘詞表而直接使用自由詞的檢索方法。
原文檢索的運算方式,不同的檢索系統有不同的規定,其差別是:規定的運算符不同;運算符的職能和使用范圍不同。原文檢索的運算符可以通稱為位置運算符。從RECON、ORBIT和STAIRS三大軟體對原文檢索的規定,可以看出其運算符主要是以下4個級別:
(1)記錄級檢索,要求檢索詞出現在同一記錄中;
(2)欄位級檢索,要求檢索詞出現在同一欄位中;
(3)子欄位或自然句級檢索,要求檢索詞出現在同一子欄位或同一自然句中;
(4)詞位置檢索,要求檢索詞之間的相互位置滿足某些條件。
原文檢索可以彌補布爾邏輯檢索、截詞方法檢索的一些不足。運用原文檢索方法,可以增強選詞的靈活性,部分地解決布爾檢索不能解決的問題,從而提高文獻檢索的水平和篩選能力。但是,原文檢索的能力是有限的。從邏輯形式上看,它僅是更高級的布爾系統,因此存在著布爾邏輯本身的缺陷。
❸ 文獻檢索方式有哪些
文獻檢索方式:
1、直接法:又稱常用法,是指直接利用檢索系統(工具)檢索文獻信息的方法。它又分為順查法、倒查法和抽查法。
2、順查法:順查法是指按照時間的順序,由遠及近地利用檢索系統進行文獻信息檢索的方法。這種方法能收集到某一課題的系統文獻,它適用於較大課題的文獻檢索。例如,已知某課題的起始年代,需要了解其發展的全過程,就可以用順查法從最初的年代開始查找。
3、倒查法:倒查法是由近及遠,從新到舊,逆著時間的順序利用檢索工具進行文獻檢索的方法。使用這種方法可以最快地獲得最新資料。
4、抽查法:抽查法是指針對項目的特點,選擇有關該項目的文獻信息最可能出現或最多出現的時間段,利用檢索工具進行重點檢索的方法。
5、追溯法:是指不利用一般的檢索系統,而是利用文獻後面所列的參考文獻,逐一追查原文(被引用文獻),然後再從這些原文後所列的參考文獻目錄逐一擴大文獻信息范圍,一環扣一環地追查下去的方法。它可以像滾雪球一樣,依據文獻間的引用關系,獲得更好的檢索結果。
6、循環法:又稱分段法或綜合法。它是分期分交替使用直接法和追溯法,以期取長補短,相互配合,獲得更好的檢索結果。
(3)截詞檢索是常用信息檢索方法嗎擴展閱讀:
文獻檢索作用:
1、報道文獻信息
檢索系統具有對文獻信息予以揭示、反映、報道的功能。信息用戶只有通過利用文獻檢索系統,才能對大量產生並隨時更新的各種信息進行及時了解和系統的掌握。
2、存儲文獻信息
通過對大量分散而無序的原始文獻進行了有目的的存儲,並按照一定特徵及規則組織,形成了包容各個年代、各種載體、各個學科門類的文獻檢索系統。
3、檢索文獻信息
通過對信息的報道和存儲,把大量信息按外表特徵與內容特徵集中排序,實現方便、高效的信息檢索,它是文獻檢索系統的最突出的功能。
計算機檢索:
以計算機技術為手段,通過光碟和聯機等現代檢索方式進行文獻檢索的方法。與手工檢索一樣,計算機信息檢索應作為未來科技人員的一項基本功,這一能力的訓練和培養對科技人員適應未來社會和跨世紀科研都極其重要。
一個善於從電子信息系統中獲取文獻的科研人員,必定比不具備這一能力的人有更多的成功機會,美國報道生活新方式的期刊POV也將交互網路檢索專家作為未來十大熱門職業之一,這些情況都說明了計算機文獻檢索越來越重要,故值得大家對這一技術予以重視。
❹ 簡述計算機檢索基本技術的種類
計算機檢索基本技術的種類有:布爾邏輯檢索、截詞檢索、限制符檢索、位置運算符檢索。
1、布爾邏輯檢索也稱作布爾邏輯搜索,嚴格意義上的布爾檢索法是指利用布爾邏輯運算符連接各個檢索詞,然後由計算機進行相應邏輯運算,以找出所需信息的方法.它使用面最廣、使用頻率最高.布爾邏輯運算符的作用是把檢索詞連接起來,構成一個邏輯檢索式.
2、截詞檢索是預防漏檢提高查全率的一種常用檢索技術,大多數系統都提供截詞檢索的功能.截詞是指在檢索詞的合適位置進行截斷,然後使用截詞符進行處理,這樣既可節省輸入的字元數目,又可達到較高的查全率.
3、限制符檢索(Range)是通過限制檢索范圍,達到優化檢索結果的方法.限制檢索的方式有多種,例如進行欄位檢索、使用限制符、採用限制檢索命令等.
4、位置運算符檢索也叫臨近檢索.文獻記錄中詞語的相對次序或位置不同,所表達的意思可能不同,而同樣一個檢索表達式中詞語的相對次序不同,其表達的檢索意圖也不一樣.位置算符檢索是用一些特定的算符(位置算符)來表達檢索詞與檢索詞之間的臨近關系,並且可以不依賴主題詞表而直接使用自由詞進行檢索的技術方法.
❺ 截詞檢索有哪三種方式
截詞檢索有以下三種方式:
1、 截詞截得詞的檢索方法可以分為有限詞、無限詞和中間詞。
2、 限定詞,限定詞主要用於單復數,動詞詞尾變化等。在搜索詞(關鍵詞、主題詞)的詞干或後綴可能發生變化的位置放置「n」個詞攔截器。
分詞檢索一般是指右分詞,部分支持中間分詞。截取詞檢索有助於提高檢索的召回率。在分詞檢索技術中,常用的有兩種方法:後分詞和中分詞。根據截斷字元的數量,分為無限詞和有限詞兩種。文字運算符在不同的系統中有不同的表達方式。需要注意的是,並不是所有的搜索引擎都支持這項技術。
❻ 在信息檢索技術中,算符and,or,not指的是哪一種信息檢索技術方法
布爾邏輯檢索 利用布爾邏輯算符進行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種技術。常用的布爾邏輯算符有三種,分別是邏輯或「OR」、邏輯與「AND」、邏輯非「NOT」。 2. 截詞檢索 截詞檢索是計算機檢索系統中應用非常普遍的一種
❼ 常用的信息檢索方法有哪些
信息檢索方法包括:普通法、追溯法和分段法。
1、普通法是利用書目、文摘、索引等檢索工具進行文獻資料查找的方法。運用這種方法的關鍵在於熟悉各種檢索工具的性質、特點和查找過程,從不同角度查找。普通法又可分為順檢法和倒檢法。
2、追溯法是利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒有檢索工具或檢索工具不全時,此法可獲得針對性很強的資料,查准率較高,查全率較差。
3、分段法是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
(7)截詞檢索是常用信息檢索方法嗎擴展閱讀
檢索原因
信息檢索是獲取知識的捷徑
美國普林斯頓大學物理系一個年輕大學生名叫約瀚·菲利普,在圖書館里借閱有關公開資料,僅用四個月時間,就畫出一張製造原子彈的設計圖。
他設計的原子彈,體積小(棒球大小)、重量輕(7.5公斤)、威力大(相當廣島原子彈3/4的威力),造價低(當時僅需兩千美元),致使一些國家(法國、巴基斯坦等)紛紛致函美國大使館,爭相購買他的設計拷貝。
二十世紀七十年代,美國核專家泰勒收到一份題為《製造核彈的方法》的報告,他被報告精湛的技術設計所吸引,驚嘆地說:「至今我看到的報告中,它是最詳細、最全面的一份。」
但使他更為驚異的是,這份報告竟出於哈佛大學經濟專業的青年學生之手,而這個四百多頁的技術報告的全部信息來源又都是從圖書館那些極為平常的、完全公開的圖書資料中所獲得的。
❽ 在計算機信息檢索系統中,常用的檢索技術主要有哪些
一、布爾邏輯檢索
1、利用布爾運算符把各個檢索詞連接在一起,組成一個邏輯檢索式,再由計算機進行相應邏輯運算,從而找出所需要信息的方法。
2、在具體檢索時,檢索功能是通過3個布爾運算符,也就是邏輯「與」(and),邏輯「或」(or)和邏輯「非」(not)來實現的。
二、截詞檢索
1、一種常用的防止漏檢從而提高查全率的檢索技術,目前的多數系統都向用戶提供截詞檢索功能。
2、所謂截詞,就是指在合適位置截斷檢索詞,再使用截詞符處理,既能減少字元數目,也可提高檢索的查全率。
(8)截詞檢索是常用信息檢索方法嗎擴展閱讀:
計算機文獻檢索的機制與手工檢索類似。計算機文獻檢索就是利用電子計算機查找文獻。文獻著錄以一定的格式輸入計算機,成為文獻記錄。
經過計算機處理,將大量的文獻記錄以一定的結構存貯在磁帶或磁碟上,生成文獻資料庫或文檔。用戶按一定的要求將檢索詞輸入計算機內,由計算機對其進行處理,並與資料庫或文檔中的文獻記錄進行匹配運算。最後將檢索結果按要求的格式輸出。計算機檢索包括存貯和檢索兩個方面。
用電子計算機和資料庫存儲、檢索文獻信息資料的系統。其組成包括計算機、資料庫、管理軟體和通信網路檢索終端,資料庫是其核心。
而這些所有的用於文獻檢索的電子計算機可以聯成一個龐大的網路,進行國內外的聯機檢索,現已發展成網路檢索系統。但僅有計算機和網路還不行,還必須依賴資料庫才能檢索到文獻信息。
❾ 什麼是信息檢索技術它主要包括哪幾種各有何檢索特點
信息檢索技術 信息檢索是指從以任何方式組成的信息集合中,查找特定用戶在特定時間和條件下所需信息的方法與過程。它主要包括: 布爾檢索,詞位檢索,截詞檢索,限制檢索。布爾檢索的特點 (1)與人們的思維習慣一致 (2)表達直觀清晰、結構化強 (3)方便擴檢和縮檢 (4)易於計算機實現