導航:首頁 > 方法技巧 > 網路檢索的方法與技巧

網路檢索的方法與技巧

發布時間:2022-01-11 02:20:21

1. 如何對網路信息資源進行檢索列舉幾種網路資源檢索的技巧

以搜索引擎為例:想好你要檢索的主題,選擇合適的搜索引擎,選擇檢索途徑,輸入檢索詞,點擊搜索,查看結果。
常見的網路信息資源檢索技巧有;
1、布爾邏輯檢索
2、鄰近檢索
3、截詞檢索(詳情請看簡答題第五題http://wenku..com/view/a2bffe4733687e21af45a9f5.html)
另外你也可以參考一下研究生smart的回答http://wenwen.soso.com/z/q193171644.htm

不清楚可以和我交流,中午和晚上有空!

2. 急急急~網路信息檢索方法與應用 論文

我給你找了一篇,摘要如下:
隨著Internet在全世界范圍內迅猛發展,網上龐大的數字化信息和人們獲取信息之間的矛盾日益突出。因此,對網路信息的檢索技術及其發展趨勢進行探討和研究,是一個既迫切而又實用的課題。本文通過對網路信息檢索的基本原理、網路信息檢索的技術及工具、網路信息檢索的現狀等方面進行分析研究,並對網路信息檢索的發展趨勢進行了預測,旨在尋找提高網路信息檢索的手段和方法的有效途徑,並最終提高網路信息的檢索效果,使得網路信息資源得到充分有效地利用。
全文主要包括六個部分,
第一部分為網路信息檢索述評,主要是闡述了網路信息檢索所涉及到的有關概念,如信息檢索技術、網路信息檢索的特點及網路信息檢索效果評價。
第二部分重點討論了網路信息檢索的基本技術。如信息推拉技術、數據挖掘技術、信息過濾技術、自然語言處理技術等等,旨在弄清網路信息檢索的技術支撐,為預測網路信息檢索的發展趨勢作下鋪墊。
第三部分對網路信息檢索的重要工具——搜索引擎進行了闡述,主要從其檢索機制入手,分析了不同種類的搜索引擎的檢索特點及功能。其獨到之處在於對搜索引擎的基本功能進行了比較全面的概括,並對目前流行的搜索引擎進行科學的分類...
第四部分分析討論了檢索技術的另一分支—基於內容的檢索技術
第五部分則分析了網路信息搜索工具的局限,主要從文本信息檢索和多媒體信息檢索兩方面進行闡述。

好不容易給轉成 .txt文本,貼在下面:
1.1網路信息資源
網路信息資源是指「通過國際Intemet可以利用的各種信息資源」的總稱。
隨著Intemet的迅速發展,網上信息資源也以指數形式增加,網路信息資源作
為一種新型的信息資源,發揮著越來越重要的作用,其內容幾乎無所不包,涉
及政治、經濟、文化、科學、娛樂等各個方面;其媒體形式多種多樣,包括文
本、圖形、圖像、聲音、視頻等;其范圍覆蓋社會科學、自然科學、人文科學
和工程技術等各個領域。
1.2信息檢索技術
信息檢索技術是現代信息社會中非常關鍵的技術之一。信息檢索是指將信
息按一定的方式組織和存儲起來,並根據信息用戶的信息需求查找所需信息的
過程和技術,所以信息檢索的全稱又叫「信息存儲與檢索」。狹義的信息檢索
僅指從信息集合中找出所需信息的過程,也就是利用信息系統檢索工具查找所
需信息的過程。人們獲取信息源的方式主要有:①遵循傳統的檢索方法在浩如
煙海的圖書館資料中,通過人工查找索引找到對應的文獻索引號再獲取文獻原
文;②聯機信息檢索。這其中也存在一個發展過程,由檢索結果來看,從提供
目錄、文摘等相關的二次信息檢索到可以直接獲得電子版的全文;由檢索方法
來看,從對特定關鍵詞或者如作者、機構等輔助信息作為檢索入口的常規檢索
到以原始文獻中任意詞檢索的全文檢索等等。其中,全文檢索由於其包含信息
的原始性、信息檢索的徹底性、所用檢索語言的自然性等特點在近年來發展比
較迅速,成為深受人們關注的一種非常有效的信息檢索技術,它是從大容量文
檔庫中精確定位所需信息的最有效手段l3]。
.3.2web信息檢索
其檢索方式有:瀏覽器方式和搜索引擎方式。
(l)瀏覽器方式(Br,singsystelns)。只要能夠進入hitemct就能夠通過瀏
覽器,利用HTTP協議提供的WV乃萬服務,瀏覽認觸b頁面和通過W匕b頁面提
供的檢索方式訪問資料庫。
(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息檢
索服務的W七b站點,它是以一定的技術和策略在intemet中搜集和發現網路信
息,並對網路信息進行理解、提取和處理,建立資料庫,同時以認倪b形式提
供一個檢索界面,供用戶輸入檢索關鍵詞、片語或短語等檢索項,代替用戶在
資料庫中查找出與提問相匹配的記錄,同時返回結果且按相關度排序輸出,從
而起到快速查找信息的目的。搜索引擎所處理的信息資源主要包括萬維網服務
器上的信息,另外還包括電子郵件和新聞組信息。搜索引擎服務的宗旨是為滿
足用戶的信息需要,所以它是面向用戶的,採用的方式是互動式的。
網路信息檢索工具採用主動提交或自動搜索兩種方法搜索數據。
1.4網路信息檢索效果評價
目前,得到普遍認同的檢索效果的評價標准主要有以下幾個:查全率、查
准率、收錄范圍、輸出格式,其中以查全率和查准率最為重要。
現代信息科學技術的發展,為人們提供了多種多樣的信息獲取和傳送方法
及技術,從「信源」與「用戶」的關系來看,可分為兩種模式:「信息推送」
模式(InformationPush),由「信源」主動將信息推送給「用戶」,如電台廣播;
「信息拉取」模式(InformationPull),由「用戶」主動從「信源」中拉取信息,
如查詢資料庫。
2.2.1信息推送技術
「推」模式網路信息服務,是基於網路環境下的一種新的服務形式,即信
息服務者在網上利用「Push」技術為特定用戶開展信息服務的方式。Push技術
之所以成為Intemet上一項新興的技術,是因為藉助該技術使網路信息服務具
有主動性,不僅可以直接把用戶感興趣的信息推送給用戶,而且可有效地利用
網路資源,提高網路吞吐率;再者,Push技術還允許用戶與提供信息的伺服器
之間透明地進行通信,極大地方便了用戶。
所謂Push技術,又稱「推送」技術、Web廣播(Webeasting)技術,實質
上是一種軟體,這種軟體可以根據用戶定義的准則,自動搜集用戶最可能發生
興趣的信息,然後在適當的時候,將其傳遞至用戶指定的「地點」。因而從技
術上看,「推」模式網路信息服務就是具有一定智能性的、可以自動提供信息
服務的一組計算機軟體,該軟體不僅能夠了解、發現用戶的興趣(可能關心的
某些主題的信息),還能夠主動從網上搜尋信息,並經過篩選、分類、排序,
然後按照每個用戶的特定要求,主動推送給用戶141。
(l)信息推送方式。信息推送方式分兩類,即網播方式和智能方式。
網播方式有:頻道式推送。頻道式網播技術是目前普遍採用的一種模式,
它將某些頁面定義為瀏覽器中的頻道,用戶可像選擇電視頻道那樣接受有興趣
的網播信息;郵件式推送,用電子郵件方式主動將所推送信息發布給各用戶,
如國際會議的通知、產品的廣告等:網頁式推送。在一個特定網頁內將所推送
信息發布給各用戶,如某企業、某組織、某個人的網頁;專用式推送。採用專
門的信息發送和接收軟體,信源將信息推送給專門用戶,如機密的點對點通信。
智能推送方式有:操作式推送(客戶推送式),由客戶數據操作啟動信息
推送。當某客戶對數據進行操作時,把修改後的新數據存入資料庫後,即啟動
信息推送過程,將新數據推送給其他客戶;觸發式推送(伺服器推送式),由
ll碩士學位論文
MASTER,5THESIS⑧
資料庫中的觸發器啟動信息推送過程,將新數據推送給其他客戶,當數據發生
變化,如出現增加(Insert)、刪除(Delete)、修改(update)操作時,觸發器
啟動信息推送過程。
(2)信息推送的特徵。信息推送的特徵有:主動性、針對性、智能性、高效
性·靈活性和綜合性I5]。
主動性。Push技術的核心就是服務方不需要客戶方的及時請求而主動地將
數據傳送到客戶方。因而,主動性是「推」模式網路信息服務最基本特徵之一。
這也是它與基於瀏覽器的「拉」(Pull)模式的被動服務的鮮明對比。
針對性(個性化)。針對性是說,Push技術可以針對用戶的特定信息需求
進行檢索、加工和推送,並根據用戶的特定信息需求為其提供個人定製的檢索
界面。
智能性。Push伺服器能夠根據用戶的要求自動搜集用戶感興趣的信息並定
期推送給用戶。甚至,Push技術中的「客戶代理(ClientAgent)」可以定期自
動對預定站點進行搜索,收集更新信息送回用戶。同時個人信息服務代理和主
題搜索代理還可為了提高「推送」的准確性,控制搜索的深度,過濾掉不必要
的信息,將認飛b站點的資源列表及其更新狀態配以客戶代理完成。因而,網
絡環境下的「推」模式信息服務具有較高的智能性。這也是傳統的定題服務
(SDI)不能比的。
高效性。高效性是網路環境下「推」模式信息服務的又一個重要特徵。Push
技術的應用可在網路空閑時啟動,有效地利用網路帶寬,比較適合傳送大數據
量的多媒體信息。
靈活性。靈活性是指用戶可以完全根據自己的方便和需要,靈活地設置連
接時間,通過E一mail、對話框、音頻、視頻等方式獲取網上特定信息資源。
綜合性。「推」模式網路信息服務的實現,不僅需要信息技術設備,而且
還依賴於搜尋軟體、分類標引軟體等多種技術的綜合[6]。
但在當前信息技術的發展階段,「推」技術還存在很大的缺陷,比如:不
能確保信息發送,沒有狀態跟蹤,缺乏群組管理功能等等。因此,國內外的研
究者們又提出超級推(BeyondPush)技術的理論。所謂超級推技術是在保留、繼
承、完善了Push的優點(主動傳遞和個性化定製),摒棄了Push的諸多缺點之
,2碩士學位論文
MASTER,5THESIS管
後而發展起來的一種新型的Push技術。它的最大特點是在於保證傳送。即所
有的信息都是在特定的時間送給特定的信息用戶,同時保持連續性的用戶資
料,隨時可以知道誰收到了信息,信息是否為該用戶定製,用戶環境是否適當
等等[刀。
2.2.2信息拉取技術
常用的、典型的信息拉取技術,如資料庫查詢,是由用戶主動查詢資料庫,
從資料庫中拉取所需信息。其主要優點是:針對性好,用戶可針對自己的需求
有目的地去查詢、搜索所需的信息。
Intemet上的信息拉取技術可以說是資料庫查詢技術的擴展和延伸。在網
絡上,用戶面對的不止是一個資料庫,而是擁有海量信息的hitemet環境,因
此,各種網路信息拉取(查詢)的輔助工具—搜索引擎應運而生了。信息推送與信息拉取兩種模式各有其特點,在實際中常常是將兩者的結合
起來,常用的結合方式為:
(1)「先推後拉」式。先及時地推送最新信息(更新的動態信息),再有針
對性地拉取所需的信息。這樣,便於用戶注意信息變化的新情況和趨勢,從而
動態地選取需要深入了解的信息。
(2)「先拉後推」式。用戶先拉取所需信息,然後根據用戶的興趣,再有針
對性地推送相關的其它信息。
(3)「推中有拉」式。在信息推送過程中,允許用戶隨時中斷、定格在所感
興趣的網頁上,作進一步的搜索,主動拉取更豐富的信息。
(4)「拉中有推」式。在用戶拉取信息的搜索過程中,根據用戶輸入的關鍵
詞,信源主動推送相關信息和最新信息。這樣既可以及時地、有針對性時為用
戶服務,又可以減輕網路的負擔,並便於擴大用戶范圍[8]。
因此,信息推送與信息拉取相結合是當前Intemet、資料庫系統及其它信
息系統為用戶提供主動信息服務的一個發展方向。
2.3Web挖掘技術
隨著功temet的發展,W己b已經成為人類社會的公共信息源。在hitemet
給人類帶來前所未有的信息機遇的同時,又使得人類的信息環境更加復雜,人碩士學位論文
MASTER,5THESIS⑧
類如何利用信息的問題非但沒有如預想的通過信息技術的發展得到圓滿的解
決,相反,隨著信息技術的發展,信息量的激增,造成了個人實際所需信息量
與研觸b上的海量信息之間的矛盾,因而也就造成了個人利用信息的困難。在
這種情況下,雖然出現了叭范b環境下的專門檢索工具,但是由於搜索引擎是
由傳統檢索技術發展而來,在當前用戶要求不斷提高的情況下,傳統的搜索技
術己經不能夠滿足人們的需要。為了更加有效地利用網路信息資源,W七b挖掘
作為新的知識挖掘的手段,為Web信息的利用提出了新的解決方案叨。
2.3,1姍eb挖掘的內容
數據挖掘就是從大量的、不完全的、有雜訊的、模糊的、隨機的數據中,
提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
Web挖掘則是從WWW及其相關的資源和行為中抽取有用的模式和隱含信息。其
中WWW及其相關資源是指存在於WWW之上的Web文檔及Web伺服器上的日誌文
件以及用戶資料,從Web挖掘的概念中應當看出Web挖掘在本質上是一種知識
發現的手段,它主要從下面3個方面進行仁時。
(1)Web內容挖掘。W七b內容挖掘是從W匕b數據中抽取知識,以實現Web
資源的自動檢索,提高web數據的利用效率。隨著Intemet的進一步延伸,Web
數據越來越龐大,種類越來越繁多,數據的形式既有文本數據信息,也有圖像、
聲音、視頻等多媒體數據信息,既有來自於資料庫的結構化數據,也有用HTML
標記的半結構化數據及非結構化的自由文本數據信息。因而,對W己b內容信
息挖掘主要從下面兩個角度進行〔」]。
一是從信息檢索的角度,主要研究如何處理文本格式和超級鏈接文檔,這
些數據是非結構化或半結構化的。處理非結構化數據時,一般採用詞集方法,
用一組組詞條來表示非結構化的文本,先用信息評價技術對文本進行預處理,
然後採取相應的模型進行表示。另外,還可以用最大字序列長度、劃分段落、
概念分類、機器學習和自然語言統計等方法來表示文本。處理半結構化數據時,
可以利用一些相關演算法給超級鏈接分類,尋求認七b頁面關系,抽取規則。同
處理非結構化數據相比,由於半結構化數據增加了HTM毛標記信息及Web文
檔內部超鏈結構,使得表示半結構化數據的方法更加豐富。
二是從資料庫的角度,主要處理結構化的W匕b資料庫,也就是超級鏈接
14⑧蕊譽蕊
文檔,數據多採用帶權圖或者對象嵌入模型(OME),或者關系資料庫表示,
應用一定的演算法,尋找出網站頁面之間的內在聯系,其主要目的是推導出Web
站點結構或者把W匕b變成一個資料庫,以便進行更好的信息管理和查詢。數
據庫管理一般分成三個方面:一是模型化,研究認觸b上的高級查詢語言,使
其不局限於關鍵字查詢;二是信息的集成與抽取,把每個W七b站點及其包裝
程序看成是一個認范b數據源,通過W七b數據倉庫(data~house)或虛擬W七b資料庫實現多種數據來源的集成;三是叭幾b站點的創建與重構,通過研
究web上的查詢語言來實現建立並維護web站點的途徑[「]。
(2)札b結構挖掘。W匕b結構挖掘,主要指的是通過對W七b文檔的分析,從
文檔之間的組織結構獲取有用的模式。W匕b內容挖掘研究的是文檔內的關系,
W七b結構挖掘關注的則是網站中的超級鏈接結構之間的關系,找到隱藏在一個
個頁面之後的鏈接結構模型,可以用這個模型對W七b頁面重新分類,也可以
用於尋找相似的網站。
W七b結構挖掘處理的數據類型為W七b結構化的數據。結構化數據是描述
網頁內容組織方式的數據,頁內結構可以用超文本標記語言等表示成樹型結
構,此外頁間結構還可以用連接不同網頁的超鏈結構表示。文檔間的鏈接反映
了文檔信息間的某種聯系,如隸屬平行關系、引用與被引用關系等。對W七b
頁面的超級鏈接進行分類,可以判斷與識別頁面信息間的屬性關系。由於Web
頁面內部存在或多或少的結構信息,通過研究W亡b頁面內部結構,可尋找出
與用戶選定的頁面集合信息相關的其它頁面信息模式,以檢測W己b站點所展
示的信息完整程度。
③Web行為挖掘。所謂W己b用戶行為挖掘主要是通過對認尼b伺服器的日
志文件以及用戶信息的分析,從而獲得有關用戶的有用模式。W七b行為挖掘的
數據信息主要指網路日誌中包括的用戶行為模式,它包括檢索時間、檢索詞、
檢索路徑、檢索結果以及對哪些檢索結果進行了瀏覽。由於W七b自身的異質、
分布、動態、無統一結構等特點,使得在認七b網上進行內容挖掘比較困難,
它需要在人工智慧和自然語言理解等方面有所突破。所幸的是基於W七b服務
器的109日誌存在著完整的結構,當信息用戶訪問web站點時,與訪問相關的
頁面、時間、用戶ro等信息,日誌中都作了相應的記錄,因而對其進行信息
l5碩士學位論文
MASTER,5THESIS⑥
挖掘是可行的,也是有意義的。在技術實踐過程中,一般先把日誌中的數據映
射成諸種關系信息,並對其進行預處理,包括清除與挖掘不相關的信息等。為
了提高性能,目前對109日誌數據信息挖掘採用的方法有路徑分析、關聯規則、
模式發現、聚類分析等。為了提高精確度,行為挖掘也應用到站點結構信息和
頁面內容信息等方面。
2.3.2web挖掘技術在網路信息檢索中的應用
(l)Web內容挖掘在檢索中的應用。W匕b內容挖掘是指從文檔內容及其描述
中獲取知識的過程,由於用傳統的信息檢索技術對W己b文檔的處理不夠深入,
因此,可以利用叭觸b內容挖掘技術來對網路信息檢索中的W己b文檔處理部分
進行進一步的完善,具體而言表現在以下幾個方面。
①文本總結技術。文本總結技術是指從文檔中抽取出關鍵信息,然後以簡
潔的形式對W匕b文檔的信息進行摘要或表示。這樣用戶通過瀏覽這些關鍵信
息,就可以對W七b網頁的信息有大致的了解,決定其相關性並對其進行取捨。
②文本分類技術。W匕b內容挖掘中的文本分類指的是按照預先定義的主題
類別,利用計算機自動為文檔集合中的每一個文檔進行分類。分類在網路信息
檢索中的價值在於可以縮小檢索范圍,大大提高查准率。目前,己經出現了很
多文本分類技術,如TFIFF演算法等,由於文本挖掘與搜索引擎所處理的文本幾
乎完全一樣,所以可以直接將文本分類技術應用於搜索引擎的自動分類之中,
通過對大量頁面自動、快速、有效的分類,來提高文檔檢索的查准率。
③文本聚類技術。文本聚類與文本分類的過程J險洽相反,文本聚類指的是
將文檔集合中的文檔分為更小的簇,要求同一簇內的文檔之間的相似性盡可能
大,而簇與簇之間的關系盡可能小,這些簇相當於分類表中的類目。文本聚類
技術不需要預先定義好的主題類別,從而使得搜索引擎的類目能夠與所收集的
信息相適應。文本聚類技術與人工分類相比,它的分類更加迅速、客觀。同時,
文本聚類可與文本分類技術相結合,使得信息處理更加方便。可以對檢索結果
進行分類,並將相似的結果集中在一起。
(2)Web結構挖掘在網路信息檢索中的應用。W匕b的信息組織方式採用了一
種非平面結構,一般來說W己b的信息組織方式是根據內容來進行組織的。但
是由於W匕b的這些結構信息比較難以處理,所以搜索引擎一般不處理這些信
16碩士學位論文
MASTER,S竹正515⑧
息,而是將叭觸b頁面作為平面機構的文本進行處理。但是,在從觸b結構挖掘
中,通過對研觸b文檔組織結構的挖掘,搜索引擎可以進一步擴展搜索引擎的
檢索能力,改善檢索效果〔3]。
(3)脆b行為挖掘在網路信息檢索中的應用。認觸b行為挖掘是一種通過挖掘
總結出用戶的檢索行為的模式。用戶的檢索行為一直是信息檢索中重要的研究
內容,通過研觸b行為挖掘,不僅可以發現多數用戶潛在共同的行為模式,而
且還可以發現單個用戶的個性化行為,對這些模式進行研究,可以更好地對搜
索引擎的檢索效果進行反饋,以便進一步改進搜索策略,提高檢索效果。
2.3.3web挖掘技術的局限及方向
(1)孔b內容挖掘。W七b上的數據不管是用HTML還是XML標記語言表示,
都不能完全解決W七b數據的非結構性問題,特別是漢語句子格式繁多,虛詞、
實詞沒有絕對的界限,切分詞難度大,這些是造成無法對數據進行完全自動標
引的根本性問題,因此,從七b內容挖掘技術有必要結合數據倉庫等信息技術進
行信息存儲,並最終實現智能化、自動化的數據表示和標引,以供搜索之用。
通常數據的表示和數據的利用形式是相互關聯的,因此,設計相應的具有高查
全率和查准率的挖掘演算法也和數據表示一樣是未來的方向之一。另外多媒體數
據如何進行識別分類標引,這也是未來的研幾b內容挖掘研究的難點和方向。
(2)梅b結構數據挖掘。隨著Intemet的迅猛發展,網站的內容也越來越豐
富,結構也越來越龐雜,用有向圖表示巨型網站鏈接結構將不能滿足數據處理
的需要,需要設計新的數據結構來表示網站結構。
由於用來作對比分析發現問題所在的用戶使用信息只有日誌流,那麼,對
用戶使用日誌流中每一鏈接關系如何識別、採用什麼結構表示、如何抽取有用
的模式等等,不僅是認飛b行為挖掘的重要研究內容也是網站結構挖掘的重要
研究方向之一。
(3),eb用戶行為挖掘。由於Iniemet傳輸協議HTTP的無狀態性,客戶端、
代理伺服器端緩存的存在,使用戶訪問日誌分別存在於伺服器、代理伺服器和
客戶端,因此,從W七b用戶訪問日誌中研究用戶訪問規律最大的難點在於如
何把分布於不同位置的訪問日誌經過預處理,形成一個個用戶一次的訪問期
間。通常來講,對於靜態W七b網站,伺服器端的日誌容易取得,客戶端和代
l7理伺服器用戶訪問日誌不容易取得;其次,由於一個完整的W匕b是由一個個
圖片和框架頁面組成的,而用戶訪問伺服器也有並發性,在確定用戶訪問內容
時,必須從伺服器日誌中甄選出某個用戶實際請求的頁面和頁面的主要內容。
另外,由於目前已經有的數據挖掘演算法主要是在大量交易數據基礎上發展起來
的,在處理海量Web用戶訪問日誌中也需要重新設計演算法結構〔41。
2.4信息過濾技術
hitemet開放式的環境,為人們檢索和利用信息提供了極大的方便,但同
時,網路環境也為人們及時准確地檢索到所需信息帶來了麻煩。這是因為,第
一,網路環境中信息的來源復雜多樣,隨意性大,任何人、任何單位不管其背
景和動機如何都可以在網路上發布信息,信息的產生和傳播沒有經過篩選和審
定,因此信息的可靠性、質量和價值成為用戶普遍擔心的一大問題;第二,目
前大多數據搜索工具的檢索范圍是綜合性的,它們的Robots盡可能地把各種
網頁抓回來,經過簡單加工後存放在資料庫中備檢;第三,搜索引擎直接提供
給用戶的檢索途徑大都是基於關鍵詞的布爾邏輯匹配,返回給用戶的就是所有
包括關鍵詞的文獻,這樣的檢索結果在數量上遠遠超出了用戶的吸收和使用能
力,讓人感到束手無策。這就是人們經常談論的「信息過載」、「信息超載」現
象。信息過濾技術就是在這樣的背景下開始受到人們的重視,它的目的就是讓
搜索引擎具有更多的「智力」,讓搜索引擎能夠更加深入、更加細致地參與到
用戶的整個檢索過程中,從關鍵詞的選擇、檢索范圍的確定到檢索結果的精煉,
幫助用戶在浩如煙海的信息中找到和需求真正相關的資料。
2.4.1信息過濾模型
信息過濾其實質仍是一種信息檢索技術,因此它仍依託於某一信息檢索模
型,不同的檢索模型有不同的過濾方法。51。
(1)利用布爾邏輯模型進行過濾。布爾模型是一種簡單的檢索模型。在檢索
中,它以文獻中是否包含關鍵詞來作為取捨標准,因此,它不需要對網頁數據
進行深度的加工。最簡單的關鍵詞表可以設計成只有三個欄位:關鍵詞、包括
關鍵詞的文獻號、關鍵詞在相應文獻中出現的次數。檢索時,用戶提交關鍵詞。

3. 1.常見的網路信息檢索的方法有哪些

還叫我回答 你干什麼吃的 度娘

4. 網路信息檢索方法可以歸納成哪三種

網路信息檢索方法可以歸納成目錄檢索、關鍵詞檢索、基於關鍵詞模糊檢索三種。

5. 網路信息檢索的策略與技巧

網路信息檢索策略設計應遵循快、准、全及低成本的原則,以實現檢索策略最優化。1、明確檢索目標,確定檢索項分析主題、使用布爾邏輯算符等構造檢索式2、選擇合適的檢索系統根據檢索主題和檢索系統的特點選擇檢索系統3、正確對待檢索結果對漏檢、錯檢、溢檢、無檢索結果的處理方式。4、選擇最佳上網時間選擇網速較快的時間段。 多數情況下,有一個好的搜索策略,能正確地應用布爾邏輯符,並熟悉每個搜索引擎的特性,就可得到一個好的檢索結果。除此之外,在某些情況下還可用其他的一些技巧來改善檢索結果。1、擴大檢索范圍、提高查全率2、縮小檢索范圍、提高查准率3、Ctrl十F
用搜索引擎檢索到所需文檔並連接到相關網頁後,有時會發現所要的文件並沒有出現在當前視野中,這可能是因為文件存放在當前網頁的底部。一個快捷的方法就是按「Ctrl十F」在當前頁查找文件。4、給檢索結果作標簽避免再重復出現。

6. 網路信息檢索的方法有哪些分析這些方法的差異性及其各自的優勢

網路信息檢索方法主要有以下四種:1、漫遊法2、直接查找法3、搜索引擎法4、網路資源指南法1.漫遊法
(1)偶然發現。這是在網際網路上發現、檢索信息的原始方法。即在日常的網路閱讀、漫遊過程中,意外發現一些有用信息。這種方式的目的性不是很強,具不可預見性和偶然性。
(2)順「鏈」而行。指用戶在閱讀超文本文檔時,利用文檔中的鏈接從一網頁轉向另一相關網頁。此方法類似於傳統手工檢索中的「追溯檢索」,即根據文獻後所附的參考文獻追溯查找相關的文獻,從而不斷擴大檢索范圍。這種方法可能在較短的時間內檢出大量相關信息,也可能偏離檢索目標而一無所獲。
2.直接查找法
直接查找法是已經知道要查找的信息可能存在的地址,而直接在瀏覽器的地址欄中輸入其網址進行瀏覽查找的方法。此方法適合於經常上網漫遊的用戶。其優點是節省時間、目的性強、節省費用,缺點是信息量少。
3.搜索引穆檢索法
此方法是最為常規、普遍的網路信息檢索方法。搜索引擎是提供給用戶進行關鍵詞、片語或自然語言檢索的工具。用戶提出檢索要求,搜索引擎代替用戶在資料庫中進行檢索,並將檢索結果提供給用戶。它一般支持布爾檢索、片語檢索、截詞檢索、欄位檢索等功能。利用搜索引擎進行檢索的優點是:省時省力,簡單方便,檢索速度快、范圍廣,能及時獲取新增信息。其缺點是:由於採用計算機軟體自動進行信息的加工、處理,且檢索軟體的智能性不很高,造成檢索的准確性不是很理想,與人們的檢索需求及對檢索效率的期望有一定差距。 4.網路資源指南檢索法
此方法是利用網路資源指南進行查找相關信息的方法。
網路資源指南類似於傳統的文獻檢索工具————書目之書目(bibliography of bibliographies),或專題書目,國外有人稱之為web of webs,webliographies,其目的是可實現對網路信息資源的智能性查找。它們通常由專業人員在對網路信息資源進行鑒別、選擇、評價、組織的基礎上編制而成,對於有目的的網路信息檢索具有重要的指導作用。其局限性在於:由於其管理、維護跟不上網路信息的增長速度,使得其收錄范圍不夠全面,新穎性、及時性不夠強,且用戶還要受標引者分類思想的限制。參考資料:過仕明主編. 信息檢索概論. 黑龍江科學技術出版社, 2005.10

7. 搜索引擎的搜索方法有哪些,各有什麼特點

大致可分為四種:全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎。

1、全文搜索引擎

一般網路用戶適用於全文搜索引擎。這種搜索方式方便、簡捷,並容易獲得所有相關信息。但搜索到的信息過於龐雜,因此用戶需要逐一瀏覽並甄別出所需信息。尤其在用戶沒有明確檢索意圖情況下,這種搜索方式非常有效。

2、元搜索引擎

元搜索引擎適用於廣泛、准確地收集信息。不同的全文搜索引擎由於其性能和信息反饋能力差異,導致其各有利弊。元搜索引擎的出現恰恰解決了這個問題,有利於各基本搜索引擎間的優勢互補。而且本搜索方式有利於對基本搜索方式進行全局控制,引導全文搜索引擎的持續改善。

3、垂直搜索引擎

垂直搜索引擎適用於有明確搜索意圖情況下進行檢索。例如,用戶購買機票、火車票、汽車票時,或想要瀏覽網路視頻資源時,都可以直接選用行業內專用搜索引擎,以准確、迅速獲得相關信息。

4、目錄搜索引擎

目錄搜索引擎是網站內部常用的檢索方式。本搜索方式旨在對網站內信息整合處理並分目錄呈現給用戶,但其缺點在於用戶需預先了解本網站的內容,並熟悉其主要模塊構成。總而觀之,目錄搜索方式的適應范圍非常有限,且需要較高的人工成本來支持維護。



(7)網路檢索的方法與技巧擴展閱讀

搜索引擎的行業應用分為如下幾種形式:

1、 政府機關行業應用

實時跟蹤、採集與業務工作相關的信息來源。全面滿足內部工作人員對互聯網信息的全局觀測需求。及時解決政務外網、政務內網的信息源問題,實現動態發布。快速解決政府主網站對各地級子網站的信息獲取需求。

全面整合信息,實現政府內部跨地區、跨部門的信息資源共享與有效溝通。節約信息採集的人力、物力、時間,提高辦公效率。

2、企業行業應用

實時准確地監控、追蹤競爭對手動態,是企業獲取競爭情報的利器。及時獲取競爭對手的公開信息以便研究同行業的發展與市場需求。為企業決策部門和管理層提供便捷、多途徑的企業戰略決策工具。大幅度地提高企業獲取、利用情報的效率,節省情報信息收集、存儲、挖掘的相關費用,是提高企業核心競爭力的關鍵。

提高企業整體分析研究能力、市場快速反應能力,建立起以知識管理為核心的競爭情報數據倉庫,是提高企業核心競爭力的神經中樞。

3、新聞媒體行業應用

快速准確地自動跟蹤、採集數千家網路媒體信息,擴大新聞線索,提高採集速度。支持每天對數萬條新聞進行有效抓取。監控范圍的深度、廣度可以自行設定。支持對所需內容智能提取、審核。實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。

4、 行業網站應用

實時跟蹤、採集與網站相關的信息來源。及時跟蹤行業的信息來源網站,自動,快速更新網站信息。動態更新信息。實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。針對商務網站提出商務管理模式,大大提高行業網站的商務應用需求。

針對資訊網站分類目錄生成,提出用戶生成網站分類結構。並可以實時增加與更新分類結構。不受級數限制。從而大大利高行業的應用性。提供與CCDC呼叫搜索引擎的廣告合作。建立行業網站聯盟,提高行業網站知名度。

5、網路信息監察與監控

網路輿情系統。網站信息與內容監察與監控系統。

8. 如何掌握網上搜索信息的方法和技巧

搜了篇好貼子推薦看看哦:)

網路編輯的任務是收集和整理資料,發表電子版的新聞。並能以統籌的眼光分析網站,對網站進行全面的優化。提升網站的排名和流量,提高網站的整體水平、知名度和品牌效應。同時也要采編有利於提高網站水平的新聞,舉辦活動,網上網下互動,切實增加網路公司的收益。

有不少同行的兄弟們每天問我這個問題.今日就將自己的一些心得和大家共享。

網編這個職業的前景是不容置疑的。全國70萬家網站,需要的網路編輯300萬人以上。從國家的政策導向(國家的戰略是信息化)和市場的經濟導向(風險投資大規模湧入網路業)來說,互聯網是絕對的朝陽產業,網路編輯是絕對的黃金職業。

如何做一個好網編?如何靠這個職業養家糊口?如何掙得優厚薪水發展自己?如何在這個職業里實現自我價值?我們應該從職業生涯整體規劃的角度來看待這個問題。

新聞-編輯-推廣-策劃-運營,就是我認為的網編職業生涯發展路線。

在中國第一批網路編輯教材里,我們所學到的知識有70%的比重是新聞編輯;20%是社區管理;10%是網頁製作技術。從實際應用的情形看,新聞那一塊兒知識放在5年前綜合門戶時代還能湊合用,現在我不得不提醒你們,在網路飛速發展的2006年,它顯然已經遠遠落後了;對於第二塊兒知識,社區與互動,在社區概念空前強大的web2.0時代,那些常識只能算入門級的ABC;對於網頁技術那一塊兒,這點值得贊同,不會四大軟體(三劍客Deamweaver、Flash、Fireworks加Photoshop),就不是一個好網編。在實際工作當中,你不得不面對和技術部門扯皮的難題,會軟體,就不會被那些小子蒙了你。

但僅有這個還不夠。在我看來,會軟體、懂一些應用技術,只是擁有了武器,是硬功夫;除了硬功夫,你還需要「深厚的內力」,這個內功就是以上的五個台階。

我認為,一個真正的好網編,必須是內外兼修的。

1.新聞
關於網路編輯,只是復制粘貼的尷尬,網路搬運工的無奈,大量此類帖子充斥於網路之間,令人沮喪。但切不可因此瞧不起這個最基本的「復制粘貼」。人的知識結構的建立,就像蓋一座大廈,一磚一壘慢慢堆積,才可見到大廈全貌。沒有這個最基本的壘磚頭的過程,你是無法領略到做新聞的真諦的。你的新聞粘貼的多了,你就知道哪些是好新聞,哪些是垃圾新聞,哪些新聞可以成系列,哪些新聞可以追蹤粘貼,哪些新聞沒有報在點子上,你是否考慮用一個更好的標題替換它。倘若你覺得這些新聞對某一事件的表露還意猶未盡,你不妨大膽地進行幾條新聞的整合。當你覺得某一事件確實影響重大,那麼你就應該考慮作個專題出來了,把事情的來龍去脈梳理一遍。到這個地步,你就已經學會新聞的加工、組織乃至創新了。

從來沒有人要你每天不加思考的復制粘貼。我們的網編教材師傅彭蘭女士早寫過一篇文章:粘貼——加工——組織——解讀是網路新聞的四個層次。低手只能看到第一層,而高手則能看到後幾層。

互聯網技術每天都在更新,一些很好的技術已經可以讓你不必費力地去找新聞。例如RSS,例如網路和Google,例如網摘,你只需做一下定製,新聞會主動送到你面前。

如果你做新聞,沒有做到能策劃專題的能力,那麼,你這個新聞編輯是不合格的。

彭蘭的博客:http://www.zijin.net/blog/blog.asp?name=plan。

如何做一個新聞編輯,彭蘭老師絕對會給你高手級的指導,多看看吧!

2.編輯

由於政策的原因,國內大多數商業網站目前還不具備自采新聞的權利。這意味著70%的網站的內容編輯需要培養這樣一種意識:整合。

互聯網上的大多新聞處在信息的「整合」階段,信息「整合」對於目前的網路編輯來講是一個較為經濟的做法。 信息整合看似很簡單,實際上學問最大。說的淺一點包括形式上的組織與內容上的組織,即進行合理的界面設計,合理的新聞欄目與專題的策劃,一方面對現在的新聞進行整合,一方面爭取獨創性。從長遠來看,「原創」必然是趨勢。即使你暫時做不到原創,也要利用評論、深度報道等盡量向原創方面靠攏,收集專業人士的觀點文章,突出自己的原創特色。

說的深一點,你要明白分類與聚合是怎麼回事兒。Web1.0的時代,網站少,都是大一統,看著就新鮮,也捉摸不出個門道來;web2.0時代,分類與聚合的應用無處不在,才真正品出點互聯網的味道來。

像265、hao123隻是應用了最基本的分類導航技術,就已經聲明赫赫了;58同城、51city、客齊集和趕集網則是典型的分類信息網站,他們分別獲得了IDG、軟銀等國際VC巨頭的青睞;更高的是分眾傳媒與聚眾傳媒,身價可達數十億美元,已經把分類與聚合的精神發揮的淋漓盡致;當然頂級的應用當屬搜索引擎了,搜索引擎是典型的聚合思維的體現,網路、google現在我們誰還能離開它們呢?

所以我說,誰要不會用搜索引擎來做工作,誰就不適合在互聯網發展;誰的搜索引擎要是玩兒的不精,誰就不是一個好網編。

關於此類的知識,推薦你們上兩個網站做日常補習吧:

方興東的TNT論壇:http://bbs.chinalabs.com/index.asp

劉韌的Donews::http://www.donews.com/

在此我想提醒諸位同仁,分類之後專業化,選擇某一個知識類別,選准某個領域或者某個頻道來做,財經、IT、游戲體育或者教育,進入你的細分市場,一直做下去。只有這樣,你的知識才會積累,才能看到大廈的全貌。那種做綜合新聞,在不同專業的網站之間跳來跳去的人,是目光短淺的。

對於聚合,一定要記住這個詞——keyword 。

目前所有的搜索引擎的奧秘,所有的專題,所有的網路推廣,所有的相互鏈接,所有的Tag,無不依賴於它。關鍵詞,就是我們打開阿拉伯山洞的神秘之鑰。網路上的信息不是太少了,而是太多了,而聚合不過是選擇你需要的,選擇同一類的,讓萬物各歸其類。

3.推廣

這一點我們的教材上沒有教過我們。我不得不再次提醒你們,網路營銷與推廣,必學。

因為我們面對的是海量信息的web2.0時代,因為我們面對的是搜索引擎成熟的時代,因為我們面對的是70萬家網站的時代。供過於求的市場,需要營銷;品牌的建立,需要推廣,網站要做大,需要流量,需要更多的眼球。而網路,是典型的注意力經濟。別告訴我你還不懂SEO,別告訴我們你還不知道計算PV,也別說你的瀏覽器里沒有alexa,還有病毒營銷,六度理論,流量置換,軟文,廣告聯盟……

類似於E時代營銷http://www.emarketer.cn/和新競爭力http://www.jingzhengli.cn/ 這樣的網站,如果你不知道幾個,你該汗了。

但首先,我建議你安裝一個alexa工具條,然後向google發出Google Analytics發出申請,或者找幾個類似於http://www.1tong.com.cn/ 的流量統計網站,這樣你就可以知道你的網站訪問來源於哪裡,誰在登陸你的網站,他們停留了多久,他們對哪些內容感興趣,你做推廣,就有的放矢了。

4.策劃

網編做久了,往往會陞官。當你升到一定的職位,上司就會扔出這樣的任務給你:

我們計劃改版,你拿出個方案來;

我們准備新增個博客頻道,你拿出個方案來;

我們要改變我們的首頁,你看怎麼改,把欄目擴展一倍,行不行?

諸如此類的問題,會不斷挑戰你的信心底線。這時候,你就要有信心也有能力來搞策劃。

這方面的知識沒有人教你,全憑你在工作中琢磨,全看你是否有快速學習的能力,迅速反映的能力。什麼,你做不來?看看19歲就給首富講課的那個故事吧。沒有人天生什麼都會,在網路時代,需要每個人都變成特種兵,快速反應,快速機動,適應各種復雜「地形」。網路沒有樊籬,沒有程式,一切都是可變的,一切都可以創新。你是否會讓自己在閑暇時刻泡泡論壇,是否會在別人看電視的時候寫寫blog,正是這些非主流的因素決定了你的策劃能力。

不過首先你要明白,策劃一定是要圍著贏利模式轉的。我見過不少做網路的人每天都在推翻了舊想法重來的傢伙,但就是不往賺錢上面靠。你不賺錢,你的網站不贏利,你要它來干什麼?網路有網路的游戲規則,你要賺錢,就得拿出人們願意買的好東西,這個規則像大棒,會把「為客戶提供好的服務,好的內容,為用戶創造價值」等觀念砸進你的腦袋,讓你真正踏實起來。

其次你還要有個分類導航網,例如教育網站集錦之類的,這可以確保你熟知你所在的網路領域有哪些網站,人家是怎麼做的,你是效仿他們,還是進行差異化競爭?你是否能融合最新的web2.0的東西,能否讓你的網站頻道相互關聯,能否推出一套積分制,能否實施VIP 會員制,能否引入虛擬幣系統……當你做策劃的時候,你會發現,網路越來越像個大社區,我們在這里了解資訊,在這里娛樂,在這里學習,在這里交友,在這里療傷,還在這里購物,消費甚至尋找愛情。你不妨想像現實里的社區,你的網站是否提供影碟租賃店、醫院、圖書館、超市或者銀行,等等,沒有,即要考慮是否搬到網站上去。

網路不過是現實社區的一個虛擬版,你工作在這里,你生活在這里,你會越來越發現你的工作和生活在合二為一,到你分不清現實與虛擬之間的距離時,你的策劃靈感就會源源不斷而來。

5.運營

我們做網編,都會有一個終級目標,這個終極目標是什麼呢?國家的職業指導政策給出的答案是CIO——信息總監或者信息規劃師。現在回過頭來看看我們的職業生涯規劃之路:新聞編輯——內容編輯——頻道編輯——內容總監——信息總監,這條路在我看來很清晰,但走到底並不容易。

在新聞編輯階段,你是兵;在頻道編輯階段,你是將;在信息總監階段,你是統帥,是指揮官。整個網站從無到有,上百萬條信息,幾十個頻道,也許都要你一手策劃。你要研究宏觀經濟政策,你要研究風險投資市場,傳媒業的變遷,整個教育或者網游市場規模與贏利預期……ERP、CRM、SCM、KM、EC……人力資源問題,管理問題,財務問題,協調問題……甚至與投資者打交道,進行路演、談判,這些你都要擅長。

看看今天的陳彤、李善友們,你就知道了,做總監是不容易的。你可能在五年內不會過一天好日子。

當然,在那個時候,你會獲得巨大的成就感。人類生命里的榮譽感會推著你前進,你也許會像馬雲和陳一舟、周雲帆們鑄就一種傳奇。但誰會在意你背後的辛酸呢?

也許你不想這么累,那麼還是讓我們從一開始做起,回到我們的復制粘貼,或到我們的起點

9. 網路 搜索方法

准確地使用網頁搜索,首先要選擇一個搜索引擎,建議你用
www..com
查詢時,輸入你想要查詢的內容,選擇
例如:想知道北京到廣州的火車的車次和時間,可以有多種輸入方法
輸入:(北京到廣州車次)(北京列車時刻表)等,出來結果後,可以在使用它的另一個功能:在此搜索結果內再次搜索),可以更詳細的搜索你所需要的信息。

建議查詢時輸入的越接近你想知道的情況越能准確找到你需要的信息,不然,找了
許多,還要再次檢索。

如果你使用www..com搜索,它有一個分類搜索,可以從目前找到內容裡面再次
分類搜索,挺方便的。

看看網路的幫助,裡面有一些搜索的技巧。

10. 常用的信息檢索方法有哪些

信息檢索方法包括:普通法、追溯法和分段法。

1、普通法是利用書目、文摘、索引等檢索工具進行文獻資料查找的方法。運用這種方法的關鍵在於熟悉各種檢索工具的性質、特點和查找過程,從不同角度查找。普通法又可分為順檢法和倒檢法。

2、追溯法是利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒有檢索工具或檢索工具不全時,此法可獲得針對性很強的資料,查准率較高,查全率較差。

3、分段法是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。

(10)網路檢索的方法與技巧擴展閱讀

檢索原因

信息檢索是獲取知識的捷徑

美國普林斯頓大學物理系一個年輕大學生名叫約瀚·菲利普,在圖書館里借閱有關公開資料,僅用四個月時間,就畫出一張製造原子彈的設計圖。

他設計的原子彈,體積小(棒球大小)、重量輕(7.5公斤)、威力大(相當廣島原子彈3/4的威力),造價低(當時僅需兩千美元),致使一些國家(法國、巴基斯坦等)紛紛致函美國大使館,爭相購買他的設計拷貝。

二十世紀七十年代,美國核專家泰勒收到一份題為《製造核彈的方法》的報告,他被報告精湛的技術設計所吸引,驚嘆地說:「至今我看到的報告中,它是最詳細、最全面的一份。」

但使他更為驚異的是,這份報告竟出於哈佛大學經濟專業的青年學生之手,而這個四百多頁的技術報告的全部信息來源又都是從圖書館那些極為平常的、完全公開的圖書資料中所獲得的。



閱讀全文

與網路檢索的方法與技巧相關的資料

熱點內容
中醫治療白點病的方法 瀏覽:275
風水坐向問題及解決方法 瀏覽:81
並聯電阻相加的計算方法 瀏覽:653
冷搭接屬於什麼連接方法 瀏覽:679
拯救者電腦快捷鍵設置方法 瀏覽:39
熟醬肘子快速解凍方法 瀏覽:923
金太陽使用方法 瀏覽:228
6加6等於幾的方法視頻 瀏覽:478
電火花檢測方法 瀏覽:388
快速別針使用方法 瀏覽:701
分析方法研究rsd回收率 瀏覽:529
德育方法和教學方法各自描述的關鍵詞 瀏覽:634
自製電動黑板擦方法步驟 瀏覽:158
真假麻將鑒別方法 瀏覽:81
大拇指僵硬鍛煉方法 瀏覽:9
電池的長度用卡尺測量方法 瀏覽:279
新手明日之後賺金條的簡單方法 瀏覽:731
如何做涼皮不粘鍋的方法 瀏覽:33
因素分析法包括哪兩種方法 瀏覽:365
金元寶造型步驟方法 瀏覽:583