⑴ 文獻計量學方法有哪些類型簡單列舉並作適當介紹
文獻計量學是指用數學和統計學的方法,定量地分析一切知識載體的交叉科學。它是集數學、統計學、文獻學為一體,注重量化的綜合性知識體系。
⑵ 文獻計量學與國內外地學期刊統計分析
1.文獻計量學的理論
中國早在數年前就提出「科教興國」的戰略口號,鄧小平同志也說「科技是第一生產力」,江澤民同志「三個代表」重要思想更是強調「共產黨人必須是先進文化的代表」,而學術期刊是科技及先進文化的載體,面對世界經濟日趨一體化的趨勢,面對信息通訊技術及信息處理現代化方式日臻完善的今天,作為載體的學術期刊就應先行一步,高瞻遠矚這是形勢使然。
科學技術研究的最終結果主要表現在發表科技論文、科技成果獲獎和取得社會與經濟效益三個方面。科技論文一般指在專業學術刊物上公開發表、具有一定學術水平的研究性論文,它是科技活動和科技成果的主要表現形式,是科學研究最直接產出形式之一。科技論文的數量和質量,一定程度上反映了科學研究的成果和效率,特別是論文的水平,是評價一個國家、一個單位以及科研人員科技能力和水平的一項重要指標。通過對科技論文的定量分析進而對科技產出能力和科技水平進行整體評價,國內外管理人員進行了許多有益的研究和嘗試,如利用模糊數學模型分析等方法。其中,文獻計量學分析方法是近年來廣泛應用的定量分析方法之一。
文獻計量學是一門新興學科。它從定量的角度出發,採用數學、統計學等計量方法,通過對文獻特徵的統計分析,來研究文獻體系的分布、結構、數量關系和定量管理,進而探討文獻的變化規律和科學管理。近幾年來,文獻計量學的研究成果被廣泛應用於情報學以外的科學技術領域中,其中一個重要方面就是將文獻計量學指標用於科學技術生產效率的評價,使決策者可以對科技研究進行有效的定量化管理。簡單的文獻計量學指標,例如出版著作數、發表論文數、被引用次數等等,已經被廣泛應用於部門中作為考核、獎懲、晉升職工的評估依據。這些簡單指標的組合,就可以評價大學、研究所、工業公司以至整個國家的科技水平與影響能力。在近10年中,文獻計量學得到了很大的發展,取得了許多成果,各方面更趨成熟,研究層次更趨深入,定量化描述的手段與方法也日益改善。同時尋求更系統全面的數據集合,更現代化的文獻數據處理手段,最終有效地指導文獻情報工作。
近幾年來,文獻計量學的應用范圍不斷拓寬,應用研究的力度明顯加大,特別是在科技管理與決策中的應用越來越受到有關領導部門和研究者的重視。國外對此十分重視,例如,美國、英國、匈牙利、印度等許多國家不僅把文獻計量指標作為科學計量學指標體系中的重要組成部分,而且還從管理的高度,認為它是衡量一個國家科學文化水平乃至綜合國力的一種重要途徑和有效方法。早在20世紀60年代,美國就開始編制《科學引文索引》(SCI)。這一大型索引的出版和發行,為文獻計量學研究提供了一種多功能的有力工具,一定程度上解決了文獻計量學應用所必需的大量數據,有效地推動了文獻計量學的全面發展,被譽為文獻計量學史上具有劃時代意義的研究成果。可以說,沒有SCI就沒有現代的文獻計量學。我國著名學者趙紅洲、蔣國華等人曾經利用文獻計量方法,排出了我國主要大學發表論文的名次,並以「學術榜」的名義在報紙上公布後,引起了社會各界的強烈反響,並受到國家科委、中國科學院和國家自然科學基金會領導的高度重視。從1987年起,國家科委為了從一個側面評價我國學科發展、科技投入產出情況及科研機構和科技人員的成就,委託中國科技情報研究所(今改名為中國科技信息研究所)利用ISI的三套出版物,對我國學者從1983年以來發表的論文情況進行統計分析。接著,國家科委專門下達資助課題,要求中國科技信息研究所進行更大范圍、更系統的文獻信息統計分析,對我國科技水平在世界上所處的地位以及主要大學、科研院、所的科學生產能力和學術水平作出客觀評價,並逐步形成制度,每年召開一次新聞發布會,公布有關統計結果。中國科學院文獻信息中心從1998年起也逐年出版《中國科學計量指標:論文與引文統計》(簡稱《指標集》)。集內有100多項統計指標,運用科學計量學和文獻計量學的有關方法,對我國科技論文的產出力和影響力及其分布情況從總體上進行了客觀的描述。該書的內容包括:統計源概貌,機構研究計量統計,國家重點實驗室和部門開放實驗室研究計量指標,地區研究計量指標,科技基金計量指標,合作研究計量指標,人才研究計量指標,文獻評價計量指標。近幾年來,國家自然科學基金會連續資助了6項文獻計量學和科學計量學方面的研究課題,促使其研究上規模、上檔次、上水平,從而有力地推動了文獻計量學的深入發展。由於文獻計量指標的評價功能與其它社會評價指標的功能是一致的,而且其研究成果和計量數據可以為有關部門的管理和決策提供定量依據與支持,因而越來越受到有關領導和管理部門的廣泛重視。這一重要進展表明,文獻計量學的某些內容和方法正在由課題研究向事業化方向發展,成為國家科技文化事業的一個組成部分。這有利於文獻計量學沖破傳統的局限,增強其滲透力和輻射力,大步進入「科技圈」、「管理圈」、「決策圈」,在更大的范圍內充分發揮其作用,從而進一步得到社會各界的承認和重視。這是90年代以來文獻計量學研究和應用發展的顯著特點與趨勢之一。
2.國內外地學文獻統計分析系統
國內外地學文獻統計分析系統建立的背景
文獻計量學的應用是建立在大量數據的基礎上的,因此必須利用計算機等現代化手段建立正規的文獻信息計量工具,為應用提供大規模數據的獲取渠道和來源,必須依託較為適宜的文獻資料庫才能進行。目前國內文獻計量學研究大多利用SCI為數據源進行統計研究,但在本研究進行項目調研中發現SCI創建時間較短,在可追溯性方面不如一些歷史悠久的傳統檢索工具(如地質學方面有200多年收錄史的GeoRef),雖然SCI收錄5000多種期刊,但由於其專業覆蓋面很廣,故每個學科的收錄數量都不夠。並且SCI對各學科的重視程度不同,所以各科學間的數據不具備可比性。此外SCI中沒有「分類號」一項,不能按學科進行分類檢索,因此用它進行某學科的統計就很困難,一些文獻統計項目為了用SCI進行各學科綜合統計研究不得不花費大量人力對原始數據重新進行分類等加工、錄入,這一點可反映出數據源選定的是否得當在很大程度上影響著統計工作的結果和效率。可以認為利用SCI對國內外地球科學進行分學科和領域論文分布及其變化趨勢分析,論文使用的分析測試方法統計分析,論文研究的區域分布統計分析,論文提出的新理論和新方法無法滿足要求,因此,本項目組自行設計並完成了國內外地學文獻統計分析系統。
國內外地學文獻統計分析系統
國內外地學文獻統計分析系統應用資料庫技術和公共查詢系統技術實現對地學文獻數據的存儲、查詢、分析、輸出,實現地學文獻的信息化管理。
(1)系統運行環境:
a.伺服器:WINDOWS NT及其以上平台,PIII 800、RAM/256M、Disk/20G;
b.客戶機:DINDWOS 9X或WINDOWS NT及其以上平台,PII 350、RAM/64M、Disk/9G;
c.網路:互聯網;
d.資料庫:MS-SQL 2000。
(2)系統結構:
國內外地學期刊統計分析系統的設計採用了三級B/S體系結構,三層結構包括客戶機、應用伺服器、Web伺服器、資料庫伺服器。這種方式又稱瘦客戶機系統,在客戶機端沒有或者有很少的應用代碼。客戶機負責數據結果的顯示和用戶請求的提交。應用伺服器和Web伺服器負責響應和處理用戶的請求。而資料庫伺服器負責數據的管理工作。所有的空間數據和應用程序都放在伺服器端,客戶端只是提出請求,所有的響應都在伺服器端完成。其中,Web伺服器位於系統的中間,是原型系統的樞紐與核心部分,是系統設計和實現的關鍵。系統結構如圖1所示。系統前端是Client/Brower,中間是Web Server,後端是Sql Server。
圖1 國內外地學文獻統計分析系統應用的結構圖
(3)系統總體功能:
a.資料庫管理:實現數據輸入與維護、查詢、顯示輸出等,系統也提供Web環境下的數據管理,數據信息可在遠程或本地進行編輯、瀏覽、維護。
b.系統可進行文獻計量統計初評估、總評估:依據文獻查詢結果進行學科、主題、作者、研究單位、研究區域等相關度的統計和分析。
c.數據交換功能:系統可通過轉換工具將數據轉換為其它標准格式,如2709等國標數據。
d.系統具有完整的桌面管理和幫助系統。
(4)系統構成框圖(圖2)與主要功能圖(圖3)。
圖2 國內外地學文獻統計分析系統的構成框圖
(5)系統的開發和應用環境:在中文WIN2000下利用SQL2000、ULTRADEV、VBSCRIPT進行開發。
國內外地學文獻統計分析系統數據源選定
國內外地學期刊統計分析系統建庫主要收集和利用《GeoRef檢索系統》(以下簡稱GeoRef)、《中國地質文獻庫及檢索系統》(以下簡稱GDS)作為數據源,GeoRef是中國地質圖書館在1982年開始引進的美國地質調查所信息中心所建的地學文獻資料庫,該資料庫收錄了北美地區自1785 年以來的和世界上其它地區自1933年以來的地質文獻,包含了地球科學領域國際上公認的5000餘種期刊、會議資料等,總共約220萬余條,其收錄范圍覆蓋了地球科學近40 個類目,是目前國際最權威的地質學文獻檢索資料庫。GDS由中國地質圖書館所建,收錄1985 年至今的400 余種期刊、專著、論文集和國際會議中文資料,累積文獻量達20 余萬條,收錄范圍基本覆蓋了地球科學、土地科學等40個類目,是我國地球科學和土地科學研究領域最大型的檢索系統,是國內最權威的地質學文獻資料庫。選取上述兩個資料庫作為本系統數據源的主要原因是:①GDS的基本結構和選刊原則等諸多方面與GeoRef接軌,建庫依據了文獻計量學的結果;②兩種資料庫均有較為嚴格選刊標准,收錄文獻的種類較多,即將國家級單位主持的地球科學類專業雜志悉數收錄,也將一些地方主辦、流通區域有限因而影響較小的地球科學雜志收錄;③兩種資料庫收錄時間較長,GeoRef已有200年數據,GDS的數據年限已有近19年,非常適合於我們對多年來地球科學論文情況進行分析;④兩種資料庫的分類系統設立既遵循了地球科學的學科分類,又是從檢索文獻的實際需要出發,並且GDS是參考了GeoRef的類目名(表1、表2)。所以根據GeoRef和GDS得到的分析結果應該是代表國內外地球科學研究水平。不足之處是兩種資料庫都缺少引文分析。
圖3 國內外地學期刊統計分析系統的主要功能示意圖
表1 GeoRef數據各學科使用代碼列表
表2 GDS數據各學科使用代碼列表
續表
3.國內外地學期刊統計分析實例
國內外地學期刊統計分析是利用國內外地學文獻統計分析系統,檢索提取科技人員和研究機構發表論文數量的統計數據,進行科技人員群落及研究機構的學術榜的測定;檢索提取分類統計數據,進行相關學科的學科體系演變和發展趨勢分析。
國內研究機構論文數量的統計分析
國內外地學期刊統計分析系統框架結構中的選項有:題目、作者/單位、刊名、出版社、出版年、卷、頁、文獻索取號、語言、載體形態、關鍵詞、分類號、文獻識別號、記錄狀態、文獻類型、目錄級別、文獻載體、ISSN號、ISBN號、會議、版次。如想了解我國近年來各研究機構發表論文的情況,通過系統選擇框架結構中「出版年」,輸入「年代(1997、1998、…2001)」,檢索出各年代收錄的全部文獻,再選擇系統框架結構中的「作者/單位」輸入、並通過Excel運算處理,即可得到如下的統計數據(表3)。
表3 國內外地學期刊統計分析系統1997~2001年收錄國內研究機構論文數量
國內外學科結構統計分析
利用國內外文獻統計分析系統對GeoRef資料庫100年、GDS資料庫15年期刊論文進行學科的統計分析,數據採集的方法是利用分析系統框架結構中的「分類號」進行檢索,GeoRef資料庫的檢索式:分類號的欄位代碼、GDS資料庫的檢索式:選擇檢索系統框架結構中的「分類號」,輸入分類代碼,採用上述方法我們採集了國外100年、國內15年的分類數據,編制了國際地質科學體系學科結構的百年演變圖及國內地質學科體系學科結構近20年演變圖(詳見第一章)。
中外綜合性期刊地學論文對比研究
(1)《科學通報》、《中國科學(D輯)》、《Nature》和《Science》的地學學科結構的統計分析
《Nature》和《Science》分別是英國和美國主辦的世界頂尖的綜合性科學雜志,所發表的地學文章一般都反映了地質科學研究的一些重要進展。而《中國科學(D輯)》、《科學通報》也可以算是我國頂尖的綜合性科學雜志,4種雜志的學科結構,反映了近年來地質科學基礎和前沿研究領域及其變化趨勢。
比較4種期刊可知,第四紀地質學方面的論文數都居於其它學科之上,說明近年來對第四紀地質與全球變化科學研究日趨重視。詞頻統計結果也表明與其相關的術語出現最多,如「第四紀」、「新生代」、「全新世」等。因為第四紀從時間上離人類活動的歷史最近,因此研究第四紀地質、環境、氣候變化等,無不與我們人類的生存這個重大問題密切相關。《Science》和《Nature》上關於宇宙地質(或球外地質)的論文排名在前5位,比在《中國科學》《科學通報》上的排名要靠前。球外地質實際上也是一個涉及到未來人類居住環境的重要科學問題,當然它還反映了我們對地球起源等根本問題的不懈探索。之所以國內這方面的論文還比較少,其原因可能是多方面的,主要可能與國家經濟實力、技術設備水平有關,其次是對人類環境問題的關注程度。另一方面,從統計結果中可以清楚地看出,在國外兩著名期刊上關於經濟地質(包括礦產、能源等)方面的論文數量較少,而國內兩大期刊在油氣地質、金屬礦床兩類論文數量均名列前茅,這與我國是發展中國家,對礦產、能源的需求量大有關。另外,地質找礦仍然在我國地質工作中占相當大比重,這方面的成果(論文)也就很多。
(2)《Nature》和《Science》國別分布的統計分析
從表4、表5可看出,前10位除中國之外都是當今世界上經濟最發達的國家,尤其是美國更是遙遙領先,英、法、德為第二梯隊,明顯落後於美國。這表明只有經濟上相對強大了,科技的發展才能得到有力支持。中國自20世紀90年代以來,經濟發展較快,也很重視科技對社會生產力的推動作用,因而加大了對科技的投入,之所以能夠躋身前10強,說明我國在地學領域已取得了一些領先水平的研究成果。
表4 在《Science》1996~2001年發表地學論文數前10位的國家
圖4反映了過去20多年以來我國在國際著名期刊上發表地學論文的情況,論文數量總體上呈上升趨勢,尤其近6年以來迅速攀升,表明我國地學研究在某些方面已經受到國際上的重視。
表5 在《Nature》1996~2001年發表地學論文數前10位的國家
圖4 近年來我國學者在《Science》、《Nature》上發表的地學論文數量變化曲線
(3)《中國科學(D輯)》、《科學通報》、《Nature》和《Science》機構分布的統計分析
對《中國科學(D輯)》、《科學通報》、《Nature》和《Science》4種期刊1996~2001年每一年不同單位發表論文數的多少進行了排序,從圖5、圖6看,在《Nature》上大學、研究所、國際組織、公司和其他分別佔58%、28%、15%、11%、0.2%;《Science》上大學、研究所、國際組織、公司和其他分別佔47%、27%、0.4%、0.05%、24%,大學所佔比重最大,其次為研究所。這與《中國科學(D輯)》、《科學通報》情況完全相反(表6、表7)。
從表6、表7中可以看出,我國發表地學論文最多的單位是研究所,其次才是大學或學院。按發表論文的多少進行排序的結果表明,中科院地質所、地球物理所及其所屬各實驗室發表論文數最多,其次為地科院、地震局、海洋局等所屬研究所。中科院論文數遙遙領先於其它研究所。大學中學術論文數量較多的是中國地質大學(武漢)、中國地質大學(北京)、南京大學、北京大學、西北大學、同濟大學(排名未分先後)。
圖5《Nature》1996~2001年發表地學論文機構分布
圖6《Science》1996~2001年發表地學論文機構分布
表6《中國科學D輯》1996~2001年發表論文作者單位分類統計
表7《科學通報》1996~2001年發表論文作者單位分類統計
中外期刊地學論文研究領域的對比分析
根據選定的國內外地學期刊統計分析系統數據源,採集和分析了16000多個數據,從而對礦物學、地球化學、岩石學、古生物地史學及地層學、構造地質學、礦床地質學、地球物理學、第四紀地質學與全球變化、環境地質學、工程地質學、能源地質學、行星與宇宙地質學、海洋地質學、地質年代學、地質觀測技術等研究學科和領域進行了專題調研,反映了研究領域的變化趨勢(詳見學科分述部分)。
⑶ 文獻計量法和文獻法關系
文獻計量法是藉助文獻各種特徵的數量,採用數學與統計學方法來描述、評價和預測科學技術的現狀與發展趨勢的定量分析方法。
_南追ㄊ茄芯空咄ü樵摹⒓稹⒓庸ふ磧泄匚南?,從而正確地探索所要研究的教育問題的一種教育研究方法。
⑷ 如何通過文獻計量分析方法為科研選題提供支持
文獻計量學是以幾個經驗統計規律為核心的。
例如:表徵出科技文獻作者分布的洛特卡定律(1926);
表徵文獻中詞頻分布的齊普夫定律(1948);
確定某一學科論文在期刊中分布的布拉德福定律(1934)等。
文獻計量學一直圍繞這幾個定律,沿著兩個方向發展:其一是驗證與完善這些經驗定律;
其二是擴大與推廣這些經驗定律的實際應用。
目前,文獻計量學應用十分廣泛。
微觀的應用有確定核心文獻,評價出版物,考察文獻利用率,實現書情報部門的科學管理。
宏觀的應用有設計更經濟的情報系統和網路,提高情報處理效率,尋找文獻服務中的弊端與缺陷,預測出版方向,發展並完善情報基礎理論等。
由於存在影響文獻情報流的人為因素,很多文獻問題尚難以定量化。
特別是由於文獻系統高度的復雜性和不穩定性,不可能獲得足夠的、有效的信息,來揭示文獻的宏觀規律。
文獻計量學的發展有賴於數學工具和統計學技術的支持,移植或利用更有效的數學工具和統計學方法,將是其重要的發展方向。