一.二次文獻概述
二次文獻(secondarydocument)是指按照一定的原則,對一次文獻進行加工、整理之后,定期出版的一種文獻, 如目錄索引、引文索引、文摘等。二次文獻的原則就是為查找一次文獻提供線索,并使一次文獻有序化[1]。它具有明顯的匯集性、系統性和可檢索性,它匯集的不是一次文獻本身,而是某個特定范圍的一次文獻線索。它的重要性在于使查找一次文獻所花費的時間大大減少;它能高效率地捕捉有效信息,全面、系統地反映某個學科、專業或專題在一定時空范圍內的文獻線索,是積累、報道和檢索文獻資料的有效手段。隨著信息技術的發展,利用數據庫技術對某特定領域的二次文獻(文摘、題錄、目錄等書目數據)實施管理,并以數據庫形式為用戶提供服務,又稱為二次文獻數據庫,二次文獻數據庫包括文摘、索引、目錄數據庫等。CA(化學文摘)、MEDLINE(醫學文獻數據庫)、SCI(科學引文索引)、CBM(中國生物醫學文獻數據庫)等, 是知名的二次文獻數據庫,它們具有數據量大,累積性強等特點,常被用于聯機情報檢索、定題服務、回溯檢索。
我國的《全國報刊索引》、《中國社會科學文摘》《中國物理文摘》《中國人民大學復印報刊資料》《中文社會科學引文索引(CSSCI)》,美國的《科學引文索引(SCI)》《工程索引(EI)》和《化學文摘(CA)》,英國的《科學文摘(SA)》等,都是典型的二次文獻數據庫。本文力圖通過對這些二次文獻數據庫的對比研究,探尋其中的規律,找出它們的共性,以更好地為建設二次文獻數據庫服務。
二.國內外二次文獻數據庫對比研究
1、國外二次文獻數據庫分析
國外二次文獻數據庫的建設起步較早,有許多成功的經驗可供我們借鑒。隨信息技術的飛速發展與因特網普及,特別是搜索引擎的使用,使得一次文獻獲取方式多樣化,但世界知名的二次文獻數據庫CA,SCI,EBSCO等,并沒有因此而被淘汰,反而更加活躍地展現于世界文獻信息服務市場。下面我們將以CA、SCI、EBSCO為例,從創刊年、載體形式、收錄范圍、產品品種、數據庫量變化、檢索途徑、用戶分析等方面進行分析。
1.1數據庫簡介
美國《化學文摘》(Chemical Abstracts,簡稱CA),創刊于1907年,由美國化學文摘服務社(CAS)編輯出版。《CA》報道了世界上150多個國家、56種文字出版的16000種科技期刊、科技報告、會議論文、學位論文、資料匯編、技術報告、新書及視聽資料,還報道30個國家和2個國際組織的專利文獻。其收錄的文獻占世界化學化工文獻總量的98%,文獻量50萬/年。它的另一個特點是出版速度快,而且索引的編排很出色,不但每期都有索引,每卷有索引,還有五年、十年累積索引,為查閱文獻提供了方便。從1998年7月使用了計算機編排,使查閱文獻更加方便,是涉及學科領域最廣、收集文獻類型最全、提供檢索途徑最多、部卷也最為龐大的一部在化學領域內權威檢索工具。
EBSCO公司成立于1984年。是全球最早推出可以提供全文的在線數據庫檢索系統的公司之一,為用戶提供了各種各樣的最新文獻。EBSCO的數據庫所涉及的期刊既有大眾性,也包含了大量專業性的期刊,數據庫的數據每日更新。
該數據庫分為Academic Search Premier、Academic Search Elite、Business Source Premier、Regional Business News、EBSCO Online Citations、ERIC(即the Educational Resource Information Center)和Newspaper Source等庫。EBSCO網站24小時開放,數據日更新,檢索結果有目錄、文摘和全文。它涵蓋國際商務、經濟學、經濟管理、金融、會計、勞動人事、銀行、工商經濟、資訊科技、人文科學、社會科學、通訊傳播、教育、藝術、文學、醫藥、通用科學等領域的期刊,其中許多期刊是被SCI與SSCI收錄的核心刊EBSCO數據庫是由美國EBSCO host創建的大型、綜合性的文獻資料庫。它是由Academic Search Premier (ASP)、Business Source Premier (BSP)、Medline等多個數據庫組成。該數據庫的檢索方式分為初級檢索和高級檢索兩大類。每一類下設關鍵詞檢索(keyword search)、主題檢索(subject search)、出版物檢索(publications search)和圖像檢索(Images search)四種方式。該數據庫的檢索結果目錄中顯示每一條記錄的文章篇名、作者、刊名、卷期號、頁數,并用三種圖標顯示是以HTML格式、PDF格式或圖像方式提供全文。若用戶具有使用權限,點擊文獻篇名或圖標,即可看到帶文摘或全文的記錄。
《科學引文索引》(Science Citation Index,簡稱SCI),由美國科學情報研究所(Institute for Scientific Information ISI)編輯出版。1961年創刊,現為雙月刊。1988年SCI出版光盤,每月更新。其網絡版已問世(它的網址為:http:// www.isinet.com <http://www.isinet.com>),網絡版的出現使SCI檢索回溯時間更長,數據更新更快。收錄范圍:1998年統計,SCI收錄了以在英美出版為主的42個國家和地區的37種文字、3,542種出版物的文獻(包括圖書和期刊),涉及生命科學、數學、物理、化學、農業等九十多個學科領域,錄入來源文獻770,591條,引文17,035,597條。收錄期刊論文、會議摘要、通信、綜述、討論以及選自《Science》、《Scientist》、《Nature》中的書評等。
1.2分析
為便于進行直觀對比,我們做了專門匯總,如表格所示,使各自的特色、異同醒目呈現。
國外二次文獻數據庫的發展相對比較成熟,表現在以下幾個方面:
(1)收錄文獻全面且質量較高。收錄范圍廣泛、全面。EBSCO、SCI覆蓋了社會科學和自然科學的領域,CA作為化學化工類檢索工具,其收錄的文獻類型和種類也是最多的;多數被收錄的期刊都是某一學科領域的權威期刊,質量較高;部分期刊自創刊之始收錄,收錄比較完整,因而回溯檢索功能較強。
(2)數據更新速度較快,基本做到數據周更新,部分達到數據日更新,有利于用戶快速獲取信息;
(3)檢索功能強大,對文獻內部及其之間的知識關聯揭示較好。通常都支持篇目內容檢索和整刊檢索,提供基本檢索、高級檢索等;檢索入口較多;在一定程度上支持自然語言檢索,查全率、查準率較好,相關文獻類聚檢索、引文鏈接、知識單元間的跳轉檢索等在知識單元及其關聯的深層揭示較好;
(4)服務對象明確,三個數據庫都從本專業出發,從收錄文獻范圍到檢索途徑的提供都有較全面而深入的研究,對一次文獻的揭示隨著技術的發展而迎合用戶的需求,是本學科領域中最有效的檢索工具?
2、 國內常用二次文獻數據庫分析
我們選取常用的清華同方光盤股份有限公司的《中國期刊網全文數據庫》、重慶維普資訊有限公司的《中文科技期刊數據庫》以及上海圖書館全國報刊索引編輯部的《全國報刊索引數據庫》進行比較研究。
2.1數據庫簡介
《中國期刊網全文數據庫》由清華同方光盤股份公司開發,是中國知識基礎設施主要工程(CNKI)之一。該數據庫按學科分為理工A、理工B、理工C、農業、醫藥衛生、文史哲、政治經濟法律、教育與社會科學、電子技術與信息科學9個專輯126個專題數據庫。數據庫收錄從1994年開始的6100余種國內出版的中文期刊的全文,數據量達1000余萬條,基本做到每日更新。
《中文科技期刊數據庫》由重慶維普資訊有限公司開發,收錄了1989年以來的自然科學、工程技術、農業、醫藥衛生、經濟、教育和圖書情報等學科8000余種期刊刊載的660余萬篇文獻,并以每年100萬篇的速度遞增。按照《中國圖書館分類法》進行分類,所有文獻被分為7個專輯:自然科學、工程技術、農業科學、醫藥衛生、經濟管理、教育科學和圖書情報。專輯又細分為27個專題。網上數據做到每周更新。
《全國報刊索引數據庫》系文化部立項,上海圖書館承建的重大科技項目,《全國報刊索引》編輯部自1993年起開始研制和編輯,1995年完成并通過部級鑒定,96年獲文化部科技進步二等獎、上海市文化局科技進步一等獎。它收錄了全國包括港、臺地區的期刊4000種左右,涉及所有哲學、社會科學、自然科學領域,是《全國報刊索引》的電子產品。數據庫格式嚴格按照國家有關標準,其著錄字段包括順序號、分類號、題名、著者、著者單位、報刊名、卷期年月、所在頁碼、關鍵詞等十項。具有學科齊全、種類繁多、信息量大、檢索簡便、界面友好、速度快捷的特點,年更新量在50萬條左右,目前已將數據回溯至1857年,時間跨度達140多年,數據量700余萬條,是新一代的信息檢索數據庫。
2.2 分析
同國外同類型的數據庫相比,無論是數量還是質量,都存在一定的差距,主要表現在以下幾個方面:
(1)數據的全面性和完整性較差。由于各個數據庫有各自的側重點,收錄規則不盡相同,再加上受版權的限制,漏收現象比較嚴重,特別是報紙信息缺乏,不能囊括本領域的所有文獻;
(2)檢索界面不夠友好,易用性有待進一步改進。如CNKI提供了檢索結果的存盤功能,但存盤的提示符不明顯,存盤沒有提示路徑,這一點EBSCOO的存盤處理方法較好;檢索結果的顯示缺乏人性化,不便于查看;
(3)數據重復、漏檢、誤檢現象不同程度地存在;
(4)對文獻的揭示深度不夠,無特色索引。CA雖然是化學化工類的專業檢索工具,但在全文數據庫大量出現的今天,依然能保持不變的原因之一是它的專業性及特色索引,這是國內二次文獻所不及的;
三.對策與建議
通過對國內外具有代表性的二次文獻數據庫的對比研究,對于我國二次文獻數據庫的發展提出如下建議:
嚴把質量關,打造特色精品。要提高數據庫的質量,必須在數量和質量上下功夫,做到“全”、“精”、即要擴大數據庫的收錄范圍和數量,要在“全”字上做文章,要收全各學科、各專業的文獻,滿足用戶多方面的檢索需要;“精”指要提高數據庫的質量,建設二次文獻數據庫是一個系統工程,也是一項仔細、認真、耗費腦力的工作,稍有疏忽就可能造成數據的錯誤,給用戶造成麻煩,降低查全和查準率。應在輸入、校對、標引、數據處理上嚴把質量關,努力打造富有特色的數據庫精品。
2、進一步增強文獻標引深度標引深度是衡量一個數據庫查全、查準的重要尺度,也是檢索工具質量品質的保證。
3、注重和加強文獻內容的深層開發,揭示文獻內部、文獻之間的知識關聯,實現有效的知識揭示,如進一步揭示文獻的知識單元、知識關聯及文獻間的多維關聯等;同時,增強二次文獻數據庫對報刊論文的評價篩選功能,使數據庫的加工深入到論文的知識層,把論文中最精華的部分(用戶最需要查到的部分)揭示出來,大大提高二次文獻的利用價值;
4、建立快速、方便、廉價的傳遞服務通道。傳遞服務的快捷、方便、廉價直接關系到二次文獻數據庫的生存和發展,網絡版環境形式的日趨完善對用戶查找文獻資料方式的影響很大,全文數據庫與索引數據庫之間競爭激烈,后者的優勢是價格,必須再加上傳遞服務的快捷,方便,才能贏得用戶的青睞。
5、加快數據庫更新速度。信息傳遞迅速,及時報道學術研究新成果、新動態,是二次文獻數據庫必須做到的另一優勢。
6、與著名的搜索網站合作,擴大數據庫的知名度,使數據庫的用戶群從圖書館、機構擴展到個人,從而把讀者重新引入圖書館;
網絡時代,人們對二次文獻數據庫提出了更高的要求。二次文獻數據庫的建設,既要適應文獻載體形式的變化,也應符合人們對所用文獻的了解認知、心理適應和使用習慣,要以社會需求為建設目的,充分發揮二次文獻在揭示文獻上作用,為文獻利用提供便利。