進入21世紀后,國際出版業發展很快,文獻資源的出版形式發生了很大變化,實體型文獻數量減少網絡信息資源日趨豐富,網絡資源取代傳統實體型文獻的趨勢不可阻擋。例如:聯合國文件已啟用數據庫的形式提供服務,不再出版印刷型;而近年來興起的開放存取運動,使得很多國際組織和外國政府的重要文獻資源可以通過網絡免費獲取。面對如此豐富、低獲取成本的信息資源,對資源的分布、來源、存在狀況、內容、質量、穩定性等問題進行準確的評估,為公眾及學界提供積極有效的信息資源導航,已成為十分迫切的課題。
國際組織與外國政府出版物網絡資源整合服務平臺[1]是對聯合國等重要國際組織和外國政府實體與網絡資源進行全面系統整合而構建的,是集資源導航與檢索、用戶交互于一體的網絡服務平臺。該平臺旨在揭示重要國際組織與外國政府網絡資源、建立特色資源導航、推廣中國國家圖書館特色館藏資源,充分實現文獻的利用價值,適應現代信息技術發展,為讀者提供一站式信息服務;而想要向讀者提供一站式服務就涉及網絡資源的本地化長期保存。
1.國際組織和外國政府出版物網絡資源分析
國際組織和外國政府網站,不以盈利為目的,其網絡資源具有內容豐富可靠、發布及時、文獻組織有序、獲取便捷、具有較強的參考價值等特點,各網站內容、形式不同。在眾多的網絡資源中大體可分為動態型網絡資源和靜態型網絡資源兩種[2]。
1.1 動態型網絡資源
這類資源更新速度較快,又可分為描述型動態網絡資源與數據庫型動態網絡資源兩種。
其中第一種主要為一些機構及其出版物的概括性介紹、最新動態等,幫助讀者對相關機構或出版物作基本了解,內容龐雜,但并不是所有信息都適合于圖書館用戶使用。因此這部分內容適合由圖書館進行整合、分類、提煉并放在館內國際組織與外國政府資源專題網頁上,幫助讀者了解這些機構是什么?有哪些可利用的資源?有哪些文獻信息方面的新動態?這部分不是長期保存的重點。
第二種數據庫型動態網絡資源則非常專業、權威和重要。特別是其中一些統計性數據庫,是目前讀者信息需求的熱點。由于數量龐大、涉及專題多、更新快,考慮到目前硬件及技術條件可能對其進行全部下載有難度,因此建議采用網頁導航的方式,將其整合到圖書館國際組織與外國政府資源專題網頁下統一發布,使讀者對哪些資源屬于自己所需要的一目了然。
1.2 靜態型網絡資源
聯合國及其專門機構網站多數建有在線全文數據庫、電子圖書館等專欄。內容包括年度報告 、統計年鑒、研究報告、工作文件等。這類文獻往往具有很高的利用價值;而且多為pdf或word格式,可免費下載,若能充分利用就能更好地滿足讀者的需要。
這類網絡資源可根據館藏情況分為兩類處理;其一,對那些館內沒有實體館藏的網絡資源,可以定期下載,編目并長期保存,以確保與實體館藏的有效互補與融合。其二,對那些已有實體館藏的網絡版文獻可在書目數據中添加856字段、電子資源定位與訪問字段,引導讀者對其網絡版的便捷獲取。國家圖書館在Aleph500系統第16版升級時,新增了“外部鏈接功能”即在簡明書目格式顯示,根據書目記錄中856字段$u子字段、URL的內容就可以獲得網絡資源。但是,目前讀者使用OPAC系統檢索時,還不能使用此項功能,建議為讀者增加“外部鏈接”功能。
內容整合是指不僅對政府信息的網址地址進行整合;而且對信息內容進行整合后存檔到本地數據庫中并提供一站式檢索,它是一種比較安全的整合[2]。
澳大利亞保存和獲取網絡文獻資源項目 Preserving and Accessing Networked Documentary Resources of Australia,簡稱 PANDORA,是1996年澳大利亞國家圖書館 National Library of Australia (簡稱NLA)牽頭與9個圖書館和文化機構合作啟動的項目。它以收集、保存與澳大利亞相關的網站和出版物為目標,旨在通過保存活動為未來的用戶提供這些資源的存取與利用[2]。收集的相關網站主要包括非常有代表性的學術、商業、組織機構網站,也包括政府網站。NLA開展的工作主要有:對網上信息資源進行選擇、獲取、收集、抓取、管理、存檔,使用網址收集和管理軟件采集信息,建立PANDORA存檔,PANDORA Archive 對政府信息資源整合,提供一站式檢索并存儲到本地數據庫。PANDORA存檔的不僅是政府信息的內容;而且也存檔了政府信息網頁的形式,是一種比較完全深入的內容整合。
2. 國際組織和外國政府出版物網絡資源長期保存需要解決的問題
“數字時代”出版商實行的是授權制度。也就是說目前圖書館采購的很多外購資源庫均未獲得資源的所有權;而只是以獲取“使用權”的方式購買和利用數字資源。因此,存在外購資源的可持續利用問題[3]。筆者認為,要解決網絡資源的本地化保存,主要需要解決以下兩方面的問題:
2.1 法律問題
在信息時代環境下,通過下載等途徑獲取網絡資源以彌補館藏文獻的不足是圖書館文獻資源建設的重要方式,但是版權等法律問題是圖書館進行獲取前必須首先考量的因素,網絡資源的采集和利用必須合法。
目前國際組織和外國政府出版物網絡資源可分為免費使用、付費使用、授權使用等幾種使用形式,對于免費使用的聯合國網絡資源,如:所有書目信息數據庫均可免費使用,絕大部分《在線出版物》和部分專題數據庫,可以免費查閱和下載;但不得散發、出售、匯編等。(見版權說明) 對于需要付費的網絡資源,如:聯合國在線統計月報、世界發展指標在線數據庫、全球發展金融在線數據庫等,查閱和下載受到限制。對于必須通過授權的方式才能使用的網絡資源,如:聯合國正式文件系統數據庫、ODS Official Documents System、聯合國條約數據庫等,必須與版權方取得聯系,使其授權使用和下載資源。
一般來說,圖書館屬于以教育、學習和研究,為讀者服務為目的的范疇,不屬于營利機構,多數聯合國機構愿意圖書館利用其網絡文獻。即使有版權限制的文獻資料,只要事先得到有關機構或有關作者的許可和授權即可使用。但不允許大量復制、刻錄、或翻譯,很多國內圖書館由于長期忽略這部分文獻資源的建設或害怕麻煩,懶于溝通,語言障礙等原因導致國內托存圖書館與這些國際組織溝通渠道不暢,談判不夠積極主動。目前對于國際組織和外國政府出版物網絡資源的開發還多局限于網站導航;而未進入更深入的本地化長期保存及開發使用階段。
2.2 數字資源的永久保存問題
網絡資源具有不穩定性和易消失性,國際組織和外國政策出版物的網絡資源具有普通網絡資源共有的一些特征,如信息量龐大繁雜、生命周期短暫、更新快、不穩定性和易消失等。這些特點導致兩個后果,其一是原有鏈接常常失效。如不及時更新維護,往往造成死鏈,無法獲取相關信息;亦無法保證圖書館用戶對這類資源的持續、有效訪問。其二是重要數據的不可追溯,有些機構對于其陳舊、過期數據不再保留或不再公開提供,導致一些文獻資源成為“曇花文獻、蜉蝣文獻”。如果圖書館沒有對這類網絡資源及時進行抓取和保存,很可能造成數據的永久消失。在工作中筆者也曾遇到有讀者前來尋求幫助,尋找他在幾個月前遇到過的網頁及數據[4]。
隨著各個機構對自身網絡資源的重視,這類現象近年逐步減少。但對那些可能機構本身認為沒有保存價值,但對圖書館及其用戶來說具有保存價值的資源來說,這類資源的抓取和保存工作還是非常必要的。目前國內對這類資源的保存工作幾乎沒有開展,特藏專欄的建立不是一勞永逸的事情,需要對這些動態的資源保持長期的追蹤監測,隨時更新鏈接信息和專欄內容。惟如此才能保持其新鮮度和生命力,避免成為死鏈接。
3. 國際組織和外國政府網絡資源長期保存的規劃與對策
3.1 目前長期保存工作取得的成績
目前,許多國際組織和政府網站都提供了一些相關的數據庫,有些可以免費使用;同時,通過多方努力,中國國家圖書館已經獲贈了部分數據庫的使用權限。如通過托存圖書館協議于2009年9月獲得了《 IMF在線圖書館資源》含《International Financial Statistics 》等四個統計數據庫的使用權限。這些資源是科學研究中不可多得的寶貴財富,但由于發布位置不顯著、不集中、缺少詳細介紹等原因,導致讀者對此知之甚少利用率極低。只有當讀者來到閱覽室時,通過館員輔導才了解如何使用。這種狀況是對資源的極大浪費也有違圖書館促進知識獲取的價值準則。
3.2 鏡像服務規劃
以聯合國條約集為例。目前聯合國因為經費的壓力,不再提供紙板的條約集;而條約集在國家圖書館的收藏是非常完整的,為了保證條約集的完整性,在2010年舉行的中國《聯合國托存圖書館館員培訓研討會上》代表們建議聯合國授權本地化下載,以保持條約集的完整性。而為了更好地實現資源共享,就需要將各種格式的文件,無論是PDF格式;還是Word格式等,保存在服務器上,更快捷的為讀者提供鏡像服務。即電子資源的長期保存問題,代表們建議在國家圖書館建立本地鏡像服務器,聯系聯合國各機構確定下載的授權,最終享有永久保存的權利。對于全文文獻、電子書等涉及知識產權性質的不同,鑒于聯合國各機構情況不同,有條件的做本地鏡像,這同樣需要取得國際組織各機構的授權。
3.3 制定網絡資源的長期保存政策、技術和標準準備相應硬件設施,將虛擬館藏轉化為實體館藏
用資源導航、數字資源列表的形式引導讀者使用開放獲取資源固然是一種經濟、實用又方便易行的方法,但其最大的不足在于無法與中國國家圖書館的實體型文獻進行聯合檢索;即讀者從OPAC中查不到這部分資源。在此情況下,這些資源往往被忽視,同時鑒于數字世界的龐大規模及其生命周期的短暫,圖書館必須在這個新的信息世界中擴大采訪范圍、制定網絡資源采集標準 ,以便繼續履行其永久保存重要知識信息的歷史使命。因此,應逐步對這部分資源進行有計劃有目的的抓取、收集與保存。將虛擬館藏轉化為實體館藏,構建綜合化、一體化館藏。
可以根據不同網絡資源的不同特征,在尊重版權的基礎上建立相應的長期保存政策、技術和標準,可以借鑒WICP(Web Information Collection and Preserva-項目[5]。即網絡信息資源的采集與保存試驗項目,它是2003年初由中國國家圖書館啟動的涉及網絡信息資源保存問題的研究項目,該項目積極探索信息資源的采集與保存的相關法律、技術、標準等問題,在進行網絡信息的采集和保存時,對靜態網頁(表層網頁)和動態網頁、深層網頁,采取不同的策略,這也是國際組織與外國政府出版物網絡資源應參考的標準。例如對部分已獲得版權授權并具有長期保存價值的必要文件下載到本地服務器中重新歸類、定期總結并進行編目;同時在Marc格式856字段中增加地址鏈接,以達到宣傳和運用的目的。對于未獲得授權的,如果讀者確有需求,也可積極與相關機構進行協商,獲取使用授權、或打印有限數量,裝訂成冊,供讀者出于科研目的在小范圍內使用。
鑒于目標內容較為龐大,中國國家圖書館作為國內該領域的開拓者,技術經驗尚不豐富。因此建議首先選取一部分資源進行實驗,逐步拓展。目前部分資源的版權問題已經解決,下一步需要的是網絡采集技術與硬件方面的支持,還有一部分版權問題需要以國家圖書館名義進行溝通、協商,需要館方支持。
此外,數字資源一旦被獲取或建立,圖書館就開始承擔對其提供永久訪問的任務。因此需要在實踐中逐步總結網絡資源的長期保存政策、技術和標準,使其符合主流技術標準和通用的計算機設備要求;并隨數據存儲技術的不斷發展進行數據更新與維護。將這些資源進行長期保存,從而保證圖書館現有和將來的研究需求能夠得到滿足。
4. 結束語
國家圖書館是國家總書庫,是國內文獻的最終查詢庫,是外文文獻的最大收藏地并代表國家執行相應對外文化協議,承擔聯合國及其相關機構等重要國際組織和部分外國政府出版物的托存圖書館職責。國際組織和外國政府出版物作為國家圖書館的特色館藏資源之一,中國國家圖書館負責收藏、管理各種形式的國際組織和外國政府出版物,為國家政府部門、國家重點科研院所及廣大公眾提供信息服務。文獻收藏量目前居國內之首。可以說,其文獻信息資源建設和開發利用的程度,代表了國家級的水平。對于中國科技進步和經濟、社會發展具有尤為重要的意義。針對實體型文獻向網絡出版的轉化,需要與時俱進。將文獻情報研究的對象范圍不斷拓展,結合業務實踐制定新的館藏建設策略、完善特色館藏資源建設。努力保障用戶對原生數字資源和網絡資源的永久訪問,充分為政府部門決策規劃提供依據,增強決策的科學性和準確性,滿足用戶的文獻服務需求,使國際政治經濟、文化等各方面信息得到更廣泛的傳播和利用。進一步拓深服務內涵,提高知識服務能力和文獻管理水平,更好地行使國家圖書館的專藏資源建設職責。原載《農業圖書情報學刊》2014年第12期