大數據環境下法學研究方法面臨“變”與“不變”,法學研究者在明確“變”與“不變”的基礎上應主動求變,掌握法律信息檢索的通用方法。
一、大數據環境下法學研究的“變”與“不變”
(一)大數據環境下法學研究的“變”
大數據環境下法學研究的“變”指法學研究外在環境的變化,如信息生產方式、信息載體的變化,以及由此帶來的法學研究者信息需求和信息利用方式的變化。
大數據是當下時髦的一個用詞,但大數據之大卻是常人難以想象的。“一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多,相當于美國兩年的紙質信件數量;發出的社區帖子達200萬個,相當于《時代》雜志770年的文字量。”[1]大數據環境下信息生產量的變化如此巨大,與此同時,傳統印刷型紙質文獻信息已不再是信息載體的唯一形式,機讀型、視聽型、多媒體等新型文獻信息載體大量出現,電子化或數字型信息越來越成為信息載體的主流。數字出版、數字圖書館、數字閱讀等也得到越來越多的人關注和接受。
與傳統印刷型紙質文獻信息相比,數字型信息之所以成為主流是由其特點決定的:第一、容易獲取,它在網絡所及的任何時間、任何地點都可以瀏覽、下載和利用;第二,更新速度快,數據出版大大縮短了文獻信息發表和更新的時間;第三、數據便攜性,移動硬盤、U盤等信息存儲器的“身材”日益變小、“容量”日益變大;第四、低成本,信息獲取者可以更加快速或免費的獲取;第五、分享便利,社會網站的出現使得信息分享變得輕而易舉。[2]
信息載體由紙本到數字,信息需求和利用由一元到多元的根本性轉變已成為未來發展趨勢。從普通大眾到某一學科的學習或研究群體的信息需求和利用方式都發生了質的變化。
聯合國國際電信聯盟(ITU)表示,2014年全球上網人數已超過30億人,相當于世界人口的39%,同時,根據報告中公布的最新數據顯示,全球互聯網使用率仍繼續穩步增長。[3]進入新世紀,中國在短短的幾年內超過了美國,成為了全球網民數量最多的國家。截至2014年12月,我國網民規模達6.49億,其中搜索引擎網民規模為5.22億,使用率為80.5%,比2013年增長6.7%。搜索引擎是網民除即時通信外使用率最高的互聯網應用。搜索引擎作為互聯網的基礎應用,隨著網民規模的擴大而持續增加。[4]
進一步研究發現,伴隨著計算機、互聯網等新技術成長起來的信息用戶被稱為Google一代、網絡族、數字部落、數字移民[5]、Y一代[6],他們對電腦、手機、網絡的依賴就像一日三餐一樣。他們習慣于用鍵盤打字而不用紙筆寫字,通過手機等移動終端閱讀而不到圖書館讀紙本書,……[7]傳統上作為圖書收藏中心的圖書館,數字資源也正成為主要方面,[8]對數字資源的利用也是全球法學研究者獲取學術信息的主要方式。
美國教育部教育統計國家中心每兩年對全美學術性圖書館的調查顯示,在美國學術性圖書館信息資源經費總投入中,電子資源達到了73.8%,相應的信息服務八成以上是圍繞電子資源開展的,如虛擬參考咨詢、文獻傳遞(通過網絡傳遞電子資源)等。[9]而專業圖書館則更強調學科電子資源的導航、數據庫利用培訓以及信息檢索課等信息服務形式。如2013年倫敦大學David Gee教授對全球124個法律圖書館的調查顯示,87%的法律圖書館針對電子資源提供法律信息檢索培訓。[10]
印度德里法律大學副館長Priya Rai對印度德里地區的法律研究者,包括法律大學、大學法學院、法學研究中心、法學研究所等機構的本科生、研究生、教師和研究人員在內的528人,作了一個關于法學研究者獲取信息行為的調查,調查發現,96.6%的法學研究者使用電子資源,僅3.4%的人使用紙質資源來完成學習和研究。[11]
本人在2013年秋季通過對中國人民大學法律碩士二年級模擬法庭班的54名學生(來自法學各個研究方向)的問卷調查顯示,他們在查找資料時95%的人首先會選擇電子資源,僅5%的人首先選擇紙本資料。
(二)大數據環境下法學研究的“不變”
法學研究的“不變”首先是法學研究方法本身,也就是法律思維或法律分析方法未變,其次是作為法學研究對象的法律信息的類型未變。
法學研究方法,或法律思維是指導法學研究領域的一套模式,是“找出問題、尋找規則、分析和應用、得出結論”的過程,包括法律問題是什么,對此問題適用的規則是什么,規則適用的情況有哪些,以及能得出什么樣的結論。
進入21世紀,新興學科在法學領域的滲透逐漸加深,法學研究者除了需要學習和關注傳統與法律領域密切相關的學科知識外,還需要了解與法學交叉學科的發展,需要用一種更加廣闊的視野來學習和借鑒其有益于法學領域發展的多樣的方法。但是法學研究方法或法律思維是由法律學科特點決定的,法律學科特點未變,法學研究方法或法律思維也未變。
除此之外,法律信息的類型也沒有變化。關于法律信息或法律文獻的類型,國內外從不同角度都有論述,但是一般認為涉及以下三種:一是原始(一次)法律資源,指有法律約束力的資源,如法律法規(法條、成文法),判例法國家還應該包括判例;二是二次法律資源,指不具有法律約束力但和法律問題相關的法律評論文章、專著、法律詞典、法律百科全書等;三是用來幫助解決特定法律問題所需要的非法律信息。
本人既不是圖書館專家,也不是法律專家,關于法律文獻的類型不敢妄加斷言,只是有感于在法律圖書館工作并結合給法學院學生作檢索培訓和上法律文獻檢索課的一些體會,將法學研究者最常用的文獻列舉如下:立法文件、司法文件、學者著述,以及新聞報道、統計數據、年鑒、詞典工具書等。以上這些類型的信息,過去和未來都是法學研究必不可少的。
二、大數據環境下法學研究者應主動應變
大數據環境對法學研究的影響是深遠的,它能為法學研究者提供符合其研究習慣的法律信息。但由于法律信息涉及古今中外與法律學科相關的所有知識,卷帙浩繁、錯綜復雜,今天的法學研究者并不一定清楚什么時候以及怎樣使用紙本資源和電子資源。找到對解決法律問題真正有幫助的文獻,研究者可能做出高質量的研究成果,而找不到則研究工作無從開始。從某種程度上來說,法律信息的檢索決定著法學研究的成敗。
比起紙本時代,今天找到一個法律問題的答案確實比以前容易多了,但是要找到一個恰當的、全面的答案的確需要一定的檢索技能。[12]掌握法律信息檢索技能,意味著研究者在遇到法律問題時能夠快速判斷、敏銳鎖定信息源,并能夠熟練地獲取、科學的評價、合理的運用這一信息,因此可以大大節省研究者的時間。有研究表明研究者花在查找資料上的時間占了其總投入研究時間的1/3-1/2。試想,如果我們把節省的時間集中用到知識的創新上,無疑將推動整個法律科學的發展。
對法律從業者來說,掌握法律文檢索技能也意義重大。“在民主社會,法律信息對于有效的司法是至關重要的。”[13]法官的判案過程實際上就是一個尋找法律信息的過程,尤其是法官在遇到比較復雜的案子時,更需要具備找到合適法律信息的技巧。法官找法的技巧實際上在一定程度上影響著司法的公正。對于律師來說,法律文獻檢索技能決定了他為當事人辯護的成敗。一個律師為某一案件事實不恰當的援引法律不僅浪費當事人的時間和金錢,還有可能被當事人訴至法庭,名利俱損。[14]
三、大數據環境下法律信息檢索通用方法(一般檢索步驟)
大數據開啟了一個新的世界,需要法學研究者主動求變,認識到法律信息檢索的重要性,掌握這一技能的要領,從而輕松開創有效的研究工作。
法律信息檢索是一項技能,需要不斷練習,形成一種習慣。它的基本檢索步驟或方法包括:分析課題、選取關鍵詞、選擇數據庫、選擇字段(檢索范圍)以及檢索結果評價。
(一)分析課題
在開始檢索法律文獻之前,首先需要對課題做認真詳細的考察分析,明確檢索的目標和要求,有的放矢是成功的開始。分析課題需要考慮以下幾個方面:
根據課題目的為求新、求全、還是求準,確定需要檢索的具體內容。比如求新,檢索用來規范某種行為如公司注冊、食品安全在某國現行有效的法律條文以及判例法國家有法律約束力最新判例;檢索對某個新問題的權威評論文章。求全,檢索關于某個法律問題研究的整個發展脈絡的文獻,如檢索各國文化立法研究、中國歷代審判制度研究的相關文獻。求準,如檢索某部法律、某個司法案例或判例、某篇文章、某一組或某項數據等等。
根據以上信息進一步確定需要檢索的文獻的類型,如法律法規或成文法、司法案例、判例、專著、評論文章、新聞報道、統計數據等等;文獻涉及的國別,如歐盟法律文件、美國法律信息(聯邦/州)、其他國家法律信息等等;文獻涉及的語種,如查找印度礦產資源立法的中文譯本、中國關于知識產權立法的英文譯本等。
一個成功的檢索,通常需要檢索者掌握一定課題相關的背景知識。如果事先我們沒有相關背景知識的積累也不要緊,一些小的檢索工具可以幫上大忙。它們可以提供課題相關的介紹性或背景知識,幫我們甄別檢索文獻的“新、全、準”。
如法律百科全書、維基百科、綜述性論文、或者有條件的直接向課題相關的專家咨詢。
這些背景知識往往可以給我們提供檢索點。檢索點是檢索的開始,許多法律文獻檢索項目最難的是找到第一個相關文獻。這第一個文獻信息會帶給你很多相關的文獻。如一個判例通常會援引更早的相關判例作為法律依據,一部立法會指向有關的法律決定、立法史文件、以及其他專著、學說、年鑒、百科全書等二次文獻,一篇法律評論文章會參考很多相關文獻。[15]
(二)選取關鍵詞
選用能夠涵蓋課題主要主題概念的詞,或者能夠表達課題中心意思的詞,選用意義明確的詞。專有名詞要用引號引起來,如查找霧霾的相關法律規制、精神病患者作證等相關文獻,“霧霾”一定不能分成“霧”和“霾”,“精神病患者”一定不能分開“精神病”和“患者”。選用有實質意義的概念詞,不要使用過長詞組和短語,必要時可拆分成幾個關鍵詞,如我國農民養老保險的新規定,可以拆分成“農民”、“養老保險”和“法律”三個關鍵詞。
很多時候,同一個意思可以用不同的詞來表達,因此關鍵詞的同義詞或近義詞的運用也可以擴展檢索范圍,如查找電子地圖的知識產權問題查不到理想結果的時候,可以換成網絡地圖知識產權或者虛擬地圖知識產權來重新檢索。
或者通過一個詞的上位概念和下位概念來擴大和縮小檢索范圍,在確定關鍵詞時不妨運用頭腦風暴法來想一下和主題相關的所有的詞,以最先想到的恰當的關鍵詞為中心向更深更廣的角度擴展。如查找快餐中雞肉的食品安全法律問題,由雞肉想到禽類再到動物,可以擴大查找范圍;反之由動物到禽類再到雞肉則可以縮小檢索范圍。
通常在選取關鍵詞時最容易犯的錯誤是,理所當然的認為所選的關鍵詞是相關法域最標準的表述,實際上不然,所以常常檢索不到想要的結果。最常見的是查找臺灣地區的法律信息,如查找有關知識產權的相關法律規定,選取“知識產權”作為關鍵詞,在臺灣的法律專業數據庫中無論如何也找不到,因為相應的關鍵詞表述為“智慧財產權”。還有查找國外有關優質(戰略)礦產資源的立法,如果將“優質和戰略”直譯成“good and strategic”,肯定找不到結果。[16]這需要借助權威法律詞典,如在線元照英美法詞典、Westlaw的Black's\Thesaurus、Google和維基百科等查閱已有文獻的表述,或者瀏覽Westlaw和Lexis的自然語言檢索結果搜尋關鍵詞的標準表述。
同時,如果關鍵詞不止一個,檢索時需要注意二者之間的邏輯關系,一般數據庫默認為同時出現在文檔選定的位置,如兩個關鍵詞同時出現在文章的標題部分。具體介紹詳見本書技能訓練篇。
(三)選擇數據庫
法學研究者在著手檢索時常常會發現不知道到哪兒去找相關信息,他們希望法律數據庫能超越Google和百度,在一個檢索框中輸入關鍵詞,就可以將所有信息一網打盡。數據庫開發商們也絞盡腦汁想把法律數據庫整合在一個平臺上,如國內外的很多發現系統正嘗試著做到這一點。從目前的研究進展來看,發現系統對電子書和論文檢索還不錯,但還未能將法律法規(成文法、法條)、司法案例、判例等有效地發現出來,因此還非常有必要對法學專業數據庫有一個大致了解。
國內外法律專業數據庫收錄的內容各有特色,有的又互相交叉,明確數據庫的大致收錄情況,就可以結合課題的目的和要求確定必查或重點查找的數據庫。根據法律文獻的特點和法學研究者的研究習慣,將首選的數據庫歸納如下:表中未注明的為數據更新到當前的全文數據庫,表中涉及的數據庫基本為法律商業數據庫,免費法律資源文后會有詳細介紹。
(四)選擇字段(檢索范圍)
字段在數據庫中對應的英文表述有“field”或“segment”,可以理解為“檢索范圍”把,即將一篇文檔分成若干部分,如標題、摘要、作者信息、全文等,選擇字段實際上就是選擇課題關鍵詞在整個文檔中出現的位置,如希望課題關鍵詞在一篇論文的標題部分出現,就要選擇相應的字段,如下圖所示。
字段也可以理解為在數據庫中檢索的限制條件,字段選擇的不同,可以擴大或者縮小檢索范圍。最常用的檢索字段有標題、作者(著者)、摘要、主題(包括篇名、關鍵詞、摘要,課題關鍵詞在一篇文檔的這三個部分的任一部分出現都可以檢索出來),常用字段大多數情況下能夠幫助找到和課題相關的材料。有時用課題關鍵詞在常用字段里檢索都沒找到合適結果,還會用到全文檢索,全文檢索需要觀察該數據庫是否同時提供了限制“詞頻”的功能,避免產生很多不相關的檢索結果。如知網、Heinonline和Westlaw都提供了全文檢索加“詞頻”的功能。
中文法律信息的檢索字段比較容易選擇,外文數據庫字段對應的中文意思歸納為下表[17]。
(五)檢索結果評價
在完成了上述分析課題、選取關鍵詞、選擇數據庫和字段幾個步驟后,進入查看檢索結果階段,檢索結果有多有少、甚至為零。這時通過如下幾個方面來評價檢索結果。
首先,通過一些小工具判斷相關的檢索結果是不是最新的,如中文法律法規可以通過北大法寶查看該法是否現行有效,中文司法案例可以結合北大法寶和“慧科搜索數據庫”瀏覽案例的進展,外文法律法規和判例可以通過Westlaw的Keycite功能、Lexis的Shapedize功能來判斷法律法規和判例的效力問題。此外,還可以利用一些網站的推送功能,Westlaw和Lexis的alert功能對特定法律主題進行定制,這樣系統就可以定期將該主題的最新進展信息發送到指定郵箱。
其次,關注課題相關法律信息的來源,轉載的信息一定要找到原始出處,有多個來源的注意選擇其中比較權威的,如某學者的參會論文同時在法學專業數據庫電子期刊上刊登、會議組織網站和個人博客上發表,要優先選擇數據庫電子刊刊登的版本,因為這些付費的商業數據庫信息大多都經過嚴格的審查程序才會收錄某文獻。如果都是免費網絡資源,則要看清楚這些網站地址的后綴,優先選擇以gov結尾的政府網站,其次是以org結尾的學術組織,知名學者的個人博客中的信息也可以參考。
再次,對于檢索非常具體的一個問題中的有關方面、一個或一組數據,為了保證準確,除了上述幾點要考慮,還要將檢索到的信息放到特定的語境中對比觀察,運用常識判斷是否準確。如檢索到2013年全國有關部門的信訪總量數據,和已知的前幾年數據相比有了明顯的下降(前幾年信訪總量穩定上升),這就需要對檢索到的2013年的數據持懷疑態度。后進一步對信訪檢索發現,2013年5月我國政法委信訪改革指出涉法涉訴信訪將一律改由政法機關處理[18],打消了疑慮,可以放心的用2013年的數據了。
最后,檢索了很多文獻,該如何判斷是不是查全了,什么時候結束這項工作?如果在篩選檢索結果時不斷看到案例或判例引用同樣的法律法規(判例法國家可能是有約束力的判例),或絞盡腦汁窮盡了課題的關鍵詞及其同義詞(近義詞),檢索到的相關文獻總是重復出現,令人振奮的是可以停止檢索了。反之,如果查詢結果出入很大,則需要審視前述幾個環節,分析原因,進一步查找。對于檢索不到任何結果的,則需要變換檢索關鍵詞和修正檢索方式,從頭再來。法律文獻檢索是一項反反復復的過程,無怪乎國外稱其為“Legal Research”,真的是“re-search”的過程,需要耐心和技巧。(本文選自《推開法律信息檢索之門》一書內容)
新書推介:
《推開法律信息檢索之門》
作者: 劉明 人民大學法學院圖書館
中國政法大學出版社
出版時間:2015.4
16開,259頁
定價:39元
《推開法律信息檢索之門》特色評論
本書根據法學研究者的信息需求和研究習慣,結合作者日常解答咨詢、培訓和授課的體會編寫而成。全書共分為四篇,包括理論方法篇、技能訓練篇、應用篇和附錄。首先是介紹法律信息檢索的通用方法或步驟;其次是按照法學研究常用的文獻類型分類演示具體檢索方法;再次是法律信息檢索在法學研究中的具體應用;后附上法學研究常用數據庫的使用指南。該書特點是將復雜的檢索方法分解成幾個步驟,并用圖示或圖解的方法展示,使用者可一目了然地了解檢索技巧。
《推開法律信息檢索之門》目錄
前言
第一章法律信息檢索理論方法
第一節大數據環境下法學研究的“變”與“不變”
第二節大數據環境下法學研究者應主動應變
第三節大數據環境下法律信息檢索通用方法
第二章一次法律資源檢索技能
第一節 中外法律法規(成文法)檢索
第二節 中外案例(判例)檢索
第三章二次法律資源檢索技能
第一節 中外期刊論文檢索
第二節 中外博碩士學位論文檢索
第三節 中外電子圖書檢索
第四章其他信息資源檢索技能
第一節政府信息檢索
第二節免費網絡法律資源檢索
第三節 我國臺灣地區“法律”信息檢索
第四節美國法律資源檢索
第五章法律信息檢索綜合應用
第一節如何利用信息檢索撰寫法學文獻綜述
第二節 如何利用電子資源跟蹤法學學科前沿
第三節如何利用電子資源檢索課題相關文獻
第四節如何利用信息檢索完成案例分析