隨著互聯(lián)網(wǎng)向社會各領域的滲透,“大數(shù)據(jù)”已經(jīng)成為網(wǎng)絡時代的新關鍵詞。大數(shù)據(jù)現(xiàn)象的出現(xiàn)引起了自然科學和人文社會科學的關注和研究。對此,法學亦不例外。一方面,大數(shù)據(jù)時代的法律問題成為法學研究選題①,進一步影響到法學學科的發(fā)展②。另一方面,大數(shù)據(jù)的運用也成為政法實踐關注的對象,并影響到社會綜合治理手段的發(fā)展。2014年4月22日,中央政法委書記孟建柱在第一期政法領導干部學習貫徹習近平總書記重要講話精神專題培訓班開班式講話中就提到大數(shù)據(jù)的運用問題[1]。隨著2015年9月5日《國務院關于印發(fā)大數(shù)據(jù)發(fā)展行動綱要的通知》(國發(fā)[2015]50號)的公布,法律大數(shù)據(jù)時代在某種意義上已經(jīng)到來。然而,大數(shù)據(jù)時代不僅意味著法學研究選題的增加,政法管理手段的變化,更涉及到法學研究的范式轉(zhuǎn)化。伴隨著數(shù)據(jù)科學對傳統(tǒng)學科,如社會學、語言學等的影響[2]296-297,法學領域亦出現(xiàn)了探討大數(shù)據(jù)對法學研究的意義,如白建軍、胡凌、丁春燕等研究者的一些討論。但是,數(shù)據(jù)科學對法學的沖擊尚未受到法學界的真正重視。一方面,一些法律大數(shù)據(jù)研究模式未能有效地被探討,另一方面,法律大數(shù)據(jù)研究依然被視為傳統(tǒng)實證法學研究的延續(xù)。這兩種傾向均說明深入探討大數(shù)據(jù)時代法學研究發(fā)展方向的必要性。
一、大數(shù)據(jù)對法學科研活動的挑戰(zhàn)
盡管大數(shù)據(jù)概念并無普適的界定,但是通常認為大數(shù)據(jù)具有四個維度,即Volume(超大)、Veloci?ty(高速)、Variety(多樣)、Value(價值巨大但密度很低)[3]。大數(shù)據(jù)現(xiàn)象的出現(xiàn)給科研活動帶來了新的挑戰(zhàn),因為科研活動的本質(zhì)是以數(shù)據(jù)為中心的研究。作為科研活動重要組成部分之一的法學研究也必須正視大數(shù)據(jù)所帶來的挑戰(zhàn)。在數(shù)據(jù)數(shù)量上,法學研究所處理的法律數(shù)據(jù)在不斷增加。傳統(tǒng)法學研究所需要的法學文獻資料是非常少的。在涉及某個具體法律問題時,法學研究者在一定程度上可以窮盡相關文獻資料。即使內(nèi)。在法律數(shù)據(jù)庫出現(xiàn)之后,法學研究者在法學文獻資料的利用方面更為方便,法律數(shù)據(jù)規(guī)模也有大幅度的增加。但是,就某一個時點而言,法學文獻資料仍然是有限的。然而,大數(shù)據(jù)時代海量數(shù)據(jù)的出現(xiàn)將使法學研究者面臨法學文獻資料處理的難題,因為這些法學文獻資料數(shù)量大大超出了以往法學研究者個人閱讀能力所能處理的范圍。在這種情況下,法學研究者不得不借助計算機來處理相關文獻資料。無論是法律法規(guī)數(shù)量還是法律案件數(shù)量,其利用規(guī)模越來越大。根據(jù)統(tǒng)計,截至2016年2月29日,各級人民法院已經(jīng)公布生效裁判文書1570.7萬余篇,每天新增近4萬篇,其中包含維吾爾語、蒙古語、藏語、朝鮮語、哈薩克語5種民族語言的裁判文書,總訪問量達4.78億人次,日均訪問量達58萬人次[4]57。
可以預見,互聯(lián)網(wǎng)中類似裁判文書的法律數(shù)據(jù)數(shù)量將與日俱增。例如,互聯(lián)網(wǎng)可能蘊含著大量偵查破案所需要的信息,需要注意互聯(lián)網(wǎng)用于偵查的資源、工具和方法[5]。雖然海量的法律數(shù)據(jù)因容易保存利用,給法學研究提供了豐富而便捷的資料來源,但數(shù)據(jù)爆炸難題也給法學研究帶來了沉重的數(shù)據(jù)負擔。這種數(shù)據(jù)負擔并不是任何一個法學研究者所能承受的。在數(shù)據(jù)傳輸速度上,法學研究所處理的法律數(shù)據(jù)在不斷更新。傳統(tǒng)法學研究所處理的法學文獻資料在一個時間段內(nèi)處于相對穩(wěn)定的狀態(tài)。在某種意義上說,當法學研究者開始研究法律問題時,相關法學文獻資料均是過時的法律數(shù)據(jù)。雖然通過研究以往的法律數(shù)據(jù)能夠了解法律問題的來龍去脈,但是這種法律數(shù)據(jù)畢竟是“死”數(shù)據(jù),無法及時更新。更重要的是,法學研究者在收集、處理數(shù)據(jù)時往往費時費力,有時必須建立自己熟悉的團隊來專門處理法學文獻資料。其效率顯然難以適應大數(shù)據(jù)時代對數(shù)據(jù)處理能力的實時性要求。可以說,法學研究者尚難以做到開展實時法學研究,從而使法學研究與法律實踐需求之間存在一定的時間差。
在數(shù)據(jù)種類上,法學研究所面臨的數(shù)據(jù)呈現(xiàn)多樣化態(tài)勢。傳統(tǒng)法學研究者所面臨的數(shù)據(jù)類型較為單一,主要是法學圖書、報紙和期刊等載體中的文字信息。伴隨著法學文獻資料的日益數(shù)字化,法學研究數(shù)據(jù)種類也在開始發(fā)生變化,如互聯(lián)網(wǎng)中的文字信息。但是這些文字信息基本上是結構化數(shù)據(jù)。然而,大數(shù)據(jù)時代所處理的數(shù)據(jù)類型不僅有人工生成的數(shù)據(jù),而且有機器生成的數(shù)據(jù)。這些數(shù)據(jù)類型包括了文字、圖片、音頻、視頻、表格等,而且常常相互并存。例如,互聯(lián)網(wǎng)時代所出現(xiàn)的網(wǎng)站、博客、微博、論壇等均出現(xiàn)了大量包含不同數(shù)據(jù)類型的法律數(shù)據(jù)。通常來說,法學研究僅僅關注結構性數(shù)據(jù),而不關注非結構性數(shù)據(jù),因為后者難以納入法學研究的范圍。然而,非結構性數(shù)據(jù)對于法學研究并不是毫無意義的,如圖片和視頻可以作為法律證據(jù)。這就需要尋找更好的方法來進行處理,否則大量數(shù)據(jù)始終游離于法學研究之外。此外,即使是結構性數(shù)據(jù),由于傳統(tǒng)紙質(zhì)媒體和網(wǎng)絡媒體格式的差異,法學研究者要充分利用也必須尋找合適的轉(zhuǎn)換工具。
在數(shù)據(jù)價值密度上,法學研究面臨著數(shù)據(jù)意義的挖掘課題。傳統(tǒng)法學研究者往往關注具有學術意義的法律數(shù)據(jù),如司法個案、裁判文書、法律文獻。這些數(shù)據(jù)本身附著的價值較高,而且數(shù)據(jù)密度也較高。在大數(shù)據(jù)時代,數(shù)據(jù)規(guī)模巨大,很多單獨的數(shù)據(jù)在研究者看來可能毫無意義,但是如果將大量單獨的數(shù)據(jù)放在一起,尋找出彼此的相關性,那么這種數(shù)據(jù)就具有巨大的價值。例如,法學研究者常常關注司法者對法律問題的看法,卻很少關注司法者個人信息情況。如果能夠收集司法人員的個人數(shù)據(jù)、從事的法律業(yè)務等個人數(shù)據(jù),那么對法律的理解或許有不同的看法。盡管不少研究通過社會學方法收集了不同群體的法律數(shù)據(jù),但是這些數(shù)據(jù)的樣本范圍是非常有限的。而在互聯(lián)網(wǎng)時代,不同群體往往通過網(wǎng)絡參與法律過程,從而在網(wǎng)絡空間留下了大量數(shù)據(jù),這些數(shù)據(jù)可能密度很低,但是一旦集合形成規(guī)模,其顯然對社會具有較大的影響。這就需要法學研究者關注這些價值大但密度低的法律數(shù)據(jù)。顯然,法學研究者尚難以展開有效的數(shù)據(jù)挖掘工作。正因為如此,法律大數(shù)據(jù)研究就成為大數(shù)據(jù)時代法學研究首先面對的課題,否則法學研究將繼續(xù)固步自封,難以適應時代的發(fā)展。
二、當前法學研究的大數(shù)據(jù)傾向
所謂大數(shù)據(jù)研究,就是利用大數(shù)據(jù)技術進行研究!霸诳茖W研究方面,大數(shù)據(jù)將改變傳統(tǒng)的研究方法。通過遙感裝置、感應器、計算機收集數(shù)據(jù)或模擬方法獲取的密集型數(shù)據(jù),經(jīng)過計算機軟件處理,產(chǎn)生的信息/知識被存儲在計算機中,科學家們只需在后臺利用數(shù)據(jù)管理和統(tǒng)計的方法對數(shù)據(jù)進行處理、分析,獲取知識!保6]對于人文社會科學而言,其意味著出現(xiàn)了開放與全過程研究、碎片化重組研究和計算分析研究三種新的思維[7]。事實上,當前法律領域已經(jīng)出現(xiàn)了利用大數(shù)據(jù)進行法學研究的現(xiàn)象。隨著法學研究實證化程度的提高,定量分析方法在法學研究中日益流行。法學研究者常通過社會學方法收集大量數(shù)據(jù)來進行統(tǒng)計分析,從而賦予法學研究以大數(shù)據(jù)色彩。這就有必要審視目前法律領域中的大數(shù)據(jù)研究,以此了解此類研究的發(fā)展情況。
。ㄒ唬┊斍胺深I域中的大數(shù)據(jù)研究類型
為了便于識別法律領域中的大數(shù)據(jù)研究類型,這里姑且從海量數(shù)據(jù)收集和處理這個特征來進行分析。目前,其大致有以下類型:
第一,政法輿情分析;ヂ(lián)網(wǎng)輿情分析是大數(shù)據(jù)時代數(shù)據(jù)運用的典型之一,因為“通過互聯(lián)網(wǎng)傳播的信息中包含了網(wǎng)民對當前各種社會現(xiàn)象以及熱點問題的立場和觀點,涉及政治、經(jīng)濟、軍事、娛樂、體育、衛(wèi)生、科技、個人生活等多個領域。網(wǎng)絡輿論最直接、最快速地反映了各個層面的社會輿情狀況與發(fā)展態(tài)勢,已成為社會政治、經(jīng)濟、文化等相關重要領域的社會輿情晴雨表,受到國家和各級政府的高度重視”[8]201。隨著傳統(tǒng)媒體網(wǎng)絡化,不少媒體機構紛紛建立相應的輿情分析機構,如人民網(wǎng)輿情監(jiān)測室[9]。而政法輿情分析顯然與法律領域關系密切,最為典型的輿情監(jiān)測機構是法制網(wǎng)輿情監(jiān)測中心[10]。根據(jù)介紹,法制網(wǎng)輿情監(jiān)測系統(tǒng)采用分布式采集技術,監(jiān)測范圍涵蓋國內(nèi)外約14000家網(wǎng)站頻道(包括新聞資訊、論壇/社區(qū)/貼吧、微博、博客、電子報刊、視頻等),每天定向抓取信息超過50萬條,并通過強大的元搜素引擎靈活定制監(jiān)測項目,共同形成龐大的輿情信息數(shù)據(jù)庫,為及時、精確發(fā)現(xiàn)輿情信息提供可靠的技術保障[11]。在分析框架方面,其不再局限于事件本身的分析,而是關注政法輿情動態(tài)發(fā)展過程,分析不同群體及其人員對事件的看法,并提供相應的對策建議。以浙江吳英案為例,其分為事件概述、事件回顧、輿情走勢、調(diào)查數(shù)據(jù)、輿情聚焦、相關言論、媒體觀察和輿情點評[12]84-92。這種通過一定技術采集大量數(shù)據(jù)進行分析的研究模式顯然是傳統(tǒng)法學研究所難以企及的。由于法制網(wǎng)主要關注法制類資訊,因此,可以視為較為典型的大數(shù)據(jù)研究。
第二,法治國情調(diào)查。法治國情調(diào)查嚴格意義上來說并不是通過純粹挖掘互聯(lián)網(wǎng)數(shù)據(jù)進行研究,而是通過實地調(diào)查等實證方法收集大量數(shù)據(jù)并結合互聯(lián)網(wǎng)數(shù)據(jù)進行研究。在這方面,以中國社會科學院法學研究所法治國情調(diào)查研究室為例,該研究室的職能是在理論聯(lián)系實際的基礎上,對法學和法治建設進行實證調(diào)查和數(shù)量分析,分析中國法治建設的走向;在研究方法上,除了采用定性的分析方法外,重視采用定量的方法,通過調(diào)查問卷、實地考察、量化評估、統(tǒng)計分析等社會學研究方法,為法學研究提供第一手的資料和數(shù)據(jù)[13]。從該研究室的運作模式來看,其類似于專門性的收和分析數(shù)據(jù)的組織。以2012年中國政府透明度年度報告為例,其研究模式分為三個方面:一是選擇調(diào)研對象。2012年,調(diào)研組選擇59個國務院部門、26個省級政府、43個較大的市的政府,對其實施政府信息公開制度的情況進行調(diào)研測評。二是設定指標。調(diào)研組建立了國務院部門、省級政府和較大的市的政府信息公開測評指標體系。三是調(diào)研方法。在調(diào)研過程中,除了采取觀察的方法對相關政府網(wǎng)站的欄目和信息進行瀏覽外,還對有關的信息鏈接、檢索系統(tǒng)、依申請公開平臺等的有效性進行了實際驗證[14]165-166。其研究步驟幾乎為其他研究報告所采用。從該研究室主持出版的年度法治藍皮書來看,其所收集的互聯(lián)網(wǎng)信息也是非常豐富的。但是,這種研究模式并不具備大數(shù)據(jù)研究的特征,因為數(shù)據(jù)收集和處理仍然主要依托人工來展開,而且數(shù)據(jù)類型依然是靜態(tài)數(shù)據(jù)。
第三,法律數(shù)據(jù)庫分析。隨著法學文獻資料的數(shù)字化發(fā)展,法律數(shù)據(jù)庫獲得了迅猛發(fā)展,如中國知網(wǎng)等綜合性數(shù)據(jù)庫中的法律數(shù)據(jù)、北大法寶等專業(yè)性數(shù)據(jù)庫中的法律數(shù)據(jù)。法學研究者也越來越依賴于數(shù)據(jù)庫所提供的法律數(shù)據(jù),不僅通過數(shù)據(jù)庫了解法學動態(tài),而且利用數(shù)據(jù)庫資料進行研究。其中,比較典型的是通過法學作者、法學引文、法學期刊等數(shù)據(jù)來分析中國法學現(xiàn)狀和趨勢。通常來說,研究者往往通過南京大學中國社會科學研究評價中心所開發(fā)的中文社會科學引文索引(CSSCI)來進行分析。通過該工具,可以從來源文獻和被引文獻兩個方面向研究人員提供相關研究領域的前沿信息和各學科學術研究發(fā)展的脈搏,通過不同學科、領域的相關邏輯組配檢索,挖掘?qū)W科新的生長點,展示實現(xiàn)知識創(chuàng)新的途徑[15]。其他涉及法律文獻的數(shù)據(jù)庫所提供的研究模式和CSSCI基本相同。由于這種數(shù)據(jù)庫所收錄的數(shù)據(jù)量非常大,因此,其表面上似乎具有大數(shù)據(jù)研究色彩。但是,數(shù)據(jù)庫所收集的法律數(shù)據(jù)只是數(shù)字化的結構性數(shù)據(jù),且數(shù)據(jù)收錄時間與數(shù)據(jù)產(chǎn)生時間具有相當長的間隔,因此法律數(shù)據(jù)庫雖然拓展了法學研究的資料范圍,但是并未從根本上改變傳統(tǒng)法學研究模式。所以,嚴格意義上來說,政法輿情分析才屬于大數(shù)據(jù)時代法學研究類型。對于任何一個個體法學研究者而言,這種研究模式遠遠超出了自身的數(shù)據(jù)處理能力范圍。這種現(xiàn)象無疑值得人們深思。
。ǘ┊斍胺深I域中大數(shù)據(jù)研究面臨的問題
在某種意義上說,法學研究很少關注數(shù)據(jù)問題研究。即使討論數(shù)據(jù)的運用,其數(shù)據(jù)處理技術也是非常初級的。正如有學者指出:“人文社科的研究者對數(shù)據(jù)處理采用的方法以描述性統(tǒng)計等初級方法為主,初級方法在法學、社會學、管理學等學科的實證數(shù)據(jù)研究中占了較大比例!保16]而大數(shù)據(jù)雖然給法學研究提供了新的課題,但并沒有改變傳統(tǒng)法學研究的數(shù)據(jù)處理方式。這說明當前法律領域中大數(shù)據(jù)研究面臨著諸多問題。
第一,靜態(tài)法律數(shù)據(jù)多,動態(tài)法律數(shù)據(jù)少。傳統(tǒng)法學研究的對象是靜態(tài)法律數(shù)據(jù)。這些數(shù)據(jù)經(jīng)過編輯處理從而成為人們所熟知的結構性數(shù)據(jù),非常容易被利用。即使在數(shù)字化之后,雖然其改變了存儲數(shù)據(jù)的載體,但是仍然屬于靜態(tài)法律數(shù)據(jù)。而對于動態(tài)法律數(shù)據(jù),傳統(tǒng)法學研究幾乎不予關注。盡管在研究過程中常常引用互聯(lián)網(wǎng)上出現(xiàn)的數(shù)據(jù),但是這些數(shù)據(jù)依然屬于靜態(tài)法律數(shù)據(jù)。而互聯(lián)網(wǎng)實時產(chǎn)生的動態(tài)法律數(shù)據(jù)要求關注數(shù)據(jù)存在的特定時空條件,時刻關注法律數(shù)據(jù)的演變過程,及時分析人們對法律問題的基本動向。加上動態(tài)法律數(shù)據(jù)往往和其他相關數(shù)據(jù)相混雜,使人們利用數(shù)據(jù)增加了新的難度。正因為如此,法學研究者尚難以研究動態(tài)法律數(shù)據(jù)。
第二,法律數(shù)據(jù)分析多,法律模型分析少。毫無疑問,大數(shù)據(jù)研究要求通過數(shù)據(jù)挖掘來發(fā)現(xiàn)數(shù)據(jù)的意義。法律數(shù)據(jù)分析就成為法學研究的必修課。然而,僅僅通過數(shù)據(jù)分析并不是法學研究的真正目標,因為學術研究的目標是對社會現(xiàn)象進行可重復性驗證研究。這意味著法學研究必須要像自然科學那樣開展建模分析工作,即通過數(shù)據(jù)分析,建立相應的理論模型,以便對法律現(xiàn)象開展深入分析。法學研究不能就數(shù)據(jù)論數(shù)據(jù),而要抽象出相應的理論模型,從而建立起具有科學色彩的學科體系。前述政法輿情分析雖然通過采用和以往社會學研究方法不同的大數(shù)據(jù)技術,能夠及時了解政法動態(tài),但是其研究方式和傳統(tǒng)法學研究并無太大的差別。因為法律模型分析意味著需要借助計算科學技術方法,所以也難以為法學研究者所重視。
第三,法律規(guī)范數(shù)據(jù)多,法律行為數(shù)據(jù)少。傳統(tǒng)法學研究是以法律規(guī)范為中心而展開的研究,因此法律法規(guī)數(shù)據(jù)和司法案例數(shù)據(jù)成為法學研究關注的重點。隨著法律的社會科學研究的展開,經(jīng)濟學、政治學、社會學、人類學、文化學等學科知識對法學研究日益滲透,形成了諸多交叉性研究方式。但是,法律規(guī)范理解的研究方式始終是法學研究的主流。而動態(tài)數(shù)據(jù)在大數(shù)據(jù)時代地位的日益凸顯必然使法律規(guī)范數(shù)據(jù)的地位有所下降,而與動態(tài)數(shù)據(jù)相關的法律行為數(shù)據(jù)的重要性就更為明顯,因為法律行為數(shù)據(jù)涉及到參與法律過程的所有人。這種法律行為數(shù)據(jù)雖然可以通過行為法學、法律認知科學等學科的發(fā)展而獲得,但是這些研究尚處于法學研究的邊緣地帶。大數(shù)據(jù)研究恰恰需要法學研究關注法律行為數(shù)據(jù),以便通過行為分析來了解法律規(guī)范背后社會各類群體的法律行為選擇。
三、大數(shù)據(jù)時代法學研究的發(fā)展方向
毫無疑問,目前法律大數(shù)據(jù)研究難以適應大數(shù)據(jù)時代的需要。盡管自然科學和人文社會科學對大數(shù)據(jù)的理解不同,但是大數(shù)據(jù)對學科的影響是有目共睹的。其中最為關鍵的是計算方式的革命性變化。“各種跡象表明,繼物理計算和生物計算之后,社會計算可能成為科學計算研發(fā)的新焦點,并產(chǎn)生新的方向和領域。”[8]社會計算主要有兩個層面:一是從技術層面來說,就是計算機或者更廣義信息技術在社會活動中的應用;二是從社會層面來說,就是社會知識或者更具體的人文知識在計算機或信息技術中的使用和嵌入,從而提高社會活動的效益和水平[17]。也有學者提出:“社會計算是一門現(xiàn)代計算技術與社會科學之間的交叉學科,一種以科學技術手段對社會問題進行數(shù)量化和實時化分析的技術。這是一個社會行為和計算系統(tǒng)交叉融合而成的研究領域,研究如何利用計算系統(tǒng)幫助人們進行溝通與協(xié)作,如何利用計算技術研究社會運行的規(guī)律與發(fā)展趨勢!保18]社會計算意味著社會科學研究的智能化發(fā)展。正是因為如此,2009年,《科學》雜志提出了“計算社會科學”這一名稱[19]。事實上,經(jīng)濟學領域已經(jīng)出現(xiàn)了“計算經(jīng)濟學”[20]105。而社會學領域則于2014年提出了“計算社會學”[21]。事實上,自然科學領域早已出現(xiàn)了“計算物理學”等學科概念[22]。這些以社會計算為中心的新學科實際上集中體現(xiàn)了大數(shù)據(jù)時代對不同學科的影響。需要注意的是,這種計算社會科學或者計算自然科學,不同于以往計量社會科學或者計量自然科學。因此,盡管法學同其他社會科學不同,但是法學研究要適應大數(shù)據(jù)時代的發(fā)展,必然要關注法學研究的智能化發(fā)展。因此,法律大數(shù)據(jù)研究必然要求法學研究走向社會計算化,從而能夠像自然科學那樣研究法律現(xiàn)象。
首先,從學科發(fā)展來看,社會計算要求法學走向計算化。2009年,十五位學者在《科學》雜志上發(fā)表題為《計算社會科學》的文章,指出現(xiàn)代網(wǎng)絡生活促使計算社會科學的產(chǎn)生,與傳統(tǒng)社會科學通過問卷調(diào)查形式獲得數(shù)據(jù)不同,可以借助種種新技術獲得長時間的、連續(xù)的、大量人群的各種行為和互動的數(shù)據(jù),這些數(shù)據(jù)為研究動態(tài)的人際交流、大型社會網(wǎng)絡的演化等方面的問題提供了堅實的基礎[23]。顯然,現(xiàn)代網(wǎng)絡生活所產(chǎn)生的數(shù)據(jù)必然包含大量與法律領域相關的數(shù)據(jù),這就要求法學研究關注這些數(shù)據(jù),并通過這些數(shù)據(jù)分析社會領域的法律問題,發(fā)現(xiàn)社會運行規(guī)律。要實現(xiàn)這一點,法學研究必須走向計算社會科學。
筆者以為,從學科發(fā)展的需要來看,可以仿照其他學科將運用大數(shù)據(jù)技術進行法學研究的學科命名為“計算法學”。從歷史發(fā)展來看,計算法學雖然具有計量法學的一些特征,但是具有本質(zhì)上的差異。通常認為,“計量法學是指通過收集大樣本數(shù)據(jù),對具有數(shù)量變化關系的法律現(xiàn)象進行計量研究的獨立交叉學科”[24]。而計算法學超越了計量法學,在本質(zhì)上歸屬于“數(shù)據(jù)密集型科學”,“這一范式以數(shù)據(jù)為中心來思考、設計和實施科學研究,科學發(fā)現(xiàn)依賴于對海量數(shù)據(jù)的收集和分析處理”[20]。只有實現(xiàn)從計量法學向計算法學的發(fā)展,法學在大數(shù)據(jù)時代的空間才會更廣闊。
其次,從方法發(fā)展來看,社會計算要求法學研究方法走向智能化。正如前述,社會計算本質(zhì)上是一種計算方法論。這種方法論不同于以往的物理計算方法和生物計算方法!吧鐣嬎悴豢杀苊獾厣婕瓣P于人與社會及其相關人文知識的系統(tǒng),而相對于有限資源,在本質(zhì)上,無法對社會計算系統(tǒng)通過獨立分析其各部分的行為來確定其整體行為,也不能在大時間和空間范圍內(nèi)預先確定其行為。因此,需采用整體論而不是還原論來研究社會計算問題;可能性而不是確定性,應成為社會計算研究的主要特征。同時,必須考慮將‘主觀性的傾向’引入社會計算,正視這方面研究的主觀性和心理作用!保8]社會計算研究必然既涉及整體又涉及部分;既涉及過去和現(xiàn)在,也關注未來;既涉及客觀性,也關注主觀性。這種研究方法從方法論上來說既是價值研究,也是實證研究,從而出現(xiàn)了定性和定量綜合的研究特征。而目前法學研究方法偏重于價值研究,其重點在于法律解釋。即使在法學實證研究中,其數(shù)據(jù)樣本往往有限。需要注意的是,盡管隨著數(shù)據(jù)庫技術的發(fā)展,實證法學研究所利用的樣本量獲得了大幅度增加,但是這種增加并沒有完全改變法學研究的研究方法。例如,中國裁判文書網(wǎng)公布了大量的裁判文書,對裁判文書的研究將是未來法學實證研究的重點,但是由于這種裁判文書數(shù)據(jù)的獲得并不是社會演變的實時數(shù)據(jù),仍然是通過人為取樣方式來獲取的靜態(tài)數(shù)據(jù)。更為重要的是,社會計算方法無論是對法律解釋研究還是法律實證研究者來說均是非常陌生的,因為這種計算方式是智能化的計算方式,單純依賴個人自身力量是難以及時處理的,這就需要通過智能化的社會計算方法來幫助法學研究者。
最后,從素質(zhì)發(fā)展來看,社會計算要求法學研究者素質(zhì)走向數(shù)據(jù)化。盡管法學研究本身是以法律規(guī)范和法律個案等數(shù)據(jù)為研究對象,因此數(shù)據(jù)分析對于法學研究者來說并不陌生。隨著法律數(shù)據(jù)的增加,法學研究者可以借助計算機來完成數(shù)據(jù)的處理工作。然而,大數(shù)據(jù)時代海量數(shù)據(jù)的出現(xiàn)使法學研究者數(shù)據(jù)分析素質(zhì)越來越高。要具備數(shù)據(jù)分析的高素質(zhì),就必須要求法學研究者不僅掌握法學知識,而且要掌握自然科學等學科知識。然而,通常來說,法學研究者只熟悉法學文獻資料,而且也不具備其他學科的知識背景和技術儲備,因為從歷史來看,“法學與哲學、經(jīng)濟學、社會學等哲學社會科學的緊密相連,但值得人深思的是,法學在引進新的研究方法上與其他的學科相差很遠”[25]。
從前述大數(shù)據(jù)類型來看,大數(shù)據(jù)時代法學研究者必須要和政府、公司等擁有龐大數(shù)量數(shù)據(jù)的組織互相合作。這種現(xiàn)象在一定程度上改變了法學研究生態(tài)。法學研究者不能僅僅依賴于個人力量,即使建立了相應的團隊,其團隊成員的知識背景也將是豐富多彩的,不能僅僅局限于法學領域,而必須同時具備計算科學、社會學、統(tǒng)計學等相關知識背景。這就要求法學研究者首先是一個優(yōu)秀的數(shù)據(jù)分析者,才能適應大數(shù)據(jù)時代的需要。
四、法律大數(shù)據(jù)研究的路徑選擇
要實現(xiàn)法學研究的社會計算化,就必須重新思考當前法律領域的大數(shù)據(jù)研究。這意味著法學研究必須借助于自然科學方法才能開展大數(shù)據(jù)研究。可以預見,在未來相當長時間內(nèi),傳統(tǒng)法學研究仍然難以擺脫原有的數(shù)據(jù)利用方式?偟膩碚f,大數(shù)據(jù)時代必然驅(qū)使法學走向“計算法學”,充分利用智能化技術來研究法律數(shù)據(jù),分析法律問題。從理論界來看,許多學科已經(jīng)開始將大數(shù)據(jù)技術納入學科運用之中。2014年10月25日,清華大學公共管理學院舉辦“大數(shù)據(jù)與公共風險治理論壇”[26]。2014年11月18日,由南京郵電大學牽頭發(fā)起的“中國法律大數(shù)據(jù)聯(lián)盟”正式成立,該聯(lián)盟發(fā)起單位包括北京大學法學院、清華大學信息科學與技術國家實驗室、工業(yè)和信息化部電信研究院知識產(chǎn)權中心、南京郵電大學信息產(chǎn)業(yè)發(fā)展戰(zhàn)略研究院、中國政法大學企業(yè)法務管理研究中心、北京郵電大學網(wǎng)絡技術研究院、法制網(wǎng)、新華網(wǎng)信息化頻道、北京高通律師事務所、北京德和衡律師事務所、亞太網(wǎng)絡法律研究中心等多家機構,宗旨是探究法律大數(shù)據(jù)驅(qū)動下的立法研究、法學研究、法律應用和法律服務的升級和轉(zhuǎn)型,共同推動法律大數(shù)據(jù)在國家立法、司法以及法學研究和法律服務等領域的廣泛應用。中國法律大數(shù)據(jù)聯(lián)盟將聯(lián)合不同領域的組織機構和專家學者設立理事會和專家委員會,并聯(lián)合成立中國法律大數(shù)據(jù)研究中心,編制《中國法律大數(shù)據(jù)藍皮書》、組織法律大數(shù)據(jù)學術研討會、構建法律大數(shù)據(jù)與云服務平臺,探究法律大數(shù)據(jù)在法治國家、法治政府、法治社會一體化建設中的作用[27]。更有學者進一步提出:“法律大數(shù)據(jù)的研究與應用將成為法學研究的一個創(chuàng)新型領域,必須給予高度關注!保28]
而從實踐來看,隨著對大數(shù)據(jù)問題的重視,中央和地方紛紛開展大數(shù)據(jù)運用。一方面,中央政法部門日益開始強調(diào)大數(shù)據(jù)在政法工作中的作用[29。2015年5月15日,中央政法委舉辦全國百萬政法干警學習科技新知識講座,其中,廣東結合本省公安工作實踐,講解了提升大數(shù)據(jù)時代運用先進科技打擊犯罪、服務人民群眾的探索和成效[30]。另一方面,一些地方開始將互聯(lián)網(wǎng)運用于政法工作之中,如山東政法部門出現(xiàn)了“互聯(lián)網(wǎng)+政法”的做法[31]。
特別值得注意的是,特定領域大數(shù)據(jù)運用方式更是不斷推出。在司法改革領域,大數(shù)據(jù)主要運用于案件分析、人案測算、業(yè)績評價、交互評價、推動ADR發(fā)展、評價司法改革之中[32]。在政府管理領域,不少地方已經(jīng)開始建立各種數(shù)據(jù)平臺[33]。在基層治理中,大數(shù)據(jù)新手段也開始發(fā)揮作用[34]。從這些動向來看,大數(shù)據(jù)已在學科層面得以廣泛關注并在實踐中得以運用。
這就提出了一個問題:法學研究將如何作為?由于社會計算方法為大多數(shù)法學研究者并不熟悉,因此,要保證法律大數(shù)據(jù)研究順利展開,就必須尋找合適的研究領域。在某種意義上,法學研究要如實踐部門那樣收集到全部數(shù)據(jù)是不可能的。但是伴隨著數(shù)據(jù)開放程度的提高,法學研究將有可能收集到相關數(shù)據(jù)并開展相關研究。通常認為,計算社會科學是一門理工管文相結合的交叉學科,研究范圍廣泛,其有三條研究主線:一是研究人,從點到面,從對個人興趣的分析到社會關系分析,直至社會網(wǎng)絡分析;二是研究信息,從對信息內(nèi)容的解析到話題發(fā)現(xiàn)和話題傳播;三是研究人和信息的屬性,包括傾向性、可信度和影響力[35]。而從美國社會學界已經(jīng)發(fā)表的研究成果來看,其大致包括以下相互關聯(lián)的五大內(nèi)容:大數(shù)據(jù)的獲取與分析、質(zhì)性研究與定量研究的融合、互聯(lián)網(wǎng)社會實驗研究、計算機社會模擬研究和新型社會計算工具的研制與開發(fā)[21]。由于國外法律大數(shù)據(jù)研究更多地包括在社會學領域,因此在某種意義上也可以視為未來法律大數(shù)據(jù)研究的發(fā)展方向。因此,基于社會計算應用領域和當前大數(shù)據(jù)應用的實踐動態(tài),筆者以為,法律大數(shù)據(jù)研究可以從以下三個方面入手:
其一,要關注動態(tài)法律數(shù)據(jù)整合分析。法學研究必須在關注靜態(tài)法律數(shù)據(jù)分析的同時關注動態(tài)法律數(shù)據(jù)。動態(tài)法律數(shù)據(jù)不僅是法律領域的數(shù)據(jù),也包括與法律相關的其他數(shù)據(jù)。隨著網(wǎng)絡社會的不斷發(fā)展,動態(tài)法律數(shù)據(jù)在網(wǎng)絡中得以保留。例如,人們通過博客、微博、微信等渠道交流對法律問題的看法,在法律活動中使用網(wǎng)絡來發(fā)表對案件的看法,甚至將法律資料存儲在網(wǎng)絡空間之中。而隨著電子政務的發(fā)展,政府網(wǎng)站所公布的法律數(shù)據(jù)也日益增加。特別是,不少政法單位也紛紛利用社交媒體來發(fā)布信息。法學研究要充分挖掘新媒體載體上的法律數(shù)據(jù),從而使法律問題的研究更加深入。在這方面,法學研究就必須要了解數(shù)據(jù)科學,熟練運用數(shù)據(jù)技術。
其二,要展開法律社會分析。傳統(tǒng)法學研究是以法律個案為中心的,因此其所關注的是司法者個體,側重點在于司法者對法律規(guī)范的理解。隨著實證研究的展開,司法者的其他數(shù)據(jù)如司法認知、司法行為等亦納入了研究框架之中。但此類研究始終停留在個體思維研究范式之上。而法律大數(shù)據(jù)研究就不僅關注司法者對個案的判決,而且要將個案置于特定的時空條件下來進行分析。更重要的是,其必須關注社會群體的法律認知和行為數(shù)據(jù),進而對不同社會群體進行分析。這就需要法學研究不能囿于個案分析,而必須將法律活動視為一個社會系統(tǒng),深入分析法律社會演變的運行規(guī)律。
其三,要開展法律預測分析。傳統(tǒng)法學研究的重心是對法律規(guī)范的理解,集中體現(xiàn)在通過對法律規(guī)范的解釋為法律的適用提供理論依據(jù)。雖然這種研究能夠預測法律適用的可能性。但是其預測功能在法學研究中并不是主要的,而且僅限于司法者作出裁判行為的范圍之內(nèi)。至于法律過程中的參與者(如律師、當事人等)的行為預測相對來說較少,更不用說對法律在社會發(fā)展中的作用進行預測。然而,大數(shù)據(jù)時代由于人們頻繁地通過網(wǎng)絡進行溝通和互動,使得人們的行為軌跡能夠被網(wǎng)絡設備所記錄。例如,當事人可能會通過網(wǎng)絡了解法律,發(fā)表對自己案件的看法。又如,律師也常常借助網(wǎng)絡了解法律實務情況。在這種情況下,法律數(shù)據(jù)不僅有法律規(guī)范理解的數(shù)據(jù),也有法律行為人行動的數(shù)據(jù)。通過對這些法律數(shù)據(jù)的綜合分析,人們能夠更加準確地評估法律事件的發(fā)展,從而積極調(diào)整自己的行為方向。法律預測功能在大數(shù)據(jù)時代將發(fā)揮更加突出的作用。因此,法律決策模式將發(fā)生深刻的變化,其不僅能夠預測法律個體的行動邏輯,也能發(fā)現(xiàn)法律社會的運行規(guī)律。
五、結語
當然,大數(shù)據(jù)時代對法學研究所提出的任務是非常復雜的。隨著網(wǎng)絡社會的進一步發(fā)展,法律大數(shù)據(jù)研究將會更為廣泛。法律領域大數(shù)據(jù)研究的展開意味著大數(shù)據(jù)時代已經(jīng)對法學研究產(chǎn)生了一定的影響。但是這種影響從目前來看非常有限。這既有法學本身的原因,更與大數(shù)據(jù)時代所具備的社會條件和技術條件不成熟有關。正如尤瓦爾·赫拉利2016年4月22日在《人類的崛起與未來》講演中所指出,21世紀正向著這樣一個新的方向走去,我們越來越希望所有的大問題或者說艱難問題的答案,不再來自于人類的感受,而是基于一些來自外部的數(shù)據(jù)處理系統(tǒng)做出的一些分析[36。法學研究也有必要考慮大數(shù)據(jù)時代所帶來的深刻影響。一旦社會和技術條件具備,走向基于社會計算的法學研究才真正具有現(xiàn)實的可能性。當然,這并不意味著傳統(tǒng)法學研究將毫無用武之地。毋寧說,傳統(tǒng)法學研究將會融合到一種更為高級的法學研究形態(tài)之中去。原載于《東南大學學報(哲學社會科學版)》2017年第2期