隨著互聯網向社會各領域的滲透,“大數據”已經成為網絡時代的新關鍵詞。大數據現象的出現 引起了自然科學和人文社會科學的關注和研究。對此,法學亦不例外。一方面,大數據時代的法律問題成為法學研究選題①,進一步影響到法學學科的發展②。另一方面,大數據的運用也成為政法實踐關注的對象,并影響到社會綜合治理手段的發展。2014年4月22日,中央政法委書記孟建柱在第一期政法領導干部學習貫徹習近平總書記重要講話精神專題培訓班開班式講話中就提到大數據的運用問題[1]。隨著2015年9月5日《國務院關于印發大數據發展行動綱要的通知》(國發[2015]50號)的公布,法律大數據時代在某種意義上已經到來。然而,大數據時代不僅意味著法學研究選題的增加,政法管理手段的變化,更涉及到法學研究的范式轉化。伴隨著數據科學對傳統學科,如社會學、語言學等的影響[2],法學領域亦出現了探討大數據對法學研究的意義,如白建軍、胡凌、丁春燕等研究者的一些討論。但是,數據科學對法學的沖擊尚未受到法學界的真正重視。一方面,一些法律大數據研究模式未能有效地被探討,另一方面,法律大數據研究依然被視為傳統實證法學研究的延續。這兩種傾向均說明深入探討大數據時代法學研究發展方向的必要性。
一、大數據對法學科研活動的挑戰
盡管大數據概念并無普適的界定,但是通常認為大數據具有四個維度,即Volume(超大)、Veloci-ty(高速)、Variety(多樣)、Value(價值巨大但密度很低)[3]。大數據現象的出現給科研活動帶來了新的挑戰,因為科研活動的本質是以數據為中心的研究。作為科研活動重要組成部分之一的法學研究也必須正視大數據所帶來的挑戰。在數據數量上,法學研究所處理的法律數據在不斷增加。傳統法學研究所需要的法學文獻資料是非常少的。在涉及某個具體法律問題時,法學研究者在一定程度上可以窮盡相關文獻資料。即使在實證研究中,研究者通過社會學方法收集了大量的數據,這些數據仍然在人力所能解決的范圍之內。在法律數據庫出現之后,法學研究者在法學文獻資料的利用方面更為方便,法律數據規模也有大幅度的增加。但是,就某一個時點而言,法學文獻資料仍然是有限的。然而,大數據時代海量數據的出現將使法學研究者面臨法學文獻資料處理的難題,因為這些法學文獻資料數量大大超出了以往法學研究者個人閱讀能力所能處理的范圍。在這種情況下,法學研究者不得不借助計算機來處理相關文獻資料。無論是法律法規數量還是法律案件數量,其利用規模越來越大。根據統計,截至2016 年2月29日,各級人民法院已經公布生效裁判文書1570.7萬余篇,每天新增近4萬篇,其中包含維吾爾語、蒙古語、藏語、朝鮮語、哈薩克語5種民族語言的裁判文書,總訪問量達4.78億人次,日均訪問量達58萬人次[4]。可以預見,互聯網中類似裁判文書的法律數據數量將與日俱增。例如,互聯網可能蘊含著大量偵查破案所需要的信息,需要注意互聯網用于偵查的資源、工具和方法[5]。雖然海量的法律數據因容易保存利用,給法學研究提供了豐富而便捷的資料來源,但數據爆炸難題也給法學研究帶來了沉重的數據負擔。這種數據負擔并不是任何一個法學研究者所能承受的。 在數據傳輸速度上,法學研究所處理的法律數據在不斷更新。傳統法學研究所處理的法學文獻資料在一個時間段內處于相對穩定的狀態。在某種意義上說,當法學研究者開始研究法律問題時,相關法學文獻資料均是過時的法律數據。雖然通過研究以往的法律數據能夠了解法律問題的來龍去脈,但是這種法律數據畢竟是“死”數據,無法及時更新。更重要的是,法學研究者在收集、處理數據時往往費時費力,有時必須建立自己熟悉的團隊來專門處理法學文獻資料。其效率顯然難以適應大數據時代對數據處理能力的實時性要求。可以說,法學研究者尚難以做到開展實時法學研究,從而使法學研究與法律實踐需求之間存在一定的時間差。 在數據種類上,法學研究所面臨的數據呈現多樣化態勢。傳統法學研究者所面臨的數據類型較為單一,主要是法學圖書、報紙和期刊等載體中的文字信息。伴隨著法學文獻資料的日益數字化,法學研究數據種類也在開始發生變化,如互聯網中的文字信息。但是這些文字信息基本上是結構化數據。然而,大數據時代所處理的數據類型不僅有人工生成的數據,而且有機器生成的數據。這些數據類型包括了文字、圖片、音頻、視頻、表格等,而且常常相互并存。例如,互聯網時代所出現的網站、博客、微博、論壇等均出現了大量包含不同數據類型的法律數據。通常來說,法學研究僅僅關注結構性數據,而不關注非結構性數據,因為后者難以納入法學研究的范圍。然而,非結構性數據對于法學研究并不是毫無意義的,如圖片和視頻可以作為法律證據。這就需要尋找更好的方法來進行處理,否則大量數據始終游離于法學研究之外。此外,即使是結構性數據,由于傳統紙質媒體和網絡媒體格式的差異,法學研究者要充分利用也必須尋找合適的轉換工具。 在數據價值密度上,法學研究面臨著數據意義的挖掘課題。傳統法學研究者往往關注具有學術意義的法律數據,如司法個案、裁判文書、法律文獻。這些數據本身附著的價值較高,而且數據密度也較高。在大數據時代,數據規模巨大,很多單獨的數據在研究者看來可能毫無意義,但是如果將大量單獨的數據放在一起,尋找出彼此的相關性,那么這種數據就具有巨大的價值。例如,法學研究者常常關注司法者對法律問題的看法,卻很少關注司法者個人信息情況。如果能夠收集司法人員的個人數據、從事的法律業務等個人數據,那么對法律的理解或許有不同的看法。盡管不少研究通過社會學方法收集了不同群體的法律數據,但是這些數據的樣本范圍是非常有限的。而在互聯網時代,不同群體往往通過網絡參與法律過程,從而在網絡空間留下了大量數據,這些數據可能密度很低,但是一旦集合形成規模,其顯然對社會具有較大的影響。這就需要法學研究者關注這些價值大但密度低的法律數據。顯然,法學研究者尚難以展開有效的數據挖掘工作。 正因為如此,法律大數據研究就成為大數據時代法學研究首先面對的課題,否則法學研究將繼續固步自封,難以適應時代的發展。
二、當前法學研究的大數據傾向
所謂大數據研究,就是利用大數據技術進行研究。“在科學研究方面,大數據將改變傳統的研究方法。通過遙感裝置、感應器、計算機收集數據或模擬方法獲取的密集型數據,經過計算機軟件處理,產生的信息、知識被存儲在計算機中,科學家們只需在后臺利用數據管理和統計的方法對數據進行處理、分析,獲取知識。”[6] 對于人文社會科學而言,其意味著出現了開放與全過程研究、碎片化重組研究和計算分析研究三種新的思維[7]。事實上,當前法律領域已經出現了利用大數據進行法學研究的現象。隨著法學研究實證化程度的提高,定量分析方法在法學研究中日益流行。法學研究者常常通過社會學方法收集大量數據來進行統計分析,從而賦予法學研究以大數據色彩。這就有必要審視目前法律領域中的大數據研究,以此了解此類研究的發展情況。
(一)當前法律領域中的大數據研究類型
為了便于識別法律領域中的大數據研究類型,這里姑且從海量數據收集和處理這個特征來進行分析。目前,其大致有以下類型:
第一,政法輿情分析。互聯網輿情分析是大數據時代數據運用的典型之一,因為“通過互聯網傳播的信息中包含了網民對當前各種社會現象以及熱點問題的立場和觀點,涉及政治、經濟、軍事、娛樂、體育、衛生、科技、個人生活等多個領域。網絡輿論最直接、最快速地反映了各個層面的社會輿情狀況與發展態勢,已成為社會政治、經濟、文化等相關重要領域的社會輿情晴雨表,受到國家和各級政府的高度重視”[8]。
隨著傳統媒體網絡化,不少媒體機構紛紛建立相應的輿情分析機構,如人民網輿情監測室[9]。而政法輿情分析顯然與法律領域關系密切,最為典型的輿情監測機構是法制網輿情監測中心[10]。根據介紹,法制網輿情監測系統采用分布式采集技術,監測范圍涵蓋國內外約14000 家網站頻道(包括新聞資訊、論壇、社區、貼吧、微博、博客、電子報刊、視頻等),每天定向抓取信息超過 50萬條,并通過強大的元搜素引擎靈活定制監測項目,共同形成龐大的輿情信息數據庫,為及時、精確發現輿情信息提供可靠的技術保障[11]。在分析框架方面,其不再局限于事件本身的分析,而是關注政法輿情動態發展過程,分析不同群體及其人員對事件的看法,并提供相應的對策建議。以浙江吳英案為例,其分為事件概述、事件回顧、輿情走勢、調查數據、輿情聚焦、相關言論、媒體觀察和輿情點評[12]。這種通過一定技術采集大量數據進行分析的研究模式顯然是傳統法學研究所難以企及的。由于法制網主要關注法制類資訊,因此,可以視為較為典型的大數據研究。
第二,法治國情調查。法治國情調查嚴格意義上來說并不是通過純粹挖掘互聯網數據進行研究,而是通過實地調查等實證方法收集大量數據并結合互聯網數據進行研究。在這方面,以中國社會科學院法學研究所法治國情調查研究室為例,該研究室的職能是在理論聯系實際的基礎上,對法學和法治建設進行實證調查和數量分析,分析中國法治建設的走向;在研究方法上,除了采用定性的分析方法外,重視采用定量的方法,通過調查問卷、實地考察、量化評估、統計分析等社會學研究方法,為法學研究提供第一手的資料和數據[13]。從該研究室的運作模式來看,其類似于專門性的收集和分析數據的組織。以2012年中國政府透明度年度報告為例,其研究模式分為三個方面:
一是選擇調研對象。2012年,調研組選擇59個國務院部門、26個省級政府、43個較大的市的政府,對其實施政府信息公開制度的情況進行調研測評。
二是設定指標。調研組建立了國務院部門、省級政府和較大的市的政府信息公開測評指標體系。
三是調研方法。在調研過程中,除了采取觀察的方法對相關政府網站的欄目和信息進行瀏覽外,還對有關的信息鏈接、檢索系統、依申請公開平臺等的有效性進行了實際驗證[14]。
其研究步驟幾乎為其他研究報告所采用。從該研究室主持出版的年度法治藍皮書來看,其所收集的互聯網信息也是非常豐富的。但是,這種研究模式并不具備大數據研究的特征,因為數據收集和處理仍然主要依托人工來展開,而且數據類型依然是靜態數據。
第三,法律數據庫分析。隨著法學文獻資料的數字化發展,法律數據庫獲得了迅猛發展,如中國知網等綜合性數據庫中的法律數據、北大法寶等專業性數據庫中的法律數據。法學研究者也越來越依賴于數據庫所提供的法律數據,不僅通過數據庫了解法學動態,而且利用數據庫資料進行研究。其中,比較典型的是通過法學作者、法學引文、法學期刊等數據來分析中國法學現狀和趨勢。通常來說,研究者往往通過南京大學中國社會科學研究評價中心所開發的中文社會科學引文索引(CSSCI)來進行分析。通過該工具,可以從來源文獻和被引文獻兩個方面向研究人員提供相關研究領域的前沿信息和各學科學術研究發展的脈搏,通過不同學科、領域的相關邏輯組配檢索,挖掘學科新的生長點,展示實現知識創新的途徑[15]。其他涉及法律文獻的數據庫所提供的研究模式和CSSCI基本相同。由于這種數據庫所收錄的數據量非常大,因此,其表面上似乎具有大數據研究色彩。但是,數據庫所收集的法律數據只是數字化的結構性數據,且數據收錄時間與數據產生時間具有相當長的間隔,因此法律數據庫雖然拓展了法學研究的資料范圍,但是并未從根本上改變傳統法學研究模式。所以,嚴格意義上來說,政法輿情分析才屬于大數據時代法學研究類型。對于任何一個個體法學研究者而言,這種研究模式遠遠超出了自身的數據處理能力范圍。這種現象無疑值得人們深思。
(二)當前法律領域中大數據研究面臨的問題
在某種意義上說,法學研究很少關注數據問題研究。即使討論數據的運用,其數據處理技術也是非常初級的。正如有學者指出:“人文社科的研究者對數據處理采用的方法以描述性統計等初級方法為主,初級方法在法學、社會學、管理學等學科的實證數據研究中占了較大比例。”[16] 而大數據雖然給法學研究提供了新的課題,但并沒有改變傳統法學研究的數據處理方式。這說明當前法律領域中大數據研究面臨著諸多問題。
第一,靜態法律數據多,動態法律數據少。傳統法學研究的對象是靜態法律數據。這些數據經過編輯處理從而成為人們所熟知的結構性數據,非常容易被利用。即使在數字化之后,雖然其改變了存儲數據的載體,但是仍然屬于靜態法律數據。而對于動態法律數據,傳統法學研究幾乎不予關注。盡管在研究過程中常常引用互聯網上出現的數據,但是這些數據依然屬于靜態法律數據。而互聯網實時產生的動態法律數據要求關注數據存在的特定時空條件,時刻關注法律數據的演變過程,及時分析人們對法律問題的基本動向。加上動態法律數據往往和其他相關數據相混雜,使人們利用數據增加了新的難度。正因為如此,法學研究者尚難以研究動態法律數據。
第二,法律數據分析多,法律模型分析少。毫無疑問,大數據研究要求通過數據挖掘來發現數據的意義。法律數據分析就成為法學研究的必修課。然而,僅僅通過數據分析并不是法學研究的真正目標,因為學術研究的目標是對社會現象進行可重復性驗證研究。這意味著法學研究必須要像自然科學那樣開展建模分析工作,即通過數據分析,建立相應的理論模型,以便對法律現象開展深入分析。法學研究不能就數據論數據,而要抽象出相應的理論模型,從而建立起具有科學色彩的學科體系。前述政法輿情分析雖然通過采用和以往社會學研究方法不同的大數據技術,能夠及時了解政法動態,但是其研究方式和傳統法學研究并無太大的差別。因為法律模型分析意味著需要借助計算科學技術方法,所以也難以為法學研究者所重視。
第三,法律規范數據多,法律行為數據少。傳統法學研究是以法律規范為中心而展開的研究,因此法律法規數據和司法案例數據成為法學研究關注的重點。隨著法律的社會科學研究的展開,經濟學、政治學、社會學、人類學、文化學等學科知識對法學研究日益滲透,形成了諸多交叉性研究方式。 但是,法律規范理解的研究方式始終是法學研究的主流。而動態數據在大數據時代地位的日益凸顯 必然使法律規范數據的地位有所下降,而與動態數據相關的法律行為數據的重要性就更為明顯,因為法律行為數據涉及到參與法律過程的所有人。這種法律行為數據雖然可以通過行為法學、法律認知科學等學科的發展而獲得,但是這些研究尚處于法學研究的邊緣地帶。大數據研究恰恰需要法學研究關注法律行為數據,以便通過行為分析來了解法律規范背后社會各類群體的法律行為選擇。
三、大數據時代法學研究的發展方向
毫無疑問,目前法律大數據研究難以適應大數據時代的需要。盡管自然科學和人文社會科學對大數據的理解不同,但是大數據對學科的影響是有目共睹的。其中最為關鍵的是計算方式的革命性變化。“各種跡象表明,繼物理計算和生物計算之后,社會計算可能成為科學計算研發的新焦點,并產生新的方向和領域。”[8]
社會計算主要有兩個層面:一是從技術層面來說,就是計算機或者更廣義信息技術在社會活動中的應用;二是從社會層面來說,就是社會知識或者更具體的人文知識在計算機或信息技術中的使用和嵌入,從而提高社會活動的效益和水平[17]。
也有學者提出:“社會計算是一門現代計算技術與社會科學之間的交叉學科,一種以科學技術手段對社會問題進行數量化和實時化分析的技術。這是一個社會行為和計算系統交叉融合而成的研究領域,研究如何利用計算系統幫助人們進行溝通與協作,如何利用計算技術研究社會運行的規律與發展趨勢。”[18] 社會計算意味著社會科學研究的智能化發展。正是因為如此,2009年,《科學》雜志提出了“計算社會科學”這一名稱[19]。事實上, 經濟學領域已經出現了“計算經濟學”[20]。而社會學領域則于2014年提出了“計算社會學”[21]。事實上,自然科學領域早已出現了“計算物理學”等學科概念[22]。這些以社會計算為中心的新學科實際上集中體現了大數據時代對不同學科的影響。需要注意的是,這種計算社會科學或者計算自然科學, 不同于以往計量社會科學或者計量自然科學。因此,盡管法學同其他社會科學不同,但是法學研究要適應大數據時代的發展,必然要關注法學研究的智能化發展。因此,法律大數據研究必然要求法學研究走向社會計算化,從而能夠像自然科學那樣研究法律現象。 首先,從學科發展來看,社會計算要求法學走向計算化。2009年,十五位學者在《科學》雜志上發表題為《計算社會科學》的文章,指出現代網絡生活促使計算社會科學的產生,與傳統社會科學通過問卷調查形式獲得數據不同,可以借助種種新技術獲得長時間的、連續的、大量人群的各種行為和互動的數據,這些數據為研究動態的人際交流、大型社會網絡的演化等方面的問題提供了堅實的基礎[23]。顯然,現代網絡生活所產生的數據必然包含大量與法律領域相關的數據,這就要求法學研究關注這些數據,并通過這些數據分析社會領域的法律問題,發現社會運行規律。要實現這一點,法學研究必須走向計算社會科學。筆者以為,從學科發展的需要來看,可以仿照其他學科將運用大數據技術進行法學研究的學科命名為“計算法學”。從歷史發展來看,計算法學雖然具有計量法學的一些特征, 但是具有本質上的差異。通常認為,“計量法學是指通過收集大樣本數據,對具有數量變化關系的法律現象進行計量研究的獨立交叉學科”[24]。而計算法學超越了計量法學,在本質上歸屬于“數據密集型科學”,“這一范式以數據為中心來思考、設計和實施科學研究,科學發現依賴于對海量數據的收集和分析處理”[20]。只有實現從計量法學向計算法學的發展,法學在大數據時代的空間才會更廣闊。 其次,從方法發展來看,社會計算要求法學研究方法走向智能化。正如前述,社會計算本質上是 一種計算方法論。這種方法論不同于以往的物理計算方法和生物計算方法。“社會計算不可避免地涉及關于人與社會及其相關人文知識的系統,而相對于有限資源,在本質上,無法對社會計算系統通過獨立分析其各部分的行為來確定其整體行為,也不能在大時間和空間范圍內預先確定其行為。因此,需采用整體論而不是還原論來研究社會計算問題;可能性而不是確定性,應成為社會計算研究的主要特征。同時,必須考慮將‘主觀性的傾向’引入社會計算,正視這方面研究的主觀性和心理作用。”[8]社會計算研究必然既涉及整體又涉及部分;既涉及過去和現在,也關注未來;既涉及客觀性,也關注主觀性。這種研究方法從方法論上來說既是價值研究,也是實證研究,從而出現了定性和定量綜合的研究特征。而目前法學研究方法偏重于價值研究,其重點在于法律解釋。即使在法學實證研究中,其數據樣本往往有限。需要注意的是,盡管隨著數據庫技術的發展,實證法學研究所利用的樣本量獲得了大幅度增加,但是這種增加并沒有完全改變法學研究的研究方法。例如,中國裁判文書網公布了大量的裁判文書,對裁判文書的研究將是未來法學實證研究的重點,但是由于這種裁判文書數據的獲得并不是社會演變的實時數據,仍然是通過人為取樣方式來獲取的靜態數據。更為重要的是,社會計算方法無論是對法律解釋研究還是法律實證研究者來說均是非常陌生的,因為這種計算方式是智能化的計算方式,單純依賴個人自身力量是難以及時處理的,這就需要通過智能化的社會計算方法來幫助法學研究者。 最后,從素質發展來看,社會計算要求法學研究者素質走向數據化。盡管法學研究本身是以法律規范和法律個案等數據為研究對象,因此數據分析對于法學研究者來說并不陌生。隨著法律數據的增加,法學研究者可以借助計算機來完成數據的處理工作。然而,大數據時代海量數據的出現使法學研究者數據分析素質越來越高。要具備數據分析的高素質,就必須要求法學研究者不僅掌握法學知識,而且要掌握自然科學等學科知識。然而,通常來說,法學研究者只熟悉法學文獻資料,而且也不具備其他學科的知識背景和技術儲備,因為從歷史來看,“法學與哲學、經濟學、社會學等哲學社會科學的緊密相連,但值得人深思的是,法學在引進新的研究方法上與其他的學科相差很遠”[25]。
從前述大數據類型來看,大數據時代法學研究者必須要和政府、公司等擁有龐大數量數據的組織互相合作。這種現象在一定程度上改變了法學研究生態。法學研究者不能僅僅依賴于個人力量,即使建立了相應的團隊,其團隊成員的知識背景也將是豐富多彩的,不能僅僅局限于法學領域,而必須同時具備計算科學、社會學、統計學等相關知識背景。這就要求法學研究者首先是一個優秀的數據分析者,才能適應大數據時代的需要。
四、法律大數據研究的路徑選擇
要實現法學研究的社會計算化,就必須重新思考當前法律領域的大數據研究。這意味著法學研究必須借助于自然科學方法才能開展大數據研究。可以預見,在未來相當長時間內,傳統法學研究仍然難以擺脫原有的數據利用方式。總的來說,大數據時代必然驅使法學走向“計算法學”,充分利用智能化技術來研究法律數據,分析法律問題。從理論界來看,許多學科已經開始將大數據技術納入學科運用之中。2014年10月25日,清華大學公共管理學院舉辦“大數據與公共風險治理論壇”[26]。 2014 年11月18日,由南京郵電大學牽頭發起的“中國法律大數據聯盟”正式成立,該聯盟發起單位包括北京大學法學院、清華大學信息科學與技術國家實驗室、工業和信息化部電信研究院知識產權中心、南京郵電大學信息產業發展戰略研究院、中國政法大學企業法務管理研究中心、北京郵電大學網絡技術研究院、法制網、新華網信息化頻道、北京高通律師事務所、北京德和衡律師事務所、亞太網絡法律研究中心等多家機構,宗旨是探究法律大數據驅動下的立法研究、法學研究、法律應用和法律服務的升級和轉型,共同推動法律大數據在國家立法、司法以及法學研究和法律服務等領域的廣泛應用。
中國法律大數據聯盟將聯合不同領域的組織機構和專家學者設立理事會和專家委員會,并聯合成立中國法律大數據研究中心,編制《中國法律大數據藍皮書》、組織法律大數據學術研討會、構建法律大數據與云服務平臺,探究法律大數據在法治國家、法治政府、法治社會一體化建設中的作用[27]。
更有學者進一步提出:“法律大數據的研究與應用將成為法學研究的一個創新型領域,必須給予高度關注。”[28] 而從實踐來看,隨著對大數據問題的重視,中央和地方紛紛開展大數據運用。一方面,中央政法部門日益開始強調大數據在政法工作中的作用[29]。2015年5月15日,中央政法委舉辦全國百萬政法干警學習科技新知識講座,其中,廣東結合本省公安工作實踐,講解了提升大數據時代運用先進科技打擊犯罪、服務人民群眾的探索和成效[30]。另一方面,一些地方開始將互聯網運用于政法工作之中,如山東政法部門出現了“互聯網+政法”的做法[31]。特別值得注意的是,特定領域大數據運用方式更是不斷推出。在司法改革領域,大數據主要運用于案件分析、人案測算、業績評價、交互評價、推動 ADR發展、評價司法改革之中[32]。在政府管理領域,不少地方已經開始建立各種數據平臺[33]。在基層治理中,大數據新手段也開始發揮作用[34]。從這些動向來看,大數據已在學科層面得以廣泛關注并在實踐中得以運用。這就提出了一個問題:法學研究將如何作為? 由于社會計算方法為大多數法學研究者并不熟悉,因此,要保證法律大數據研究順利展開,就必須尋找合適的研究領域。在某種意義上,法學研究要如實踐部門那樣收集到全部數據是不可能的。但是伴隨著數據開放程度的提高,法學研究將有可能收集到相關數據并開展相關研究。
通常認為,計算社會科學是一門理工管文相結合的交叉學科,研究范圍廣泛,其有三條研究主線:一是研究人,從點到面,從對個人興趣的分析到社會關系分析,直至社會網絡分析;二是研究信息,從對信息內容的解析到話題發現和話題傳播;三是研究人和信息的屬性,包括傾向性、可信度和影響力[35]。而從美國社會學界已經發表的研究成果來看,其大致包括以下相互關聯的五大內容:大數據的獲取與分析、質性研究與定量研究的融合、互聯網社會實驗研究、計算機社會模擬研究和新型社會計算工具的研制與開發[21]。
由于國外法律大數據研究更多地包括在社會學領域,因此在某種意義上也可以視為未來法律大數據研究的發展方向。因此,基于社會計算應用領域和當前大數據應用的實踐動態,筆者以為,法律大數據研究可以從以下三個方面入手:
其一,要關注動態法律數據整合分析。法學研究必須在關注靜態法律數據分析的同時關注動態法律數據。動態法律數據不僅是法律領域的數據,也包括與法律相關的其他數據。隨著網絡社會的不斷發展,動態法律數據在網絡中得以保留。例如,人們通過博客、微博、微信等渠道交流對法律問題的看法,在法律活動中使用網絡來發表對案件的看法,甚至將法律資料存儲在網絡空間之中。而隨著電子政務的發展,政府網站所公布的法律數據也日益增加。特別是,不少政法單位也紛紛利用社交媒體來發布信息。法學研究要充分挖掘新媒體載體上的法律數據,從而使法律問題的研究更加深入。在這方面,法學研究就必須要了解數據科學,熟練運用數據技術。
其二,要展開法律社會分析。傳統法學研究是以法律個案為中心的,因此其所關注的是司法者個體,側重點在于司法者對法律規范的理解。隨著實證研究的展開,司法者的其他數據如司法認知、司法行為等亦納入了研究框架之中。但此類研究始終停留在個體思維研究范式之上。而法律大數據研究就不僅關注司法者對個案的判決,而且要將個案置于特定的時空條件下來進行分析。更重要的是,其必須關注社會群體的法律認知和行為數據,進而對不同社會群體進行分析。這就需要法學研究不能囿于個案分析,而必須將法律活動視為一個社會系統,深入分析法律社會演變的運行規律。
其三,要開展法律預測分析。傳統法學研究的重心是對法律規范的理解,集中體現在通過對法律規范的解釋為法律的適用提供理論依據。雖然這種研究能夠預測法律適用的可能性。但是其預測功能在法學研究中并不是主要的,而且僅限于司法者作出裁判行為的范圍之內。至于法律過程中的參與者(如律師、當事人等)的行為預測相對來說較少,更不用說對法律在社會發展中的作用進行預測。
然而,大數據時代由于人們頻繁地通過網絡進行溝通和互動,使得人們的行為軌跡能夠被網絡設備所記錄。例如,當事人可能會通過網絡了解法律,發表對自己案件的看法。又如,律師也常常借助網絡了解法律實務情況。在這種情況下,法律數據不僅有法律規范理解的數據,也有法律行為人行動的數據。通過對這些法律數據的綜合分析,人們能夠更加準確地評估法律事件的發展,從而積極調整自己的行為方向。法律預測功能在大數據時代將發揮更加突出的作用。因此,法律決策模式將發生深刻的變化,其不僅能夠預測法律個體的行動邏輯,也能發現法律社會的運行規律。
五、結語
當然,大數據時代對法學研究所提出的任務是非常復雜的。隨著網絡社會的進一步發展,法律大數據研究將會更為廣泛。法律領域大數據研究的展開意味著大數據時代已經對法學研究產生了一定的影響。但是這種影響從目前來看非常有限。這既有法學本身的原因,更與大數據時代所具備的社會條件和技術條件不成熟有關。正如尤瓦爾·赫拉利2016年4月22日在《人類的崛起與未來》講演中所指出:21世紀正向著這樣一個新的方向走去,我們越來越希望所有的大問題或者說艱難問題的答案,不再來自于人類的感受,而是基于一些來自外部的數據處理系統做出的一些分析[36]。法學研究也有必要考慮大數據時代所帶來的深刻影響。一旦社會和技術條件具備,走向基于社會計算的法學研究才真正具有現實的可能性。當然,這并不意味著傳統法學研究將毫無用武之地。毋寧說,傳統法學研究將會融合到一種更為高級的法學研究形態之中去。本文原載《東南大學學報》(哲學社會科學版)2017年第2期