一、法律大數據產業的界定及其基本特征
由于網絡和信息技術的迅猛發展,生產力和生產關系都在發生重大變革,所有傳統商業模式和政府行政運作流程都在被解構和重構。 目前,大數據已經逐漸成為國家及其各個管理部門和各類經濟主體用來預測和決策的重要工具之一,通過大數據助力國家治理體系和治理能力的現代化過程已經是國家治國理政戰略的一個重要部分,利用交易過程中所沉淀下來的數據開展的對商業行為的分析和預測也愈發精準和有效。因為不同領域產生的信息和數據本質上是有很大差異的,且對大數據的利用已經開始行業內的分工與整合,大數據產業已經開始進入產業領域、產業鏈細分的階段。 法律大數據產業因尚處于發展初期,對其并無明確界定,但獲得較多認同的、較具開放性的界定是《環球法律評論》專欄作家維克托對法律大數據的理解:“以一種前所未有的方式,通過對海量法律數據進行分析,對法律問題進行預判,獲得巨大價值的產品和服務,或得出新的認識、深刻的觀點和主張。”[1] 法律大數據的范疇應該有廣義和狹義之分。 廣義的法律大數據既包括因法律行為和法律關系產生的信息和數據,也包括其他與法律有關的所有信息和數據。而狹義的法律大數據僅包含因法律行為和法律關系產生的信息和數據。
法律大數據主要有以下四個特征:第一,法律大數據原始信息存在的形式大多是文本信息,在沒有對文本信息進行結構化分割之前,對于信息和數據的大數據利用難度是比較大的。 第二,法律大數據可利用的基礎信息的數量十分龐大,除了司法機關公布的各類法律文書之外,還包含互聯網上存貯的以及以紙質形式存在的各類信息和數據。 第三,法律大數據所利用的基礎信息是以司法機關公布的各類法律文書為核心的。 相較于其他法律信息,這些信息的可信度高,其中訛誤的信息較少,格式較為規范。第四,法律大數據的復雜性較高,其數據展現的相關性,既有法律的專業邏輯,也有一般社會活動所遵循的規律和準則。
當下我國法律大數據產業發展狀態主要呈現出以下四個特點:第一,法律大數據產業發展尚處于初創階段,產品和服務的研發大多已達到可被學術研究和市場利用的要求。 第二,法律大數據產業的基本產品形式或服務模式尚未真正成型,法律大數據的經營或研究機構,對于法律大數據的產品或服務均處于探索階段。 第三,法律大數據行業混雜了一批掛“大數據”之名賣“律師”或“律師事務所”的機構,這些冒名之輩對于法律大數據產業的發展是十分不利的。 第四,無論是政府相關法律部門,還是法律實務界的法官、檢察官、律師,均對法律大數據產業寄予厚望。
二、法律大數據產業的產業功能與產業意義
看待一個產業存在的功能與意義必須與相關的國家戰略與遠期規劃聯系起來,而看待法律大數據產業的視角中必不可少的則是依法治國方略的全面實施這一宏觀背景。
(一)法律大數據分析與預測成為國家治理的重要手段
我們必須承認的是國家治理所要面對的這個社會越來越復雜,而且“現代社會關系的復雜性同時也增加了社會對司法功能的復雜需求” [2] 。包括司法在內的國家法律行為的產生必須依賴更加科學的決策模式,目前流行的指標式法治評估模式必須加快轉型和改革。 中國裁判文書網、中國審判流程信息公開網、中國執行信息公開網、全國企業破產重整案件信息網、人民檢察院案件信息公開網等官方信息平臺收集和開放的文書和數據具有規模大、持續更新、真實性高的特點。 包括中國裁判文書網等平臺公布的信息和數據在歷史上第一次毫無偏見和歧視地記錄了案件信息,而不是只記錄重點、疑難、焦點案件,這就為形成真正科學的決策奠定了必要的信息基礎。
法律大數據正逐步成為國家治理戰略的一部分,法律大數據的本質特征之一就是利用集體智慧來分析和決策,理想的數據分析應該可以被運用到對所有個體或群體不斷重復的行為或活動的分析之中。對規模足夠大的數據的統計能夠揭示原本隱藏在各類要素之間的關聯性,數據分析能夠更加深刻地體現依靠經驗無法解釋的相關性。“大數據中相關性分析之所以能夠為法律因果關系認定和法律類推提供啟示,在于其建立在海量數據之上的基礎優勢,以及數據挖掘、數據關聯性分析科學方法所帶來的對于事實與操作標準的有效解釋和處理。”[3] “大數據分析不是一群迂腐的學究們在偏執地制造煽動性的期刊論文,它是由決策者執行并為自己決策服務的,目的是尋找更好的方法。”[4] 法律大數據分析通過回歸方程的統計預測和公共政策隨機試驗的開展必將對部分傳統法學經驗研究產生較大的沖擊。法律大數據可以擴寬傳統決策咨詢的視域,但它又不同于目前某些社會分析和政策研究中存在的過分強調其他學科方法而導致的舍本逐末的情況,法律大數據提供數據和相關性,而不做任何傾向性的篩選和解讀,這就科學地、合理地為治國理政建言獻策提供了信息基礎。
(二)法律大數據有利于全社會法治共識的形成
法律大數據增強了立法、執法、司法等國家法律活動的透明性,進一步提升了法治建設過程的公共性。實際上,一般公眾對于中國裁判文書網、中國審判流程信息公開網、中國執行信息公開網上所公布的信息的利用率是非常低的。這些基礎信息即使已經被按照簡明的邏輯和標準進行了歸類,但對于一般公眾而言,這些信息依然是龐大和復雜的。 更何況法律信息公開平臺上公布的信息和數據也存在重復上傳、命名標準不統一、涉密信息處理不當等問題,增大了公眾利用這些信息和數據的難度。法律大數據分析可以部分地改變這種窘境,因為法律大數據的分析結果可較為客觀地告訴公眾海量法律數據中所蘊含的規律和邏輯,對于將立法公開、司法公開、執法公開真正地落到實處有舉足輕重的作用。 在政府相關機構信息公開的過程中,一定要避免程式化的為公開而公開,必須注意的是法律信息公開的最終目的是讓社會公眾了解我國立法、司法、執法的真實狀況,對于我國的法治建設和法律實施情況形成基本的共識。 此外,法律大數據分析還有助于法律職業共同體中的公開意識和數據共享機制的形成,十分有利于法律職業共同體內部的交流與合作。
(三)法律大數據產業的經濟價值和社會效應
法律大數據的收集、分類、利用將會產生巨大的經濟價值,并形成較為強烈的正面社會效應。 法律大數據產業的經濟價值主要表現在以下三個方面:第一,作為新興產業會增加就業崗位,促進經濟發展。第二,法律大數據產業是低耗能低污染的領域,對資源的需求較低,投入產出比較高。 第三,法律大數據的產品形式和服務模式存在較大的發展空間,是一個頗具經濟前景的產業。 法律大數據產業的社會效應則主要表現為兩個方面:一方面是法律大數據產業會為國家法治的建設和發展提供技術支撐;另一方面,法律大數據產業為傳統的法律行業和信息技術行業的交流和發展提供了機遇和平臺。
(四)法律大數據對于法律服務行業的意義
法律大數據的運用可以在弄清法律市場基本分布情況的基礎上,優化法律服務市場的基本結構,幫助律師事務所等法律服務提供者理順法律服務的基本流程,提升法律服務的基本質量,評估法律服務的效果等。對于其他法律服務提供者(如律師事務所、公證處等)進行的大數據分析可以被運用在如何改善與維護客戶關系上。法律大數據的分析結果可以用客觀、真實的數據闡釋和說明法律產品或服務的優勢所在,對于律師事務所等法律服務提供者的營銷模式、運營模式等都會有十分深遠的影響。
三、法律大數據開放框架的基本路徑
(一)通過建立統一數據平臺實現數據開放
我國目前的法律信息和數據開放的基本框架主要是由相關國家機關確立的。法律信息和數據的開放框架應該符合國家和政府數據開放的基本原則和思路。 在國家宏觀層面的大數據戰略中,對于規模足夠龐大、具有長足運用前景和可能產生足夠經濟機會的數據或信息, 國家視其數據的所有權歸屬、 數據屬性等決定是否建立國家統一的數據平臺,而法律大數據符合國家建立統一數據開放平臺的基本特征。國家通過建立統一的數據開放平臺實現原始信息和數據向公眾的免費開放,一方面通過信息開放實現開放、透明政府的建設,另一方面則通過數據開放滿足社會公眾和各類法律服務市場主體共享數據的需求。對于目前基于自建數據庫進行法律大數據服務或產品研發的模式,其既可能產生原始信息和數據所有權的爭議,也可能因基礎數據信息無法實時更新而影響服務或產品的時效性。
法律信息和數據開放的基本框架應確立公共數據集中開放模式,即基本信息和數據一站式供給模式,同時要著力避免因集中供給而形成的信息和數據的壟斷,避免部分主體因為經濟弱勢地位導致無法獲取足夠信息造成針對部分公眾或研究者的數據壁壘,確保基礎信息和數據的準確性,防止因信息源的混亂造成數據混亂和數據造假等。數據開放的統一平臺也應建立信息反饋、互動機制,利用信息和數據使用者進行人工的數據識別和錯誤數據的校正。
(二)開放法律數據應明晰且易得易用
法律信息和數據開放的基本框架要確保開放的法律數據具備清晰明了、易得易用的特點,開放的法律信息和數據應該能夠高效地被獲取和利用,并能夠推動相應法律服務行業的發展和創新。 法律數據的開放不僅僅增強了國家法律行為的公開性和透明度,“更重要的是數據中所包含的潛在效益將被開發和再利用,創造更多的經濟價值,提高社會運行的效率,為消費者提供更加優質的產品和服務”[5]。法律數據的開放改變了以往法律服務領域信息不對稱、專業能力和水平無法客觀評價等問題,消費者可以通過數據進行充分地比較,甚至獲得對于任何一個法律服務提供者全景式的描述和評價。
(三)以全面的法律數據開放促進充分的法律數據利用
法律大數據開放的目的是能夠對數據和信息進行充分的利用。與商業活動中銷售、物流等數據信息的大數據分析和利用活動不同,對于法律大數據的收集和利用是有很強的技術和知識壁壘存在的,這就導致了法律大數據開放程度高、利用程度低的現狀的形成,且導致法律大數據的流動是單向度的,國家相關機關公開的信息量非常大,但得到的反饋和生產出的產業利用成果卻比較少。因此,法律大數據的基礎數據和信息不僅應開放, 還應該通過多種手段促進其流動,并在流動中實現交互使用模式的真正形成。法律大數據產業中的服務和產品創新都要依托國家統一數據開放平臺公開的基礎數據信息來完成,其基本操作大致分為三個階段:第一個階段是依服務或產品需求提取基礎信息數據;第二階段是按照服務或產品的內在邏輯進行基礎數據信息的聚合;第三個階段是對服務或產品利用,并不斷重復前兩個階段,以實現數據更新。全面的數據開放對于以上三個階段都有極為重要的意義:一方面可以為數據的流動和利用提供更多的素材,另一方面也通過提升基礎數據信息的量級來增強大數據分析結果的科學性和準確性。
四、法律大數據產業的基本結構和布局
(一)法律大數據產業宏觀布局的兩個主要方向
法律大數據產業發展有兩個主要的方向。一個是公共化。一方面即前文所述的將法律大數據運用在國家治理當中,讓法律大數據為國家法治建設、社會治理、法律服務行業結構的調整與優化服務;另一方面則是希望通過法律大數據的系統應用助力公民對政治活動的多元參與、維護公共利益。 另一個方向則是商業化。商業化主要體現在將法律大數據運用到法律服務之中,例如通過法律大數據為委托人預測判決的結果、通過法律大數據為律師受委托進行辯護的效果進行評估等。法律大數據產業的這兩個發展方向之間是不沖突的,法律大數據產業的公共化符合我國法治建設的基本思路和邏輯,法律大數據產業的商業化則順應了法律服務市場變革和調整的需求,二者可以和諧共存并圍繞社會公共福利保障和實現來完成良性的互動。
(二)法律大數據產業參與者的類型化
法律大數據市場中的主體,按照在縱向產業鏈上的作用不同分為以下類型:信息提供者、數據提供者、數據開發者、數據使用者、數據交易中介平臺、行業監管者。 當下的法律大數據產業中,各類主體的界分并不明晰,行業也尚無明確的知識產權界定方式和行業監管者,這些都必須在法律大數據產業結構的進一步完善中逐步明確,并通過行業各類主體的明確與完善實現法律大數據整個產業鏈的建設。
法律大數據產業的參與者按照其所擁有和處置的數據的規模和范圍,大致可以分為三類:第一類是大型基礎數據庫平臺,如中國裁判文書網等,此類數據庫的建設應該被國家規劃和限制,避免重復建設或違法建立國家法律信息公開平臺的鏡像。 第二類是小型商業數據庫和數據分析商,提供某一類或某一部分法律信息和數據的查詢和分析或歸類服務,傳統的法律數據庫大多要向此類模式轉型。第三類是專項數據分析和整理服務提供商。主要針對客戶所積累和沉淀的大量信息,進行數據整理和大數據分析。
(三)法律大數據產業主要產品的類型化
目前,法律大數據產業中的主要產品可以分為三大類: 第一類是法律大數據分析和預測類產品。通過對既有信息的大數據處理,可以對特定行為基本模式、趨勢、結果進行分析與預測。此類產品的主要形式有:對法律邏輯和裁判規則進行提煉;對某種犯罪行為的定罪、量刑結果進行預測;特定群體與法律相關特征的描述和分析;對特定領域或行業法律問題的總結等。 第二類是法律實務輔助工具,如法官、律師的辦案輔助工具,案件流程管理工具、文檔整理工具等,這類應用的輸出方式主要是電腦或手機軟件。 第三類是交互式的人工智能產品,可以實現部分標準化、重復性高的咨詢、輔導等服務,通過將接收到的外部輸入信息進行格式化的分解,并進入大數據平臺進行比對和分析后,輸出解決方案或意見,常見的運用方式如人身損害賠償計算、針對性的律師推薦等。
五、法律大數據產業發展中可能出現的偏差及其預防
(一)法律數據使用中存在的侵權和資源浪費
法律數據信息尤其是判決書等法律文書是國家作為國家資產或公共資源的一部分在使用和管理的。目前眾多法律大數據企業通過建立中國裁判文書網等國家數據開放平臺的鏡像來建立數據庫。這種做法不僅可能存在知識產權上的爭議,更是一種重復建設和資源浪費行為。政府相關機構建立的法律數據庫從所有權上看是一種國家成果或公共科研成果,在法律大數據產業發展中要注意處理好公共科研成果與私人學術轉化或商業轉化之間的關系,要注意和預防法律大數據領域的侵權。要極力避免產業發展到一定階段后,大企業對信息和數據的壟斷。 信息和數據壟斷造成的數據壁壘會阻礙和損害相關領域的創新和發展,但同時也不能過于放松對行業監管而導致無效率的競爭和資源的浪費。
(二)法律大數據運用過程中忽視個體或個案
大數據的“大”體現在數據的量上,法律大數據也不例外。利用法律大數據開展理論研究和具體運用的基礎是必須有一個體量足夠大的數據庫,來保證大數據分析所依靠的信息“要全數據不要抽樣”[6]。目前,法律大數據的應用的主要方向是利用海量數據分析事物或行為的規律、趨勢。這種運用思路和方法注重的是趨勢,但可能因此而忽視作為大數據分析對象的原始信息中的差異性,尤其在法律大數據技術運用的初期,這種忽視或忽略是很常見的,并可能直接導致對于個體或個案本身特性的忽視、甚至歧視。 法律大數據技術可能助推這種歧視或錯誤的延續或擴張,因為大數據在分析和總結過往某種行為規律的同時,也可能是在總結和分析某種錯誤的或不合時宜的規律。 在此種情況下,更應該注意法律大數據所反映的是階段時間內的客觀事實,但這種事實的是非曲直則還需要進一步探討或驗證。
(三)法律大數據利用過程中不當的信息公開
如同歷史上所有偉大的技術變革一樣,大數據技術同樣是一把雙刃劍,在大數據時代,“現在我們的一舉一動都能在某個數據庫中找到線索”[7]。要注意數據公開、數據獲取、數據分析與個人隱私保護之間的關系。法律大數據絕不是簡單的數據集合,立法、司法、執法等信息集合成為法律大數據后,將產生新的社會效益或經濟效益。 相應地,如果對于法律大數據使用或保管不當,對于法律大數據所涉個人或組織造成的損害也是遠大于對一般信息的不當運用所造成的損失的。 因此,必須注意對法律大數據的保存并建立相應監管機制。這方面的研究較多,本文主要側重于法律大數據產業的發展,對此問題不須贅述。
六、加快法律大數據產業發展的建議
(一)政府應突出加強對開源法律數據的管理,做好基礎數據庫建設工作
法律大數據中的原始數據信息大多產生于政府的立法、司法、執法行為和過程之中,作為原始數據產生源頭的政府機構應做好對于法律大數據產業發展的引導和規范工作。 具體來說,主要有以下四方面。
1. 原始法律數據的篩選、整理和公開工作。 在法律大數據產業發展中最重要的產業基礎就是政府公開的立法、司法、執法行為和過程中產生的信息和數據。國家相關機構一方面應嚴格遵守立法公開、司法公開、執法公開的相關原則和限度,做好信息公開工作;另一方面政府相關信息管理和監管機構應系統規范國家各個機關信息和數據公開的標準與模式,為數據的統一篩選、整理和進入數據庫做好準備工作。
2. 法律數據的橫向整合工作。 目前,國家各個法律部門公開的信息和數據很多還處于割裂的狀態。 以刑事案件為例,法院公開的裁判文書與檢察機關公開的立案、偵查、起訴信息無法實現有效、準確的對接,各個法律部門的數據庫建立標準不統一,無法實現數據之間的匹配和對接。 政府相關部門應統一標準、協調工作機制,實現各機關之間關聯信息或數據之間的對接和匹配,這對于做好后期的數據識別和整理工作有非常重要的意義。
3. 原始信息和數據中涉密信息的處理工作。 各信息公開機關要依照相關法律標準做好原始數據或信息中涉及國家機密、商業秘密和個人隱私部分的處理工作,法律大數據公開平臺應該設置二次審查機制,防止以上信息的泄露,做好法律大數據產業中的保密工作和個人隱私保護工作。
4. 規范、高效、易用的法律基礎數據庫的建設和管理工作。法律大數據產業中最重要的產業基礎設施就是全面、系統、科學的基礎數據庫。 在產業的基礎設施建設方面,政府相關監管機關應嚴格限制基礎數據的重復建設。考慮到國家機關是法律大數據重要的基礎信息和數據來源,或可選擇國家建設統一的法律數據公開平臺的方式,并設定個人免費使用,商業利用則需向國家支付相應費用的方式實現法律數據庫的共享。
需特別強調的是,與在其他產業發展中扮演的監管者角色不同,在法律大數據產業中,政府首先要做好產業的重要參與者的角色,在這個新興的產業中既要保證原始數據和信息的供給穩定和質量,又要做好或設計好基礎設施的建設規劃。
(二)政府在做好產業監管者的基礎上應充分鼓勵市場的發展與創新
在法律大數據產業中,政府除了要做好基礎數據開放的工作之外,還是市場的主要監管主體。 在監督、規范與促進法律大數據產業發展方面,政府作為產業的監督者和管理者則應從以下四個方面努力:
1. 優化產業結構,防止因壟斷的產生而阻礙產業的良性發展。監督者和管理者應該保證市場處于一種穩定的秩序當中,并且是具有較高效率的。 一方面,使產業中各類主體保持一個適當的比例,這其中既有對不同規模競爭者所占市場份額的控制,防止產業寡頭或壟斷者的出現,也包括應使產業鏈中不同性質市場主體保持適當的比例;另一方面,監管者應著力防止因行政權力、市場勢力產生壟斷導致市場的低效率和發展的停滯。
2. 在保證數據安全和充分開放的基礎上,充分鼓勵法律大數據產業的發展與創新。市場具有不可估量的創新能力,并能夠形成一套自有的秩序。 在市場中沒有出現損害產業中各類經濟主體和消費者權益的情況下,監管者可保持適當的隱形,以便給予市場主體較大的發揮空間。
3. 做好法律大數據信息或成果所有權的確權工作。在當今這個數據已經成為一種重要經濟資產的時代,只有在明確界分產權的基礎上,才能夠對產權進行有效保護,并藉此鼓勵基于自身努力的可以使得法律大數據技術和分析結果增值的行為。
4. 通過立法和政策等多種手段鼓勵法律大數據產業向縱深發展。信息技術行業的特征之一就在于不必短時間內過分追求產業的規模,因為只要在產業技術或產品相對成熟后,市場規模的擴大是可以以極快速度完成的。 因此,監管者應通過多種手段鼓勵法律大數據產業向專業化、精細化的方向發展,通過各類產業政策的制定鼓勵法律大數據分析工具和相關服務和產品的研發,實現法律大數據技術成果的產業轉化。
此外,“產業競爭有一個隱含的時間維度” [8] ,監管者一定要注意法律大數據產業發展的階段性特征。 目前我國法律大數據產業尚處于初創階段,各國也并無成熟的監管經驗可供借鑒。 因此,在產業中各類經濟主體不破壞社會穩定與秩序、不損害個體權利的前提下,在短時間內可既不對各類主體施加過多的限制,也暫不給予過多的政策性扶植,為市場主體的自主性探索和發展留出充分空間,同時也較好地控制了國家的規制和監管成本。
(三)擴寬法律大數據領域內政企合作的渠道和路徑
在法律大數據產業的發展中,政府相關機構除了通過立法規范和引導包含法律大數據在內的國家和政府數據的開發和利用之外,政府還是法律大數據產業重要的參與者。數據和信息作為現代社會中三大資源(另外兩類資源為物質和能量)之一,正在推動國家產業規劃和戰略的轉型。 “政府應該與產業界、學術界以及非營利性組織一起,共同充分利用大數據所創造的機會。” [9] 在國家大數據戰略的引領下,在法律大數據領域展開廣泛的政企合作,具體路徑主要有以下四個方面:
1. 建立產業發展促進基金,作為天使投資人投資有潛力的法律大數據科技研發的個人或組織,孵化一批有代表性的具有領先技術的提供法律大數據相關服務或產品的公司,以資本介入的市場化方式參與到產業的形成過程之中,通過適度參與市場行為深度挖掘法律大數據中蘊含的巨大經濟價值和社會效益。
2. 積極推廣法律大數據的運用,將法律大數據廣泛運用于國家網絡安全、社會治理、經濟管理等方面,通過法律大數據的運用實現司法為民、行政便民等基本政策,并通過法律大數據公開和解釋立法、司法、行政等信息,一方面使得社會管理者和被管理者之間的關系更加和諧和融洽, 形成良好、順暢的溝通渠道;另一方面可以極大程度上強化和鞏固我國信息和數據產業方面的綜合實力。
3. 對政府所需法律服務進行分類,將其分為政府系統內提供的法律大數據服務與從外部獲取的法律大數據服務。 一般來說,原始信息的存儲、涉密信息的處理等屬于政府系統內提供的法律大數據服務,而對原始信息的整理、分析屬于可以從外部獲取的法律大數據服務。在對政府所需法律大數據服務進行識別和分類的基礎上,實現政府部分法律服務的市場采購,這樣一方面降低了政府在信息化建設方面的成本投入,另一方面也將激發法律大數據產業的市場活力。法律大數據運用對于優化法治資源配置有著重要的意義,尤其對于重新配置司法系統內資源、行政系統內資源是有著十分積極的作用的,政府可以通過購買市場法律大數據分析服務的方式來改進法治資源分配的模式和方法。
4. 政府應通過多種方式鼓勵和促進法律大數據人才的培養和成長。尤其是要重點培養一批既具備一定法律知識,又擁有數據處理和分析技能的交叉學科背景的理論研究和實踐應用人才,以設立科研項目、批準建設相應專業、建設產業園區等方式實現對于法律大數據人才的幫扶和培養。
(四)以長遠、開放的眼光看待法律大數據產業的邊界及預期規模
目前法學界和法律實務界對于法律大數據的關注多集中于司法裁判文書和司法統計方面,并認為“法律大數據分析的歷史性機遇主要是指近年來司法數據的公開”[10]。這一方面是因為司法信息和數據的公開確實在政府信息公開中是走在前列的,另一方面司法和案例的研究確實在法學界占有十分重要的地位。但客觀地說,這種情況實際上限制了法律大數據產業發展的可能性和預期的規模。因為法律實務中還會產生大量的關于立法和行政執法的信息和數據,這些數據對于評估立法、執法效果,甚至是評估我國的法治建設效果都有著十分重要的作用。 另外,這些法律信息和數據也會對于擴大法律服務市場的規模和疆域起到積極的作用。因此,我們需要用更加宏觀和開放的視角界定和分析中國的法律大數據產業。所謂宏觀的視角指的是應該站在更高位置看待中國的法律大數據產業,不要把法律大數據簡單地限制在立法條文和司法案例信息和數據中,應該注意到法律大數據領域還應該包含執法、公證、法學教育、法律服務市場等重要領域中的信息和數據。而所謂開放的視角則指的是中國的法律大數據產業關注和利用的不應該僅僅是官方開放的信息和數據,還應該包含互聯網等媒介上發布的信息和數據,例如可通過對于自媒體上公眾對于法律信息和法律事件的評論信息和數據展開輿情分析。
七、結語:法學理論界應客觀、冷靜地看待法律大數據產業
(一)法律大數據分析對既有法學研究方法的影響
大數據研究中很多例子證明:只有信息樣本足夠多、數據量足夠大的時候,才能發現事物存在和運行的規律。這就導致大數據的生產和大數據的研究方法和視角會對許多社會科學研究帶來轉型的機遇。 法律大數據同樣為法學(法律)研究帶來了巨大的沖擊,無論是立法、執法、司法行為,還是受法律調整的社會關系和行為,都受限于社會發展基本規律和法治的基本精神,法律大數據會展現出這些關系和行為的規律性和可預測性。這使得法學研究可采用的研究方法和得出的研究結果更加科學和有說服力,理論研究者和法律實踐者不必再糾結于理論研究成果的實踐基礎和實踐意義,也不必再糾結于所謂的教義法學和社科法學孰是孰非。因為法律大數據將重構法學研究的基礎,規范適用情況將可統計、規范適用結果將可預測,而社科法學所提煉的典型案例或虛構案例將失去主要意義,因為法律大數據可以幫助我們找到法治實踐中什么是真正值得關注的內容。 對于立法、執法和司法的評估不再單向度地依靠問卷等信息獲取方式, 而是更多地通過公共政策隨機試驗完成,獲取的數據更加真實和完整。
法律大數據收集與分析方面的創新和革命是通過信息和數據開展科學決策的基礎。法律大數據分析通過回歸分析、隨機驗證、交叉比對等方法對決策行為進行事前引導和事后評價。法律大數據分析技術的創新不僅僅會對國家治理方式帶來革新,還會一定程度上沖擊傳統法學研究方法。無論是傳統的法學規范研究方法或教義法學研究方法,還是晚近興起的法經濟學、法社會學、法政治學等利用多種學科方法和工具展開的法學研究,因為以上兩類研究方法開展研究的基礎中的法律文本和對法律的經驗性評價都無法實現全面的量化統計和分析,尤其是在占法學研究主流的教義法學研究中,關注的主要是法律體系內的邏輯性和自洽性,對于法律的具體實施情況并未形成充分關照。最近興起的社科法學研究方法,在一定程度上突破了部門法的藩籬,使得某些涉及多個部門法的疑難問題被關注并為其積極尋找應對方案。雖然社科法學仍然未能進入法學研究的主流范疇,但確實已經形成對于教義法學研究方法的有效補充。但即便在教義法學和社科法學共同構建的法學研究方法體系中,對于法律制度的預設功能與實際效果的比對與驗證都缺乏有效的、科學的工具,而法律大數據分析方法的優勢正在于此。可見,在法學理論研究中,法律大數據研究方法必將占據更大的空間和更高的地位。事實上,法律大數據分析方法、法學的規范和社會科學研究方法都是可以共謀發展的。法律大數據分析方法并不會也不能完全替代既有法學研究方法,卻可以對既有法學研究方法形成有效的補充。 有了法律大數據分析方法和分析結果的幫助,法學研究工作可以探索這樣一條新的研究基本路徑和思路:提出假設-數據驗證-理論分析。 依此路徑對于法學理論研究中的理論問題進行研究檢驗具有極高的可行性和執行效率。
具體而言,法律大數據分析方法和分析結果對于法學理論界和法律實務界可以提供以下三方面的幫助:第一,在立法方面,法律大數據的分析結果有助于更加科學、高效、全面地評估立法效果。例如,通過對司法文書、執法文件中引用法律條文的分析,可以得知法律條文的適用情況并進而找出規范中的僵尸條款和不合理之處,對于法律的修改和完善有十分重要的積極作用。第二,在司法、執法、普法等法律實踐方面,法律大數據的分析結果有助于提煉裁判規則和執法行為的規律,并有助于對司法、執法的過程和結果形成一套科學的量化標準。例如,對于法官、檢察官、律師等法律專業人士的工作可以形成更加有效的評價,對于普法的效果可以進行全面測評,對于法律實施的過程也可以形成更加全面、系統的檢測,對于預防冤假錯案、過度執法等有重要意義。 第三,在現實法律疑難問題和突發事件的應對方面,法律大數據能夠協助司法、執法或其他社會治理機關得到更加全面的事件基本情況、公眾輿論的反應、過往案例的處置方案和處置效果、相關法律依據等信息,對其合理處理疑難、突發社會問題,及時回應社會公眾的治理需求有極大的幫助。有了法律大數據的幫助,法律專家能夠為實踐中的難題給出更為準確和有針對性的對策和建議。 有了法律大數據提供的支撐,理論研究的成果必將更加言之有物。
(二)法學理論界對待法律大數據的應有態度
客觀地說,法律大數據對于法學理論界來說,是挑戰與機遇并存。法學理論工作者只需要應時代發展之勢,平靜地看待法律大數據產業的發展即可,不必危言聳聽地提出法律大數據將顛覆傳統法學研究方法,也不必對法律大數據分析不屑一顧。在面對法律大數據的時候,建議法學理論工作者應秉持三種工作態度:第一種是對法律大數據要客觀、理性地接受。 法學理論工作者應正視法律大數據等新的研究方法和研究資源的出現,要客觀地看待法律大數據產業的功能和作用,并理性地分析法律大數據應用的利弊得失。 第二種是要合理、適度地運用法律大數據。在科學分析法律大數據運用的成本與收益的基礎上,在恰當的時機、合適的場域中運用法律大數據,協助研究者總結事務規律或探求解決問題的系統性方案。第三種是要與從事法律大數據收集和分析工作的個人、機構進行友善、積極的溝通。法律大數據的開放程度決定了法律大數據研究的壁壘不在于數據信息本身的獲取,而在于提取和分析法律大數據的方法和思路。這既是一個信息技術問題,又是一個法律問題,并無法單方面找出最佳方案。 因此,需要法學理論工作者與從事法律大數據收集和整理工作的個人和機構保持良好的溝通,通過闡釋法律體系內部的特征和法律實踐的基本規律為法律大數據的收集、整理、分析工作提供參考,并進而形成二者的良性互動。