人類社會已經進入“大數據”時代,這部分歸功于物聯網。無處不在的終端和傳感器,部分歸功于依靠大數據精確分析與預測的商業模式,以及使這一切成為可能的強大算法設計大數據允許各行各業收集以往無法想象的海量數據,并允許人們深入挖掘其中的價值,對國家、企業和個人而言都具有積極意義。與社會科學其他學科相類似,大數據對法律實踐和法學研究的影響也開始逐漸顯現,但進行的相關討論較少。本文試圖從一個廣義的角度討論大數據和法律制度與運作之間的關系,即包括了立法、司法、行政執法、法律服務業和法學研究等領域,考察前者對后兩者可能的影響,以及其中可能蘊含的一些問題,從而迫使我們反思法律實踐和法學本身的特性。
本文認為,大數據和法律實踐、法學研究之間的關系有幾個維度:1.大數據提供了預測人的社會行為的手段,比如購買行為和打擊犯罪,從而為立法執法和法學研究提出新問題和新思路;2.大數據可能對司法裁判提供輔助,但不宜夸大;3.大數據對法律服務的轉型提供推動力;4.大數據也對傳統法學的研究方法提出挑戰。本文將從大數據的特點談起,進而引申到上述四個方面,幫助全面地看待三者之間的關系。本文在最后回到對法律規范的反思時,強調法律作為政治共同體集體合意的產物有必要對數據使用和技術架構進行控制。
一、法律和新社會問題的應對:立法與執法
大數據本身并非一個新穎概念,計算機科學領域中的數據挖掘和機器學習都可視為其前身。它是作為生產工具的數據挖掘技術和作為生產資料的數據累積發展到一定階段的產物。其特點是借助強大的計算能力和算法從海量數據信息中發現事物之間的某種相關性,因為數據搜集的廣泛,其結果差,從而得出可能更接近現實的結論,并聲稱能夠更加準確地為未來提供預測。和傳統的社會統計學類似,大數據分析可以全面分析更加廣泛的數據,提供研究對象之間的相關關系而非因果關系。
上述特性首先被應用到商業領域,允許商家得以精確地搜集和分析消費者數據,預測他們的購買行為。隨著互聯網公司在各個領域的擴展,商家對海量用戶整體上的偏好更加了解,從而基于個體的特殊性和所屬群體的一般性推送廣告。精確預測盡管不是對消費者行為習慣和隱私的窺探,卻極易引起反感,令人們產生受到侵犯的感覺。當用戶更加擔心自身的一舉一動都可以被信息技術追蹤的時候,數據安全性就成了棘手的問題。傳統的空間隱私的觀念被消解,變成了信息隱私甚至是更為中性的個人數據。當個人數據已經不可避免地成為有價值的資產時,法律可能需要作出調整:傳統上對隱私和個人信息的行政和司法保護對打擊非法買賣個人信息的重要性不言而喻,但數據的搜集、傳輸和利用仍然缺乏明確的規范性指引。法律有必要逐步承認用戶對個人信息的財產權利(以及互聯網企業基于合約產生的相關財產權利),幫助創設允許個人信息自由流通的交易市場,從而讓用戶更加自主地控制自己的信息,產生更有意義的價值。
已經有諸多研究指出,大數據分析在推動國家治理決策和提高國家治理能力方面具有積極意義,特別是在提供公共服務方面。就立法活動本身而言,大數據也可以提供更好的證據支持和正當性證明,特別是在監管立法領域(例如食品藥品生產和環境安全等數據密集型領域)。傳統的立法起草過程涉及調查、聽證、論證、征集意見、風險評估等方式,其目的都在于盡可能多地獲得利益相關方的想法和意見。基于海量數據的分析可以使立法起草者獲得更加準確的一手數據,從而避免利益相關人基于自身利益而對立法目標進行的扭曲或忽視,成為科學決策的有力補充。
就監管而言,在大數據精確分析的前提下,國家或公共服務提供者可以更加靈活地根據個體不同的情況因人而異地自動提供更加細致的服務,幫助個體實現其人生目標和社會價值。由大數據分析引發的其他新生事物已經逐漸擴散到更多領域,同樣值得立法者、監管者和法學研究者關注,例如無人駕駛汽車、高頻交易、甚至人工智能、它們的共同特點是在海量數據基礎上依據算法和統計模型進行的“自動化”不同于工業時代的機械自動化,信息時代的自動化在一定程度上更有彈性,更能彌補人性的弱點。這種治理思路和傳統自由主義及法治強調個人理性完備、自主、獨立、自我負責的意識形態截然不同,轉而強調理性受限,需要外界加以“輕推”,為他們提供更好的服務。在中國,這種思路恰好可以同服務型政府職能轉變相銜接,在教育公民個體為自己行為負責的前提下,幫助他們更好地做出選擇。
類似在打擊犯罪的治安問題上,大數據預測帶來的爭議可能更多。犯罪預測一直是犯罪學研究的重要問題,大數據延續了19世紀以來的針對個體的“天生犯罪人”思潮,借助對犯罪群體和可能發生犯罪區域的監控,大數據技術聲稱能夠深入人腦,預測更加廣泛人群的行為,這為打擊犯罪和反恐提供了強有力的工具。由此產生的問題是,如果我們能夠在某些犯罪發生之前就預測(而非證實)其發生,可能會顛覆作為個體承擔法律責任之基礎的自由意志假定。如果未來發生的一切都可能通過對個體過去的一切行為得到解釋(無論這種解釋來自于顱相學、大數據或神經科學),那么像犯罪這樣的“危險的個體”行為就可以進行事先預防,前提是擁有海量的有效數據。和傳統的犯罪預防思路一致,利用大數據進行精準預測的思路是危險的,它會顛覆法律依據人的行為與法律后果之間的因果關系發揮作用,而代之以相關性證明,而這又是隨著數據的精確和算法的調整而不斷變化的,存在相當的不確定性事實上,這一思路只不過是現代國家加強對社會和個體監控的技術上的延續,并會在面臨極端安全威脅時得到強化并推到極致。因此,大數據的出現足以引發我們對法律的基石--責任與自由意志--進行反思,并由此反思不經限制的預測活動是否足以侵犯普通人的隱私,帶來未意料到的傷害,從而在公益和私權之間保持平衡。
推而廣之,不難看出上述思路和當下風險社會中的公共事務治理有著緊密聯系,并牽涉到針對未來不確定風險采取何種治理原則的問題。(事后追責成本-收益分析,還是事先預防)大數據分析有可能超越了原來基于國家能力不足而導致的事實上的政府與社會和私人領域的邊界,從而要求在法律上重新劃定邊界,并限制某些分析和預測性的使用從這個意義上講,技術上的精確性并不能完全取代我們對立法原則和目的的探求,有必要就精準技術帶來的權力邊界擴張和后果進行評估。當然,至少是在目前,由于人口流動和城市地區快速發展變動帶來的干擾,在運用信息技術加強社會治安防控體系建設的大思路下,一些城市的警方還只能根據大數據進行粗略的預測。例如,北京市懷柔區警方通過運用大數據、云計算和科學分析模型,整合歷年案件信息建立了犯罪數據分析和趨勢預測系統,能夠自動預測犯罪趨勢,指導警力投入。除了入室盜竊、詐騙、搶劫等八類犯罪外,警方還將系統信息錄入范圍拓展到治安案件、交通、火災事故,以及其他公共管理事件,遠未達到針對個體的精細治理。但可以預見,隨著數據庫的擴大和算法的改進,大數據將在未來的智慧城市治理和風險預防中發揮越來越大的作用。
二、司法裁判與自動售貨機的神話
說到司法裁判的過程,人們經常提及德國思想家馬克斯--韋伯提到的“自動售貨機”比喻,意即只要輸入案件證據材料,法院就會自動吐出相應判決。這一設想也曾經引起計算機能否定罪量刑的討論。在大數據時代,支持者聲稱,如果存在一個判決書數據庫,軟件就能夠幫助法官將當前的案件和過去審理的案件進行某種程度的比較(例如全國范圍內此類案件賠償或量刑的標準),也可以幫助律師和當事人對判決進行預測,窮盡各種經驗性的可能。在美國2004年的一項研究中,研究者使用最高法院九名大法官以前審理過的628起案件的歷史數據,對每位法官在特定案件中可能的投票結果進行了預測,結果該模型預測的法院同意審判或駁回上訴的結果正確率,(75%)要高于普通法律專業人士(59.1%)這給熱衷于預測法院判決的學者和律師提供了機遇,其在中國司法中的可能應用還有待進一步觀察。
盡管大數據有助于考慮到更多的因素,但數據分析本身無法揭示案件背后復雜的社會關系,容易抹平地區差異,也就無法取代法官在個案特別是疑難或復雜案件中的自由裁量、利益平衡以及對校正公平的判斷。特別是在大陸法系國家,司法經驗和以后果為導向的實用主義思維方式比純粹依賴數據作出的判決更加可靠。而那些事實清楚、法律規定明確的案件盡管可以預測,但一般都不會進入法院,而是事先庭外和解或以其他糾紛解決方式解決了。同時,鑒于中國地方法院往往會深入介入本地政治經濟社會的發展,因此在司法統計基礎上發展起來的大數據分析更有可能加強各級法院整體上的能動性,而非在個案中提供指引。
因此,綜合以上兩部分的內容,大數據分析對成文法國家中的立法者更有幫助,因為它能夠幫助揭示某些法律產生的意想不到的社會后果,更好地進行成本--收益分析,從而及時調整法律規則。但對法院而言,大數據只能在個案中起參考的作用,而不能代替法官本身來作出判斷,更無法取代具體的證據認定和法律推理過程。隨著全國法院司法信息資源統一管理和信息共享系統,以及裁判文書數據庫的逐漸完善,大數據分析對最高法院制定全國性的司法政策將更有幫助。
三、法律服務業的轉型
服務業較早受到數據分析的影響,這得益于信息技術的低成本和便捷性,在能即時提供信息或其他服務的同時獲取用戶的使用信息,從而幫助預測消費者偏好依靠傳統口碑和介紹案源為生的法律服務業正開始沿著這一路徑進行開拓。
傳統的在線法律服務主要分為法律法規案例數據庫模式和律師個人營銷推廣模式(例如在線解答咨詢),它們都沒能利用海量數據本身進行價值發掘。對第一種模式而言,大數據可以在判決書分析的基礎上幫助預測某一類案件的勝負幾率,作為一種產品向律師事務所出售,從而將律師事務所和律師變成平臺內容的生產者;但更有價值的是通過分析判決書,即可掌握訴訟律師訴訟勝負的基本數據,從而依據這一數據對律師進行推薦和評分。這就將第二種模式聯系在一起:根據潛在用戶的咨詢需求,即時創建個人數據庫,成為精確匹配律師和當事人的強大平臺。接下來則可以通過在線咨詢等方式進行進一步溝通交流,降低信息成本。
和法院相比,律師事務所更早地發現了大數據分析有利于自身業務的開展。像天同律師事務所這樣的機構已經開始探索在整個訴訟流程中有效利用長期積累下來的案件數據。
前期論證階段,解決文檔電子化和案件難度預判的問題,對案情宏觀結構進行解構和初步標簽化處理,為下階段大數據分析進行準備工作。
磋商代理階段,解決案件勝率判斷和律師費用計算問題,案件的勝率取決于外部司法環境、管轄地、對方律師等,還取決于案件內部主要爭議證據材料的掌握情況、法律適用、代理經驗等因素。例如,將證據材料與待證事實之間的關聯關系作為標簽,對這種關聯關系是否成立進行大數據分析,故能夠基于大數據分析,對證據與案件事實間的關聯關系進行評估,進而結合其他因素對案件勝率進行評估。律師費用的計算,不妨也采用大數據分析,對同類案件的市場平均價格快速獲取并統計,結合案件難度為天同的訴訟代理尋求合理報價。
案件辦理階段,隨著案件信息的更新,事實爭議和法律爭議已經逐漸清楚,這一階段的大數據分析集中在案外相關因素的分析上,為爭議的本質提供新的洞見,或者新的證據,例如審理法官的相關觀點糾紛產生時所在行業的數據,最新商事審判的價值判斷,以及相關的“天同碼”.
結案歸檔階段,評估大數據分析的使用效果,并對標簽及其邏輯結構的知識進行歸檔,完善案件標簽化體系(元數據方法);將前期的預判結果與最后的裁判結果進行比對,進而對此類案件的標簽化方法進行調整。
單一的大數據模式同樣存在弊端。例如,單個律師水平的高低不能完全通過勝負數據表現出來,也不能成為判斷律師事務所優劣的唯一標準,口碑有時候在法律服務市場上更加重要。同時,依靠免費提供信息和服務的模式也需要有其他增值服務進行交叉補貼才能維持長久。這些問題都需要互聯網行業和法律服務業共同探索。
四、法學研究方法的深化
法學研究以法律實踐為基礎和對象。上文已經簡要說明了大數據對法律實踐的影響,法學研究某種程度上也會受到影響。如果我們將法學研究粗略按照法教義學和社科法學劃分的話,大數據可能對開闊后者的研究視野更有幫助。社科法學關注法律和其他社會因素的互動,評估法律的社會功能和后果。大數據可以擺脫因技術水平和成本造成的抽樣代表性不足的缺陷,減少分析的誤差。最為貼近的研究領域當屬人們的在線行為,當互聯網能夠越來越多地反映人們的社會行為的時候,法學研究就能夠應用大數據搜集和處理、評估某一約束在線行為的法律和政策。
舉例而言,最高人民法院和最高人民檢察院2013年9月發布了《關于辦理利用信息網絡實施誹謗等刑事案件適用法律若干問題的解釋》(法釋201321號),對構成網絡誹謗罪的轉發次數作出了規定。大數據分析可以幫助我們理解某一謠言如何通過像微博或微信那樣的無標度網絡進行擴散,從而思考這一司法解釋規定的具體數字是否能夠對謠言發布和傳播者構成有力的威懾;如果有威懾,針對的是中心節點還是其他節點。又例如,微博實名制的目的在于加強對網絡犯罪的事后打擊和事前威懾,只有通過對真實數據的分析才能得出科學的結論,判斷這一政策是否真正有助于事前威懾,減少謠言數量,否則需要探究影響用戶行為的其他相關因素的重要性。
但大數據如何影響范圍更廣的法學研究,仍然是一個未知數,這依賴于信息搜集的容易程度和根據研究目的進行的算法設計,也依賴于社會科學方法的普及。如果美國最高法院霍姆斯大法官的名言“法律的生命在于經驗”.沒錯,數據分析的誘惑力就不應當被夸大,本文仍然相信通過研習推理和社會經驗進行的實踐是法律恒久的生命。
五、法律的未來
本文對大數據分析和法律實踐與研究的關系進行了概括性的討論。盡管在當下中國,使用數據進行決策尚未普及,但這一概念已經開始進入政府、企業和個人的視野中,并不斷擴散。當人們開始體會到大數據帶來的便利時,便會有意識地進行應用。本文的初步結論是,相對于強調個案分配正義的司法活動而言,大數據分析在偏重校正正義的立法、行政執法和監管領域可能更有用武之地。同時,可以看到大數據開始在法律服務和法學研究上展現其影響力。本文并不提倡一種數據迷信,如前所述,大數據的廣泛應用和一種數據統計文化與思維模式相關,并受制于算法模型的設計。大數據帶來的不會是完全革命性的改變,而只是對決策提供更加精細化的智力支持,使決策和法律執行更有效率和針對性。
一個更加開放的問題是,法律的未來是否會被無盡的數據和算法取代?十多年前就有人提出網絡空間中“代碼就是法律”的斷言在大數據時代,數據及其形塑數據價值的算法變成了新的網絡架構,在貌似客觀地分析海量數據的同時,也將這種描述性的遍歷性事實作為一種規范性規則施加給每一個人,隱蔽在背后的仍然是不同組織和力量試圖挖掘數據價值的計劃,尤其是當大數據被廣泛應用在私人交易的場合。更進一步,這種網絡架構完全可以比現有法律更加精細,從而超越代議制立法機關提出新的規則,而不受到任何制約;當算法復雜到一定程度而無法被人直觀理解,形成“黑箱”的時候。因此,大數據分析的預測性使用不僅不應當取代現有法律,而且還要受到民主機制的制約和監督,即受到民主立法的控制。法律不同于技術架構的要點在于它既是社會中主流價值觀的反映,也是多元價值和利益妥協的產物,但數據挖掘只服務于政治或商業的單一利益。在法律實踐和研究應用大數據的過程中,我們應當注意這一差別,從而盡可能讓大數據服務于公共利益,更好地貼近法律實踐。原載《新疆師范大學學報》(哲學社會科學版)2015年第4期。