人工智能和大數據挖掘技術滲透在社會生活的各個角落,借助視頻監(jiān)控、電子郵件、智能系統(tǒng)等,可獲得長時間的、連續(xù)的、大量人群的各種行為和互動的數據,實時、在線、網絡化的計算社會科學研究正在興起。文理交叉的新文科建設正孕育著新的學科分支,計算法學作為法學與計算機科學的交叉學科應運而生。
一、計算法學的產生與現狀
。ㄒ唬 法律與科技相結合的歷史沿革
學界向來認為“保守”是法學的特征,是法學保持穩(wěn)定性進而具有權威性的原因之一; 然而,法究方法不斷地被法學所吸收,并因而產生了一系列新的交叉學科分支。
1. 計量法學研究的起源
計量法學研究( Jurimetrics) 早最可追溯至上世紀 40 年代,隨著自然科學的突飛猛進,人們試圖用自然科學的理性來減少人文社會科學研究中的不確定性,一些學者將定量和計量的方法引入到法學的研究領域中。
1949 年于里·洛文杰( Lee Loevinger) 提出了計量法學( Jurimetrics) 的定義,即運用諸如統(tǒng)計量化方法解決法律問題[1].1985 年何勤華教授將計量法律學定義為:“運用電子計算機等手段,將數量計算方法引入法律領域,對法律的制定、執(zhí)行、遵守以及法律教育和法學研究進行數量計算、分析的科學!盵2]
計算機革命為量化法學提供了極大的技術支持[3],符號邏輯的運用將法律文本從傳統(tǒng)的概念分析方法局限中解放出來,演繹和類推等形式邏輯方法得以應用于法律信息分析之中。計量法學以具有數量關系的法律現象為研究對象,綜合運用數學、統(tǒng)計學與計算機知識,主要采用數理建模和實證研究方法[4].計量法學已用于法律情報統(tǒng)計、犯罪率預測等領域,用以促進司法效率。
2. 人工智能與法律研究的發(fā)展
人工智能與法律研究( Artificial intelligence and law) 的發(fā)展可追溯至上世紀 50 年代,1958 年Lucien 提出了法律科學的信息化處理,即建立法律文獻或案例自動檢索模型和法官裁量模型。1970年 Buchanan 進一步論述了人工智能與法律推理[5],用計算機模擬人的思維過程和智能行為,建立基于規(guī)則和案例的法律推理模型。此后各類專家系統(tǒng)如 HYPO,CATO,CABARET 和 PROLEXS 等相繼產生,有的已用于司法實踐之中。
人工智能與法律的發(fā)展分為三個階段[6]: 1950 - 1970 年早期將人工智能技術直接用于處理法律數據,建立基于案例的法律輔助系統(tǒng)旨在預測司法判決結果,但囿于技術原因尚無法準確預測。1980 - 1990 年研究者更多考慮價值選擇和法律目的,建立人工智能系統(tǒng)協助司法參與人實現其主張。2000 年以后研究者設計程序旨在解釋預測和提出合理的法律論據。
3. 法信息學的發(fā)展
信息科學( Legal informatics) 是一門涉及范圍甚廣的學科,涵蓋了信息的收集、組織、存儲、檢索和傳播等,法律信息學主要關注法律信息獲取、信息技術對法律領域的影響[7].法信息學是法學的學科分支,涉及法律信息的存儲和自動檢索、法律部門的辦公自動化、司法管理以及計算機在法律領域的其他應用[8].法律信息學與信息科學的發(fā)展緊密相關,偏向于應用研究,譬如法律信息的語義處理、法律合同的人工智能審核、法律信息的檢索等,如將人工智能應用于司法領域進行法律信息的儲存、傳播與檢索,以及判決的預測等都包括其中;诜蛇壿嬐评淼姆ㄐ畔W應用人工智能技術極大提高了法律系統(tǒng)的運行效率。
法信息學建立的前提是法律法規(guī)設計是完備而準確的,但法律實踐活動并非如預期的那樣精確運行,法律法規(guī)為大前提、案件為小前提、依據法律邏輯進行司法解釋,其機械適用往往飽受詬病。當前法信息學研究的新傾向,不再是僅從邏輯結構研究法規(guī)和原則,而是著重考慮其在現實推理中實際扮演的角色,法律信息學正在減少孤立的、代碼化法律信息,轉而更關注法律信息的可重復性、公正性和實用性[9].
4. 計算法學的當今實踐
巨增的數字化信息以及人們行為的在線化,使得通過應用模擬、建模等計算方法分析法律關系成為可能,在計算思維的導引下,法學與人工智能、大數據處理技術的結合日漸緊密,計 算 法 學( Computational jurisprudence) 作為法學與計算機科學的交叉研究科學應運而生。2005 年 Wyner 首次提出了計算法學的概念,對電子化的法律法規(guī)進行邏輯分析,自動檢測其邏輯性[10].2015 年美國 Oliver Goodenough 教授根據人工智能技術發(fā)展經驗將計算法學( Computational jurisprudence) 劃分為三個階段[11].法律科技 1.0、2.0 階段,主要在當前法律系統(tǒng)下應用科技增強信息處理能力,如計算機輔助法律查詢、流程管理、語義處理的專家系統(tǒng)等。3.0 階段是利用通信、建模和執(zhí)行等計算技術,深刻改變或代替現有系統(tǒng),如無人駕駛技術等。2015 年我們在專著《計算法學導論》一書中對計算法學產生背景、意義、定義、基本研究內容等方面探討了計算法學的基本理論[12].2017 年出于對動態(tài)法律大數據的關注,錢寧峰進一步論述了計算法學---基于社會計算的法學[13].
身處大數據和人工智能技術飛速發(fā)展的時代,無紙化訴訟、庭審語音及視頻記錄等為訴訟畫像提供了數據支持,能否更多地利用人工智能和大數據挖掘技術實現公平正義的量化和可視化? 法官判斷很多時候依靠“法感”---長期法學知識浸潤產生的直覺---這種思維模式能否被計算機器學習和模擬? 人工智能運用與法領域,能否實現法學與計算機科學理論的深度融合,建立起法律適用的智能算法和模型,促進立法與司法的更密切互動,進而促進法系統(tǒng)運行的更加順暢。
5. 計算法學是法學的分支學科
計算法學( Computational jurisprudence) 與計量法學( Jurimetrics) 、法信息學( Legal informatics) 、計算法律學( Computational law) 等概念相關,這幾類研究的起步時間有先后,具有一定承繼關系,研究內容有交叉和融合?傮w來說,這幾類研究都試圖用客觀的或是可量化的研究減少法律體系中的主觀性,增強立法與司法的科學性和實用性,是法律與技術聯系最為密切的一脈研究。盡管如此,上述交叉學科與所處的技術發(fā)展水平相關,其研究基礎、研究的側重點和采用的技術路線仍有一定的區(qū)別。
首先,計量法學( Jurimetrics) 旨在“對具有數量變化關系的法律現象”進行研究,建立在傳統(tǒng)統(tǒng)計學與數學基礎上,采用抽樣、問卷調查等方式收集相關數據,對社會活動進行分析。計量法學與法律大數據相關,本質上歸屬于“數據密集型科學”,數據量大且實時更新,以“自然數據”挖掘為中心,實施科學研究。
其次,這幾類交叉研究著重強調應用,而計算法學法雖然也是運用前沿技術對法學研究與應用進行改造與創(chuàng)新,但它著重于發(fā)現法學自身的發(fā)展規(guī)律。法信息學( Legal informatics) 是一門內容涵蓋極廣的學科,是信息科學與法學的交叉分支,其關注點主要是信息科學在法律領域的應用研究。法信息學包括人工智能與法律、計算法律學( Computational law) 等,人工智能與法律研究經過近 30年的發(fā)展,是歐洲比較有特色的研究分支,其研究偏重于建立預測模型和專家系統(tǒng),但其成果在法院或律所中實際使用的并不多。計算法律學( Computational law) 以斯坦福法學院的 CODEX 研究中心為據點形成了由學者、公司開發(fā)人員和律師組成的團隊,已將法律信息代碼化,遵循邏輯推理的原則,適用法律推理[14],但其研究常因機械推理的原因而飽受垢病。
計算法學是法學與計算機科學、現代統(tǒng)計學的交叉學科,基于現代人工智能技術和大數據挖掘技術,屬于法學的研究分支,通過統(tǒng)計學、現代數學、計算智能等技術方法模擬和預測法律事務,其核心思想是計算思維與法學思想的深度融合,主要通過主體的分布式實時計算分析法律行為,從而
。ǘ 計算法學產生背景
近年來人工智能技術、大數據處理技術正以前所未有的廣度、深度影響著人們的生活,社會生活復雜性的增長,一方面使得糾紛和訴訟爆炸式增長,法律法規(guī)應對式劇增,信息超載成為一種無形壓力; 另一方面案件信息的電子化、無紙化訴訟等增強技術又成為法律適用的一種客觀需求。計算法學正是伴隨著數據挖掘與人工智能技術的發(fā)展在法律發(fā)展及法律適用的客觀需求而產生。
1. 計算思維的發(fā)展為計算法學的產生奠定了思想基礎
計算思維以抽象、算法和規(guī)模為特征,能夠把問題及其解決方案表述為可以有效地進行信息處理的形式和思維過程[15].計算思維的發(fā)展,使得法律事務代碼化成為可能,以計算的形式表達法律內容,完成諸如文件合規(guī)性審查、立法預測、法規(guī)分析等事務。
2. 人工智能和大數據挖掘帶來模擬方法和分析系統(tǒng)的發(fā)展
借助視頻監(jiān)控、電子郵件、計算機智能系統(tǒng)等,可獲得長時間的、連續(xù)的、大量人群的各種行為和互動的數據,人工智能與大數據挖掘技術的突破性進展,使得人們能夠從大量無序的數據中分析出人們的行為。將數據科學的成果用于分析法律信息,有利于形成開庭前輔助判斷的證據鏈,庭審過程的審判提示以及審判結果的預測,庭審后的分析和司法管理。
3. 認知科學的發(fā)展為計算法學提供了新的解決問題的方式
計算機科學、神經生物學以及其他學科相融合形成認知科學,探究人腦或心智工作機制,促進人類對自身認知機制的深入了解。法官對案例的審判過程,多是法官基于法律事實、法律觀念、審判技能、法律法規(guī)和歷史案件等“法感”形成案例初步判斷,繼而通過往來于案件事實與法規(guī)從而獲得最終的判斷。認知科學的發(fā)展,有利于突破機械推理導致的不合理現象,形成更符合人類思維的司法預測。
4. 傳統(tǒng)法學的不足為計算法學的建立和發(fā)展留下了空間
法教義學并非能對所有法律問題給出最好的解決辦法,法學轉而從其他科學方法汲取營養(yǎng),法社會學、法經濟學的蓬勃發(fā)展可窺一斑。傳統(tǒng)法學多采用法解釋學、價值分析等定性研究方法,計算法學以具有數量關系的法律現象對研究對象,運用數據、數理模型、圖形、計算機模擬等方式表述和分析法律問題,這對傳統(tǒng)研究方法是有利的補充。其他社會科學如經濟學、社會學等紛紛由定性研究轉向數據為導向的定量研究,若法規(guī)的制定和法律的執(zhí)行僅靠命令,而不考慮到社會的可接受度,其可信度將大受影響。
5. 新技術的出現為司法改革提供了契機
對這次的科技革命熱潮,執(zhí)法者的危機感日勝一日,若不緊跟科技做出讓眾人信服的變革,傳統(tǒng)司法裁判方法將會成為下一個被拋棄的系統(tǒng),智能分析技術能讓人類法官在 AI 專家系統(tǒng)面前略顯黯然失色。
6. 司法實踐對法官提出合理期待
在實踐領域,案件審判流程的公開化、判決書的公布、網上傳遞法律文書,以及利用知識圖譜、智能檢索手段,促進法律系統(tǒng)的便捷性、實時性、公開性,已成為新的潮流。類案類判既是法律人的不懈追求,也體現人們對司法公正、平等的渴望。凡此等等都對法官于案件的審理和裁判提出了更高的要求。
7. 司法改革為計算法學的崛起提供的機遇
從司法實踐來說,我國法院系統(tǒng)員額制改革后,辦案人員大幅度減少,人們權利意識的增強,案件日益增多,面對案多人少的實踐困境,各方期待有智能化的輔助裝置,幫助法官承擔查詢、類案比對等基礎性工作,特別是對于簡單案例能有快速解決提示。
。ㄈ 歐美司法領域中計算法學的研究與發(fā)展現狀
各國政府與研究人員對法律大數據的態(tài)度不一,歐洲和美國自上世紀 90 年開始進行人工智能與法律的相關研究,取得了豐碩的成果。可視化技術正在進入美國的法院,倡導證據的可視化展示以及案發(fā)現場的復原。美國法院已經明確表示在訴訟和案件審理過程中整理、搜集證據材料時可以利用預測性編程技術。Northpointe 公司根據犯罪理論和再次犯罪的關鍵信息設計了一款風險需求評估工具 COMPAS,COMPAS 風險評估依照從被告的犯罪檔案中得到的和從與被告的訪談中采集的信息來評估該被告犯另一種罪行的可能性以及被告如期出庭的可能性等各個因素,該系統(tǒng)已用于美國部分州立法院評估罪犯二次犯罪的可能性,據稱的評估準確率可達 70% .ROSS 系統(tǒng)在律所中可代替律師助理查詢相關案例和法條,CACTUS 系統(tǒng)被用于犯罪的預防和調查中。IBM 公司的Watson 和 Google 公司的 DeepMind 的良好性能,激發(fā)了人們進一步將人工智能應用于法律領域的熱情。人們設計了諸如 LawGeex、CaseCrunch、Project Debater 等職能系統(tǒng)與人類專業(yè)人員比賽。2018年 LawGeex 公司,讓法律人工智能軟件 LawGeex 與20 名法學家、有經驗的律師等同時審核五個保密協議( NDA) ,LawGeex 僅用 26 秒且準確率高達 94% ,而人類完成此項任務需要 92 分鐘且平均準確率比 LawGee 低 9% ①。 歐洲開展人工智能與法律的研究較早,1970 年 Buchanan 開啟了人工智能與法律相結合的研究。1990 年 Ashley 在其博士論文中設計了基于案例的 HYPO 專家裁量系統(tǒng),其后 Brewer,Bench -Capon and Sartor,Roth,Horty and Bench - Capon 等繼續(xù)沿此思路推進,陸續(xù)出現了 CATO,IBP,CABARET、BankXX 等一系列專家系統(tǒng)以及人工智能法律咨詢系統(tǒng),有些已應用于司法實踐中[16].英國將信息保存在電子介質,通過 ODR( Online Disputes Resolution,在線糾紛解決機制) 應用于小額民事糾紛,已在司法領域之外取得了顯著的成果。法國借助大數據工具的“預測性司法( Justice Prédictive) ”在 2017 年就已進入了法國法院系統(tǒng)的視野。2017 年 5 月法國兩個最大的上訴法院,杜埃市( Douai) 上訴法院和雷恩市( Rennes) 上訴法院,開始試用 Prédictice 軟件輔助判案①,但在計算賠償金時仍然未能完整考慮所有相關因素,導致計算結果不夠準確②。2016 年意大利國際律所 Dla Piper 在意大利的分部已開始采用由加拿大公司 Kira Systems 開發(fā)的人工智能系統(tǒng),逐句地審查分析合同語義③。
二、計算法學的理論基礎和現實意義
(一) 自然為法立法-調和法律的模糊性與客觀性
法律體系由法律、判例、理論、程序、權利分級、規(guī)則、元規(guī)則等各類知識所組成,人們期望法律概念是精確的、單義的,然而作為邏輯和規(guī)則綜合體的法律概念實則包含諸多的模糊和不確定性。第一,立法語言模糊。立法是借助于法律語言對法律現象的規(guī)范化表述,法規(guī)的制定需要法律語言的橋接,而自然語言的表述常常是多義和模糊的。法官判決過程是應用各種司法解釋方法將法律規(guī)范適用于特定的事實,對法規(guī)的不同的理解可能會產生截然相反的結果。第二,法律看似一個明確的體系,卻與道德、習俗、宗教等有著千絲萬縷的聯系。第三,法律需滿足不同的功能定位,如倡導、調整、建議、計劃、委托、管理等。第四,司法判決語言模糊,司法中的處罰機制具有開放性,法官的酌定情節(jié)中包含了個人的價值選擇。第五,司法具有高度反饋性,其執(zhí)行受各種社會、經濟因素的影響。
人們期盼司法判決是客觀的,不受偏見或成見的影響。法官做出判決,預先存在著可適用的法律規(guī)則,法官按照三段論推論,可獲得確定的司法判決必須查詢和解釋相關法律淵源( 制定法、先例、習慣等) ,以此確定統(tǒng)攝所涉案件的原則和規(guī)則,再確定如何將這些原則和規(guī)則適用在案件的事實中。然而,法律中包含著諸多如權利、正當程序、公正補償等評價性范疇和公平正義等價值選擇,因此,法律的客觀性是指相對客觀性,即只要發(fā)現正確答案的機制( 如司法程序、法律推理等) 不受歪曲性因素影響[19].法律現實主義關注司法過程的心理學和社會學分析,與司法判決所引起的社會后果之間互動,特別是對于行為規(guī)則不明晰、案件處理結果有爭議的疑難案件,不同的法官即便根據相同的推理規(guī)則進行司法解釋獲得的答案亦不統(tǒng)一。
耶林分別從法律、歷史和哲學角度論證法學是一門科學[17],法國《拉魯斯大百科全書》明確:“法學確實不折不扣地是一門科學!雹芮x教授對法律的社會屬性進行深入分析,認為法學是社會科學的重要組成部分已是不爭的事實[18].法律制度的產生、變遷看似是包含很多偶然因素的主觀選擇,但本質是歷史的產物[21].勒內·達維說“立法者要改造法律條文本身很容易,但是法律條文背后的東西卻是很難改變的!盵20]簡言之,“自然為法立法”[12]2,“自然”是指科學的自然規(guī)律,前一個“法”指我們法律制度,后一個法指“規(guī)則”.
計算法學的科學屬性表現在: ( 1) 社會科學的研究對象是社會現象,法學的研究對象是廣義的法律現象,即包括立法、司法、執(zhí)法等在內的法律事務,計算法學的研究對象是能用計算方法表征的法律現象。( 2) 社會科學的研究方法具有典型的實證性和規(guī)范性特征,計算法學采用統(tǒng)計學、現代數學、計算智能等技術方法。( 3) 社會科學的價值定位是研究與闡述各種社會現象及其發(fā)展規(guī)律,計算法學旨在發(fā)現法律系統(tǒng)的運行規(guī)律,提高司法公正和立法科學性,提升司法效率。
(二) 法律的規(guī)范性與人工智能的學習性相得益彰
盧曼認為,法律最核心的功能是維護社會規(guī)范性期望的穩(wěn)定[22].立法需要維護其自身的穩(wěn)定性,不會經常性調整規(guī)范、原則和價值。機器學習是一種建立于統(tǒng)計學基礎上的定量方法,根據信息、參數和數據進行反饋式調整,每一個輸入的數據又會成為機器學習的內容,并影響到未來數據。將人工智能應用于法律領域,能否建立某種機制,用以協調規(guī)范性與學習性之間的矛盾,更好地揚長避短,發(fā)揮法律的功效呢?
人工智能是以生物進化的觀點模擬、延伸和擴展人的智能,人工智能方法應用于法律領域將對法律領域帶來極大的沖擊和便利。
首先,關于司法裁量的模型如何讓干癟的法條充實起來,能夠考察法律怎樣運行以及運行效果[23].法律是一種有關預期的科學,預期將來訴訟發(fā)生時,法院將做什么[24].事實上,無論判決是以法規(guī)還是判例為標準,法院對個案的裁判往往與人們的預期有出入,因為法官采用的司法解釋、遵循的先例可能有所不同,即便相同,也因法官個人的學習、司法經歷不同,而導致預期差異。計算模型本身具有高度反饋性,適時調整司法裁量差異,透過計算模型尋優(yōu)的過程,可探究大多數法官判案的利益平衡機制,能讓模糊的立法更具可操作性,從而促進司法裁量的趨同性,不必強求完全一致,但不同法官對同類案件的判決差異應控制在一定范圍。
其次,計算模型為立法研究者提供了一種可行的分析和考察其觀點可行性的新工具。計算模型對立法的促進主要體現在三個方面: 第一,立法過程從立法者角度出發(fā),對人們行為進行規(guī)制,然而法律運行的實際效果可能與立法者的初衷相去甚遠,借助計算模型的高度反饋性,可以考察其運行效果,及時進行立法評估。第二,借助網絡虛擬系統(tǒng)進行立法實驗。在網絡空間構造與實際系統(tǒng)對應的人工系統(tǒng),通過在線學習、離線計算、虛實互動,使得人工系統(tǒng)成為可試驗的“社會實驗室”,以計算實驗的方式為實際系統(tǒng)運行的可能情況提供“借鑒”“預估”和“引導”[25].德國出現了實驗法( experimental recht) [26],設有期限、伴有評估措施的“實驗法”立法可減少立法的“試錯”成本。建立立法的計算模型,擴展人工智能技術的運用范圍與深度,必將促進立法的實用性。第三,借助于符號邏輯和法律推理的技術,能夠發(fā)現立法中的語法錯誤和邏輯矛盾,促進立法文本質量的提高。
。ㄈ 計算法學的現實功能意義
計算法學是隨著人工智能與深度學習在法學中深入應用而產生,使用建模、模擬等量化研究方法來分析法律關系,讓法律信息從傳統(tǒng)分析轉為實時應答的信息化、智能化體系。計算法學對于應對和規(guī)避技術風險、促進英美法系和大陸法系的融合、促進司法系統(tǒng)的運行質量、提高立法與司法效率均具有積極的作用。
1. 法系融合功能
計算法學采用建模、模擬等量化研究方法,無論是基于規(guī)則、基于判例還是基于數據的法律模型,其元數據是判例、法規(guī)或二者兼有之。透過司法案例,英美法系可探索案例之間的援引關系,大成文法規(guī),法律的計算模型無疑將促進英美法系與大陸法系的深度融合。
2. 學科融合功能
計算法學是法學與計算機科學的交叉學科,借助于數據挖掘工具以及人工智能輔助手段,有利于發(fā)現法律運行規(guī)律,拓展傳統(tǒng)法學理論。同時,拓展計算機科學的研究領域,將人文科學代入計算機科學,增加其實用的廣泛性。
3. 未來法治功能
各種新生事物,譬如智能機器人的權益、無人駕駛侵權的處理、區(qū)塊鏈技術應用等,諳熟技術與法律原理的人才能制定出更有利于人類通常利益的法律法規(guī)。
4. 司法促進功能
基于非單調性法律論證建立司法裁量人工智能模型[27],透過模型能讓干癟的法律理論鮮活起來,能夠窺探其工作的內在機制。法律檢索模型、司法裁量模型、司法推理機制、法律智能回答機器人、法律專家系統(tǒng)等智能增強技術,將極大的促進司法效率的提高。
5. 司法增效功能
從復雜系統(tǒng)角度,法律體系的運行可看成是一個由立法者、法官、檢察官、律師等司法人員組成,通過立法、裁判、和解等方式在法律法規(guī)的治理下,并伴隨著諸如上訴、再審、立法評估等一系列立法與司法的交互作用[28].人工智能與法律在提供計算模式時,為法律研究人員提供另一種分析路徑和驗證思想的新工具,可減少法律體系運行的矛盾與摩擦。
6. 司法整合功能
將法律法規(guī)電子化,轉化為機器可識別的代碼,應用法律推理等人工智能技術在立法領域,有利于減少立法邏輯、語言的差異。
7. 深度學習功能
計算法學建立的模型可以考察法律怎樣運行以及運行效果,法律過程的模擬對于學習法律的學生來說提供了極大的便利,能夠讓學生快速掌握法律知識,積極進入法律角色。
三、計算法學的研究領域
計算法學是隨著人工智能與深度學習在法學中深入應用而產生的,使用建模、模擬等計算方法來分析法律關系,讓法律信息從傳統(tǒng)分析轉為實時應答的信息化、智能化體系,旨在發(fā)現法律系統(tǒng)的運行規(guī)律,促進立法與司法的科學性。從上述計算法學的定義可知,計算法學主要涉及理論與應用兩方面的研究,一方面人工智能等新技術有利于豐富和發(fā)展法學基礎理論,另一方面人工智能等增強技術將提高司法效率,減少法律系統(tǒng)運行功耗。
計算法學的研究內容多采用列舉的方式。Kevin Ashley 將涉及人工智能與法學領域的研究進行了列舉: 基于規(guī)則的法律推理、基于案例的法律推理、司法預測模型、法律論辯計算模型、法律本體結構、法律檢索模型、法律語言的機器學習、法規(guī)中提取法律信息、判例中提取法律信息、認知計算模 型 等[16]1 - 10.美國斯坦福大學 CODEX 中 心 主 任 Michael Genesereth 認 為 計 算 法 律 學( Computational law) 旨在用計算機理解法律規(guī)則,設計自動法律決策系統(tǒng),譬如智能或計算合同等[14].與計算法律學密切相關的法律信息檢索( 法律檢索技術、電子文獻發(fā)現技術、合同分析,合同年我們在《計算法學導論》一書中[12],綜合采用了屈茂輝教授對計量法學的劃分方法[29],將計算法學的研究內容分為: 立法的科學性研究、法律實施效果評價、法律對經濟社會發(fā)展影響評價、知識圖譜、驗證法學理論和法規(guī)的合理性、用于刑偵證據確定、實用性法律輔助系統(tǒng)等。
計算法學是一門新興學科,其研究內容宜采用開放式原則,將使用建模、模擬等計算方法來分析法律關系的這類研究都可以歸于計算法學。計算法學的研究目的主要有兩個: 一是透過模型驗證和完善法學理論,發(fā)現法律系統(tǒng)的運行規(guī)律,二是通過立法與司法模型,促進立法科學性與司法效率的提高。因此,計算法學的研究內容重點是促進理論和提高司法兩個方面。
計算法學的主要研究領域:
(一) 計算法學理論研究---旨在發(fā)現法律的成長規(guī)律
計算法學作為計算機科學、法學的交叉學科,對計算機科學與法學來說都有促進作用。對法學來說,計算法學為法學理論研究提供了新的視角,透過立法模型或司法模型,有利于發(fā)現法律運行規(guī)律,可完善已有法學理論,甚至發(fā)現新的法學理論。對計算機科學來說,計算法學拓展計算機科學的研究領域,且將人文科學代入計算機科學,增加模型的實用性。
計算法學的理論研究包含三層內容。1. 計算法學作為交叉學科涉及到的相關理論構建,諸如計算法學的學科地位、研究方法、研究內容等討論尚不充分。諸如計算法學是否法學獨立的學科分支,如何將計算模型融入現有的法律體制中去等基礎問題,尚需認真研究。2. 計算模型反映的規(guī)律性對傳統(tǒng)法學理論的補充和完善。霍姆斯在《普通法》開篇說過: 法律的生命不在于邏輯,而在于經驗。作為與司法實踐密切相關的學科,法學理論需要司法實踐的檢驗。國內外目前關于計算法學的研究,多是應用研究,而關于計算法學對于法學體系的變動、法學理論的促進和完善的相關研究成果尚不多見。例如,白建軍教授在《死刑適用實證研究》[30]對法律解釋理論進行發(fā)展。計算法學通過法規(guī)或案例的分析驗證法學理論,無疑將促進法學理論的縱深研究。3. 與人工智能等新技術密切相關的新生事物,如智能機器人的權益、無人駕駛侵權的處理、區(qū)塊鏈技術應用等,如何將對其進行規(guī)制,也是計算法學研究的任務之一。
(二) 立法研究---規(guī)則性向學習型轉變
發(fā)現正確的法律是法學研究的核心任務之一?茖W立法少不了對各相關社會條件精確的統(tǒng)計學分析、民意調查、所選行為模式的事先科學計量評估和博弈分析以及必要時的法經濟學的計算機模型預演[31].譬如,德國出現了設有期限、伴有評估措施的實驗法( experimental recht) ,將法律程序視為一種“社會理解的過程”,而不再是法律機構單邊自上而下的規(guī)制過程[26].
公眾的反饋與網絡社會實驗可提高法律對社會和法律結果的預測,減少成文法的模糊性[32].立法者常常困惑,采用何種方式減少罪犯的再犯。人工智能和數據挖掘技術對判決書、證據鏈、先例的研究,可發(fā)現法官的價值選擇趨向,并促進立法的可行性。川島武宜認為: 法律學邏輯論證的三段論的大前提與數學中的公理不同,它可以被法學界改變,并且無法用實踐和觀察的方法去驗證[33].虛擬網絡社區(qū)與實際的社會構成了兩個平行的社會,網絡環(huán)境為司法實驗創(chuàng)造了有利的環(huán)境,更有利于尋找合法與違法的零界點以及行為規(guī)制的最佳策略。同時,司法模型反映的穩(wěn)定性的規(guī)律,也為立法提供了較好的立法建議,經過特定的評估程序,即可提供立法參考,轉化為法律法規(guī)。
(三) 司法預測研究---找尋最優(yōu)的司法解決方案
實證法學家川島武宜認為法學是一種經驗科學,中心課題是裁判行為。霍姆斯主張“法律預測說”,即法律提供法官將來如何判決之預測[34].司法實踐表明,法官的裁判與個人的預測總是不一致,建立精準類案審判規(guī)則的智能輔助系統(tǒng)是司法模型追求的終極目標。國外關于類案類判的人工智能系統(tǒng)的相關研究起步較早,1970 年 Buchanan 開啟了人工智能與法律相結合的研究。
法律專家系統(tǒng)對法律專家的依賴性比較高,譬如案例特征由專家確定、案例相似性由專家標注繼而展開機器訓練等,由此產生的智能模型,主觀程度較高,且由于投入的人力過大,法律專家系統(tǒng)往往只對某幾類案件處理效果較好,普及面不夠。隨著大數據處理技術這幾年突飛猛進的發(fā)展,人們期望應用大數據挖掘工具,采用深度學習、知識圖譜、本體技術等手段深入理解自然語言,自動提取案例特征、自動對案例相似性進行排序。此研究正在興起,已有少量前期探索性成果,譬如歐洲研發(fā)了網上的 Eunomos 相似法律信息查詢系統(tǒng)[36],意大利研發(fā)了訴訟案例與既往案例庫的匹配系統(tǒng) eMediation,法律信息的深度神經網絡提取等[37].
(四) 法律的語義挖掘---結合背景的語義分析
法律信息由法律、案例、理論、程序、規(guī)則等各類法律知識組成,呈現出非結構化或半結構化的形式。譬如,案件裁判文書為半結構化數據,其中包括首部、事實( 案情描述) 、理由( 證據部分) 、判決結果等部分[38].多源異構的數據難以用傳統(tǒng)符號科學表達,深度挖掘法律信息,進行諸如法律知識的語義表達、法律語義檢索和查詢、法律信息管理等研究,是建立司法模型的研究基礎。
結合語義的背景和關聯研究,法律本體論已被廣泛應用于文獻查詢、數據和文件挖掘、計算機輔助擬定法律,法律匯編、建立裁量模型、多主體模擬以及環(huán)境資源管理的決策系統(tǒng)等[39].1999 年萊布尼茲法律中心開發(fā)的 FOlaw 系統(tǒng)[40],從法律功能的角度將知識分為規(guī)范知識、世界知識、義務知識、反應知識、元法律知識、創(chuàng)造性知識,系統(tǒng)描述和解釋法律推理中各種知識的運用及其相互關系。
。ㄎ澹 法律邏輯分析---轉向法律論辯邏輯
法律邏輯推理是建立法律模型的基礎。形式邏輯推理方法有歸納、演繹、類比推理,然而三段論的推理在司法實踐中并不盡如人意,除了立法不能達到預期的那樣“完美”以外,司法裁判過程也并非如形式邏輯預設的那樣,實際裁量過程僅是法官進行利益協調和平衡的過程,法律形式邏輯背后并存著各種立法和司法理由的相關價值和重要性的判斷,這種推理并非是一一對應的單調推理,而是具有不確定性、語境依賴性和容錯性的非單調推理[27].
司法模型是模擬法官作出司法裁判的過程,法律推理一直是法律與人工智能研究的核心,法律邏輯直接決定了司法模型的實用性。2012 年 Prakken 采用可廢止演繹推理,對社會法律的價值和先例的學習利用,推論出法規(guī)的有效性。確認以法律辯論( argument - based) 為中心的法律推理能更好的刻畫案件的情節(jié)[41].
(六) 司法管理系統(tǒng)---提高效率
人工智能增強技術對司法管理系統(tǒng)有著重大的影響,各國紛紛進行無紙化訴訟、審判文書的電子化處理,極大提高司法管理的效率。2016 年我國以大數據和人工智能技術為支撐的“智慧法院”建設列入國家信息化發(fā)展戰(zhàn)略,一些智能輔助辦案系統(tǒng)進入我國法院,融入立案、偵查、起訴、審判等司法權利運行系統(tǒng)全過程。
“智慧法院”系統(tǒng)不斷發(fā)展,有效推動了司法領域的智能化實踐。以上!206 系統(tǒng)”為例,以人工智能為基礎的庭審語音轉文字、裁判文書或起訴書的自動生成、法律文件輔助審閱、裁判文書證術支撐①。這些管理性系統(tǒng)對法官的工作效果進行評定,有效地提高法院管理和行政效率。在線調解系統(tǒng)、司法管理系統(tǒng)、司法信息輔助系統(tǒng)等這類管理系統(tǒng)功能明確,涉及的領域相對集中,在實踐中取得了較好的實施效果[42].
(七) 司法證據---輔助獲取證據
證據是訴訟的靈魂,是案件審理與裁判的核心和基礎。現代人工智能技術和信息挖掘技術已用于收集、獲取、檢驗、鑒定犯罪嫌疑人在犯罪過程中形成的各種痕跡、物品、物質、文書,為刑事案件的偵查破案、檢察起訴、法庭審判提供一種科學的司法證明。譬如,在司法審判階段,智能輔助辦案系統(tǒng)可針對實踐中取證環(huán)節(jié)易發(fā)、多發(fā)和常見問題,根據以往證據收集和采信的經驗教訓并結合法律及司法解釋確定的程序性規(guī)則和合法性要求,引導辦案人員依法采信證據[43].值得注意,人工智能雖然可用于證據鏈的印證和邏輯判斷,但自動提取的核心要素是否全面客觀、比對是否準確有效,證明力有無和大小仍由法官自主判斷和采信。
四、計算法學研究面臨的問題與發(fā)展前景
(一) 計算法學研究面臨的問題
人工智能應用于法學領域,一方面享受著人工智能帶給司法的高效和便利,另一方面也不可避免地承擔著數據、技術不完善性帶給司法的巨大技術風險。計算法學以法律數據為中心,使用建模的方式對數據進行分析,數據問題是計算法學研究面臨的核心問題。當前我國法律數據面臨的主要問題是:
1. 司法數據來源的全面性、真實性和客觀性有待提高[44].全國裁判文書網上公布的數據并非全樣本數據,且公布數據缺乏規(guī)范性指引和準確性審核,目前全國裁判文書網上的法院判決書有的存在一些錯誤,不能正確反映相關數據。人民法院、人民檢察院、公安機關等機構之間的數據不能兼容和共享,阻礙了數據的充分使用。
2. 法律相關數據多為半結構化、非結構化的多源異構數據,數據特征隱藏較深。裁判文書中所記載的判決信息并非中國司法決策過程中的關鍵信息,合議庭或審判委員會中法官的討論過程、法官判決后所撰寫的審判報告或許才記載了判決形成過程的相關信息,如一些酌定情節(jié)及其理由并沒有列入判決書中,因此必然造成語義分析不清、模型構建特征不明顯,直接影響法律模型結果的實用性。鑒于法律信息的復雜性,目前尚未發(fā)展出將自然語言處理技術、知識圖譜、深度學習、認知智能等技術深入融合法律系統(tǒng)而形成的獨特算法。
3. 法律數據涉及面廣、敏感度高,迫切需要保障數據安全和隱私[45].法院信息的數字化是每個法院面臨的問題,有的法院將數據電子化交由數據公司完成,數據公司對法院數據有掌控權,甚至有法院的電子數據因更換數據公司而喪失。雖然可通過數字簽名、訪問控制、對稱加密、Hash 算法等數據安全防護中常用的方案,結合差分隱私、隱私量化、匿名技術、泛化技術等隱私保護技術等保護司法數據,但目前的技術仍未能完全解決多源數據融合過程中的數據安全防護與隱私保護問題。
4. 人工智能技術產生的時間只有短短幾十年,其“魯棒性”( Robust,即系統(tǒng)的健壯性) 和可解釋。可見,也缺乏可交互性和操作性[45].美國盧米斯案中智能輔助量刑引發(fā)的爭議可知[46],美國罪犯再次犯罪的評估軟件 COMPAS 報告,僅提供了與特定群體相關的數據,且作出報告的方法是保密的。雖然目前人工智能模型能具有提高效率、減少重復工作和簡單推理等優(yōu)勢,但將知識與數據融合進行復雜推理的技術還不成熟,缺乏確定性處理能力,距離擁有認知和決策能力的智能技術還差之甚遠。
5. 人工智能輔助刑事裁判模型將繼承所錄入的種族和性別歧視信息。司法判決透過裁判,平衡各方利益,彰顯正義,裁判文書中隱含了立法者或法官的價值選擇,不可避免地存在歧視和偏向。來自 ProPublica 的 COMPAS 報告明確地指出,佛羅里達州的黑人被告人比白人被告人被錯誤地判斷為“有罪”的概率更高。若對此不加以糾正的話,種族歧視成為了人工智能的運算邏輯[47].
借助深度學習、語義分析、知識圖譜、認知智能等關鍵技術可構建“精準分案”和“智能化推薦”等可視化系統(tǒng),提高司法審判的效率和質量。但是,我們也應當注意到人工智能輔助刑事裁判的不確定性風險和可解釋性風險,預設法律程序和糾正措施避免出現新科技應用帶來的裁判不公和裁判失靈現象。
(二) 計算法學發(fā)展前景---方興未艾的新興學科領域
法學與人工智能、數據挖掘等最新技術與法學的對接可能為法學中的根本性、基礎性和前沿性的問題提供新的視角,跨學科研究領域的拓展有助于完善法律制度和法學基礎理論,為司法實踐提供更具可行性的解決策略與方法,促進立法的科學性與司法的公正性、效率性。
“人工智能熱”也帶動了“人工智能與法律的研究熱”,人工智能與法律的結合在我國司法實踐領域取得了令世界矚目的成績。2018 年最高人民法院正式上線運行了案情事實、爭議焦點、法律適用等為要素的“類案智能推送系統(tǒng)”,2019 年 1 月上!206 系統(tǒng)”推出“刑事案件智能輔助辦案系統(tǒng),安徽、貴州、重慶等地方法院紛紛推出了針對某類案件的類案指引。
計算法學的研究需要法學家與計算機科學的學者深度合作,正在吸引著眾多法學、計算機科學的研究者的目光,并將形成新的法律職業(yè)。目前已形成了諸如斯坦福大學法學院 Codex 中心,歐洲人工智能與法律的專委會等專門研究團體,正在吸引著更多交叉學科研究學者的加入。2018 年清華大學成立了”計算法學“專業(yè)、四川大學開設了”計算法學“課程,進行人工智能與法學的交叉研究和人才培養(yǎng)。
人工智能引發(fā)的倫理問題譬如機器人的主體地位、無人駕駛車的侵權責任、機器作品的版權等,人工智能在法學領域的具體應用譬如建立司法裁判模型、語義分析模型、立法實驗等,人工智能產品進入法學領域引發(fā)技術風險防控機制與傳統(tǒng)司法協調機制改革等問題,正有待于我們進行更為廣泛和深入的研究。原載《現代法學》 2019 年第 6 期