當(dāng)前法律大數(shù)據(jù)分析的研究和實(shí)踐正面臨歷史性機(jī)遇和現(xiàn)實(shí)性挑戰(zhàn),應(yīng)該抓住機(jī)遇,迎接挑戰(zhàn),并期待數(shù)據(jù)來(lái)源在質(zhì)和量上獲得提升。
法律大數(shù)據(jù)分析的歷史性機(jī)遇主要是指近年來(lái)司法數(shù)據(jù)的公開,這是我國(guó)法治化進(jìn)程的重要體現(xiàn)。第一,裁判文書數(shù)據(jù)的公開。最高人民法院于2014年初設(shè)立“中國(guó)裁判文書網(wǎng)”,截止到2016年5月15日,已經(jīng)公布了約1739萬(wàn)篇裁判文書。根據(jù)四川大學(xué)法學(xué)院“法律大數(shù)據(jù)實(shí)驗(yàn)室”與“法合實(shí)驗(yàn)室”聯(lián)合發(fā)布的《法律大數(shù)據(jù)雙年報(bào)(2014-2015)》數(shù)據(jù)估算,2016年裁判文書公布總量預(yù)計(jì)將超過(guò)1500萬(wàn)篇;到“中國(guó)裁判文書網(wǎng)”建立5周年之際,即2019年年底,裁判文書公布總量將超過(guò)1億篇。第二,案件審判流程和案件執(zhí)行數(shù)據(jù)的公開。最高人民法院設(shè)立了“中國(guó)審判流程信息公開網(wǎng)”和“中國(guó)執(zhí)行信息公開網(wǎng)”,全程公開案件審判流程數(shù)據(jù)和案件執(zhí)行數(shù)據(jù),現(xiàn)階段可以進(jìn)行部分?jǐn)?shù)據(jù)的查詢,相關(guān)司法數(shù)據(jù)總量將數(shù)倍于裁判文書數(shù)據(jù)。第三,全國(guó)和地方法律法規(guī)文件數(shù)據(jù)的公開。我國(guó)現(xiàn)行有效的全國(guó)法律規(guī)范性文件總量為20余萬(wàn)部,地方法律規(guī)范性文件總量為100余萬(wàn)部。2015年修改后的《立法法》授予了設(shè)區(qū)的市的人民代表大會(huì)及其常務(wù)委員會(huì)地方性法規(guī)立法權(quán),可以預(yù)見,未來(lái)我國(guó)地方性法規(guī)以及相關(guān)地方政府規(guī)章的數(shù)量還將大幅增長(zhǎng)。
法律大數(shù)據(jù)分析的現(xiàn)實(shí)性挑戰(zhàn)主要是數(shù)據(jù)分布和數(shù)據(jù)質(zhì)量的挑戰(zhàn),尤其是數(shù)據(jù)質(zhì)量對(duì)數(shù)據(jù)清洗和數(shù)據(jù)挖掘提出了較高要求:第一,裁判文書分布的不均勻性。在844個(gè)民事案由、469個(gè)刑事罪名和918個(gè)行政案由中,前十大案由或者罪名的案件占比約為三分之二。從筆者的研究經(jīng)驗(yàn)來(lái)看,判決書數(shù)量超過(guò)200篇才能進(jìn)行一定的統(tǒng)計(jì)分析,滿足這一需求的民事案由不足300個(gè),刑事罪名不足150個(gè),行政案由不足100個(gè);判決書數(shù)量超過(guò)1000篇才能進(jìn)行較為深入的數(shù)據(jù)挖掘,滿足這一需求的民事案由不足200個(gè),刑事罪名不足100個(gè),行政案由不足50個(gè)。第二,裁判文書質(zhì)量參差不齊。對(duì)法律大數(shù)據(jù)分析影響最大的是裁判依據(jù)的錯(cuò)誤引用。例如《民法通則》總計(jì)156個(gè)條文,但有的法院竟然引用了第1108條。此外,有的法條不但從未被正確引用過(guò),而且同一法院多份判決書還“以訛傳訛”,有的條文被錯(cuò)誤引用的次數(shù)居然超過(guò)了被正確引用的次數(shù),有的還出現(xiàn)了數(shù)字顛倒。第三,主要裁判依據(jù)范圍的不確定性。法律、行政法規(guī)和司法解釋是判決書的主要裁判依據(jù)。根據(jù)筆者長(zhǎng)期跟蹤研究,我國(guó)現(xiàn)行有效法律為249部,行政法規(guī)為555部,司法解釋為1251部,但仍然缺乏官方權(quán)威認(rèn)定。地方規(guī)范性文件更是數(shù)量龐雜,部分存在范圍不明和效力存疑問(wèn)題。
法律大數(shù)據(jù)分析的開展主觀上要加強(qiáng)數(shù)據(jù)挖掘方法的研究,客觀上則期待數(shù)據(jù)來(lái)源在質(zhì)和量上的提升。第一,裁判文書數(shù)據(jù)的全面公開。“中國(guó)裁判文書網(wǎng)”2015年公布裁判文書713萬(wàn)篇,同期審結(jié)、執(zhí)結(jié)案件1673萬(wàn)件,同比公開率約為43%.未來(lái)裁判文書的公開比例應(yīng)該逐步提高,最終實(shí)現(xiàn)全面公開。第二,裁判文書數(shù)據(jù)質(zhì)量的穩(wěn)步提高。首先是案由信息的標(biāo)準(zhǔn)化,部分裁判文書未準(zhǔn)確包含民事案由或刑事罪名信息,行政案由則亟待規(guī)范。其次是案號(hào)信息的統(tǒng)一化,判決書案號(hào)缺乏全國(guó)統(tǒng)一規(guī)劃,容易造成“同案號(hào)不同案”的情況。最后是裁判依據(jù)的準(zhǔn)確性。第三,法律法規(guī)文件數(shù)據(jù)的權(quán)威回溯性發(fā)布。全國(guó)人大法工委應(yīng)該建立法律、法律解釋、地方性法規(guī)、司法解釋和其他規(guī)范性文件的權(quán)威發(fā)布平臺(tái),國(guó)務(wù)院法制辦應(yīng)該建立完整的行政法規(guī)、部門規(guī)章、地方政府規(guī)章和其他規(guī)范性文件的權(quán)威發(fā)布平臺(tái),并實(shí)現(xiàn)全面的回溯性范圍和效力認(rèn)定。