竞彩玩法及中奖规则/足总杯在线直播/欧洲杯2021赛程/内蒙古中优足球俱乐部

 
本站首頁 關于我們 法律圖書館與法律信息研究會 法律信息研究 中外法律圖書館 法學文獻與檢索 政府信息公開 法律圖書館導航 法律法學網導航
法律信息資源
法律信息服務
數字信息檢索
數字技術發展
專業網站建設
澳門法律信息
  當前位置:首頁 > 法律信息研究 > 法律信息資源
法律信息資源
暫無下載資料

 中國司法裁判文書網絡公開的大數據分析
            馬超等 點擊量:13062
清華大學法學院
【摘要】
在互聯網公布裁判文書是本輪司法改革著力推進的一項改革措施。自 2010 年與 2013 年先后兩版《關于人民法院在互聯網公布裁判文書的規定》發布以來,裁判文書上網已經取得了巨大的進步。我們利用信息技術對目前中國裁判文書網公布的所有文書進行了重新提取與分類整理;對已公開文書進行了一次全景式的掃描,通過翔實的數據展現了我國裁判文書公開的現狀與態勢。利用這些數據,結合實地調研,通過定量分析與定性分析相結合的方式,我們對裁判文書公開的全面性、及時性以及公開內容的妥當性進行了全面考察。結果顯示,文書公開的全面性依然不足、公開的及時性效果欠佳、公開內容規范化程度不高,背后存在公開規定細節模糊、監督管理體系不夠完善、信息技術能力不足、審判區域差異明顯等原因。我們對這些問題給出了力所能及的改進建議。
【關鍵字】
裁判文書上網;司法大數據;司法公開;中國裁判文書網
    

    一、引言

    (一)裁判文書上網的背景與進程

    1.裁判文書上網的背景與價值

    裁判文書公開是司法公開的基本內容,是樹立司法公信力的基本要求,也是本輪司法改革的重要目標。與人員管理改革和審判質量改革等改革內容相比,裁判公開在內外部,均有獨特的價值。就內部功能而言,裁判文書上網有助于倒逼審判公正性與文書質量的提高。當一份裁判文書不再只面對個案的當事人和少數的法律專業人士,而是有可能接受社會大眾的檢閱時,法官無疑會更加謹慎地對待案件的審判與裁決。就外部功能而言,裁判公開所面向的是不特定的人群,相較于員額制、省級直管等內部改革,它的受眾范圍要廣泛得多。司法改革可以藉此揭開司法的神秘面紗,拉近與公眾的距離,收獲更大的社會影響。對于社會來說,裁判文書是司法公正性和公信力的集中體現,是民眾對司法公正美好想象的具體載體,法院的公正形象正是由一份份的司法文書累積塑造的。

    2.裁判文書上網的進程

    最高人民法院(以下簡稱最高法院)先后在2010年、2013年、2016年三次發布了《關于人民法院在互聯網公布裁判文書的規定》(以下簡稱2010年版文書上網規定、2013年版文書上網規定、2016年版文書上網規定)。它們分別代表了裁判文書上網進程中的不同階段。

    在2010年以前,裁判文書的公開是零星的,主要是通過一些學術研究渠道,缺乏專門的批量公開的渠道。2010年版文書上網規定發布以后,一些省市的中高級法院開始在各自網站有選擇性地公布一部分裁判文書。具體數目雖然難以作出統計,但參考北大法寶的收錄數據,可以從側面得到印證。在2011年到2013年之間北大法寶收錄的結案文書數量從2011年的四十多萬份攀升到2013年的近百萬份,增長了一倍多。2013年版文書上網規定發布以后,收錄數量更是直線躍升,一年時間增長了兩倍,2014年收錄量近三百萬份。由此可見,兩版文書上網規定在推動文書上網的過程中起到了“發動機”的作用。2016年版文書上網規定再次完善了相關要求,必將大大推進裁判文書上網;但它尚未生效,因而不在報告討論的范圍。

    (二)既有的研究

    自2013年“中國裁判文書網”(以下簡稱裁判文書網)上線以來,不少具有前瞻意識的司法從業人員和數據從業人員均嗅出了其中潛在的巨大價值。一些法律界內外人士結合相關網絡技術,利用裁判文書網所公開的數據做過一些有益的研究。

    在學術界,一些學者在裁判文書網建立之前就已經關注到了司法公開的重要意義。浙江大學錢弘道教授與浙江省高級人民法院合作,展開“司法透明指數”的研究。中國社會科學院田禾教授及其帶領的研究團隊自2011年起,每年發布《中國司法透明度指數報告》。這些研究對司法公開與裁判文書上網均起到了積極的推動作用。但這些報告普遍采用的仍然是項目打分制,關注重點在于法院公開信息種類的全面性與實效性,并不以大數據分析為主,與本報告的關注問題與研究路徑有所區別。還有一些學者和實務人士較早利用裁判文書網的數據進行觀察或者研究。周蔚博士的《大數據解讀2014年裁判文書公開》,對裁判文書網數據作全景式掃描。針對具體的法律部門或某一地域作為數據分析樣本的則更為多見,如高榮英律師所做的《北京市專利侵權案件數據分析報告》,《財經》記者王麗娜所做的《公開判決書中的賄賂案件大數據分析》3,以及王璟文律師所帶領的課題組針對廣東省民商事案件所做的一系列大數據分析報告等。這些分析報告一般均公開發布在互聯網,使用普通檢索方式即可獲得。此外,一些商業性質的法律服務機構也會為各級法院提供更專業的一對一數據分析服務,但這些報告一般并不對外發布。

    上述這些數據分析報告作為法律界的“新生事物”,在許多方面顛覆了傳統法律人士的想象,具有前瞻性和開拓性,也具備相當的實用價值。盡管如此,這些報告的數據收集與分析方法仍然較為粗放,具有一些普遍的缺陷。主要有以下幾點:第一,現有的報告數據來源往往直接取自裁判文書網的檢索結果;而根據我們觀察,裁判文書網的檢索算法并不完全準確,一些數據甚至難以自圓其說。例如,在裁判文書網檢索設定法院層級為“基層法院”,審判程序為“二審”,仍可獲得數千件案件的檢索結果;在裁判文書網民事案件類別下檢索“信息公開”,也可以獲得相當數量的檢索結果。第二,取詞檢索的數據獲取方法過于簡單,缺乏“精加工”,易導致結果偏差。由于裁判文書的復雜性,特別是現階段文書的格式化程度不高,它并不能完全滿足數據檢索精確定位的需要。某一特定字段出現在裁判文書中的原因可能與檢索者的實際需求相去甚遠,還有一些項目不借助技術手段更是難以獲知。例如,最高法院有裁判文書生效后7日內上網的規定,究竟有多少文書在公開時符合這一要求,通過普通的檢索手段是難以獲得的。第三,一些數據分析報告沒有交代其檢索的方法和標準,其研究結果無法驗證。總而言之,現有的數據分析報告盡管具有一定的價值,但其精確性仍難以作為學術研究的可靠依據。

    (三)研究對象與研究目的

    本報告以裁判文書上網為研究對象,主要關注裁判文書網自上線以來各級法院文書發布的情況。必須指出的是,裁判文書網雖然是全國統一的公開渠道,但并非唯一渠道。許多中高級法院除了在裁判文書網公開文書外,也有自建的公開渠道。限于研究能力,我們無法對這些省級網站的公開文書逐一進行統計。本報告的主要研究對象與數據來源仍是裁判文書網。

    本報告主要目的在于對裁判文書網上線以來所公開的所有裁判文書作一次全面的深度掃描,為法律界人士提供一份可供參考的文書公開全景圖,并就這份全景圖中的一些現象給出我們的分析。同時,考察最高法院2013年版文書上網規定的具體落實情況,并提出相應的改進建議,也是本報告的主旨之一。因此,我們在本報告中主要關注的是裁判文書網究竟公開了哪些文書、各部分占比如何、文書公開的方式是怎樣的、公開文書的質量如何、文書公開的及時性如何、現有的裁判文書上網規定是否得到了落實、現有規定的可操作性如何等。換言之,我們在報告中更側重于關注的是文書“公開”的一面,而非具體的文書“內容”。

    (四)研究方法

    本報告主要采用定量分析與定性分析相結合的方法。一方面,作為一份以大數據作為主要方法的研究報告,定量研究是我們的題中應有之義。我們與北京華宇信息技術有限公司(以下簡稱華宇公司)的技術人員合作,花費一年多的時間,搭建了較為完善的數據庫與檢索系統,盡可能地保障數據的精準性與可靠性。另一方面,盡管我們身處數據時代,但數據并非萬能,它既受限于當前的技術水平,也受限于復雜的現實環境。在報告中,我們對數據的使用仍然是謹慎的;在許多問題中,我們都作出了保留說明,并力爭使其與過往的經驗研究能夠相互印證。在社會熱點案例公開與裁判文書隱名等不適合運用大數據進行分析的問題中,我們仍然采用小樣本的抽樣調查和定性分析作為基本研究手段。我們相信大數據作為一種研究方法將會在未來的法學研究中占據一席之地,但并不迷信大數據。

    本課題組在研究期間還曾先后到最高法院信息中心、東南沿海、西南內陸等地區的各級法院進行調研,在四級法院了解到了有關裁判文書公開的第一手信息與資料。通過考察這些調研收集到的經驗素材和直觀感受,不僅有助于我們解釋報告中的一些數據現象,而且有助于我們更深刻地理解這些現象背后的制度成因。

    (五)技術說明

    本報告的基礎數據來源是裁判文書網自上線以來所公布的所有裁判文書。本課題組與北京華宇信息技術有限公司的技術人員進行了緊密合作,對裁判文書網所提供的裁判文書通過一定的技術手段進行提取之后,架構了全新的系統進行分類整理。在系統架構的主要階段,本課題組均與技術人員一起合作,通過一年多的不斷調試,反復通過人工閱讀與軟件檢索進行比對,在現有的技術水平下最大限度保證了數據的可靠性。其中,以下幾點需要特別說明。

    第一,在分析對象的時間限定上,我們將本報告的分析對象上傳起始時間定為裁判文書網上線的2013年7月1日,截止時間定為2015年1月31日。5

    由于現實中裁判文書上傳的及時性不佳,以及各級法院仍然在不斷上傳裁判文書網上線之前的裁判文書,所以裁判文書網的數據一直在不斷變動之中。例如,我們在研究中發現,許多制作于2014年甚至更早的文書,至今仍然在不斷上傳導致2014年的公開總數一直在變動之中。因此,我們必須為研究對象設定一個閉合的時間區間,否則研究中的分子與分母將始終無法確定。這也是許多現有分析報告數據不夠精確的原因之一。我們所使用的數據庫在2015年12月31日后,除技術改進外,數據不再更新。這樣盡管損失了一定的數據全面性,但保證了同一類別下的數據在不同的提取時間下是相同的,不同種類的數據也是可比較的。

    第二,在系統調試中,我們發現數據不精確主要是以下三種原因所導致的,我們一一作出了技術應對。(1)裁判文書本身的寫作錯誤。如落款時間應為“二〇一四”,文書中寫為“二〇〇一四”;“××縣人民法院”,則誤寫為“××縣中級人民法院”。類似的寫作錯誤不勝枚舉,在一定程度上導致對一部分裁判文書無法判斷具體屬性。我們的具體辦法是從這些屬性缺失的文書中抽取一部分進行人工閱讀,總結常見的錯誤類型,對系統進行針對性的修改,使其能夠分辨較為常見的一些寫作錯誤,盡可能地挽回了這部分數據的有效性。目前經過我們修正的含有各種錯誤類型的裁判文書約占全部的5%。

    (2)裁判文書網自身的問題。由于我們數據庫的基本數據來源仍然是裁判文書網,其中一些技術問題也難以避免地進入我們的系統之中。比如北京某法院曾經將上百份信息公開案件的文書錯劃為民事裁判文書,一些基層法院審理的案件在裁判文書網卻被歸類為二審文書。這些錯誤盡管數量不多,但可能在進行某一類問題分析時產生關鍵影響。我們的應對辦法是盡可能通過技術手段將裁判文書還原為原始狀態,即未上傳之前的原始格式,然后按照一定的技術標準重新進行數據清洗與屬性歸類。

    (3)不同系統之間的格式兼容問題。由于技術標準的區別和系統架構的不一致,即便是同樣數量的文書錄入不同的系統,其得出的總數也會有很微小的區別。在不同標準下,總是存在個別無法識別的文書。這也部分地解釋了,市場上許多法律服務機構提供的法律檢索數據庫,原始數據均來自裁判文書網,總量卻有高有低。為了保證數據的權威性,技術人員通過不斷的技術改進與系統調試,盡可能地與中國裁判文書的數據總量保持一致。如我們在2016年1月1日通過截圖方式保存的裁判文書網當日總數為14,294,297篇,目前我們數據庫中文書總數為14,555,018篇,誤差在2%以內。6

    第三,在本報告中,常常會出現將一部分數據列為“屬性缺失”的情況。這里的“屬性缺失”主要指系統無法識別的裁判文書,也包括一些可以識別但因為各種原因無法利用的文書。屬性缺失主要是因為個別文書由于文件損壞或質量粗糙實在難以識別。盡管在總量中占比極小,但我們仍然謹慎地將個別無法解決的問題在做具體分析時列為屬性缺失,而不是一概忽略。除此之外,還有一些裁判文書問題是技術手段無法解決的。比如安徽省合肥市中級人民法院的一份刑事裁定書[案號(2014)合刑執字第04705號],發布日期為2014年6月9日,但文書落款卻為2014年6月12日也就是說,這份文書“神奇”地在制作完成之前就已經發布了,它的上傳與制作間隔天數為負值。因此,盡管這份文書我們可以通過技術手段識別,但在考察裁判文書上傳的及時性時,我們必須選擇性地將其列為屬性缺失類文書。與此相似的數據問題還有許多,限于篇幅不再一一列舉。

    第四,必須聲明的是,受限于我們的經驗與水平,以及技術發展的階段性,本報告肯定仍存在許多瑕疵與漏洞。盡管我們與技術人員緊密合作,做到了盡可能完善,但問題始終是難以窮盡的數據也永遠不會完美,誤差總是不可避免的。

    二、裁判文書公開的全面性考察

    (一)2013-2015年裁判文書公開概況

    1.裁判文書發布總量

    裁判文書網開通時間為2013年7月1日。但制作于2013年之前的部分裁判文書,在各級法院的努力下,也一直在裁判文書網陸續公布。本報告的考察對象是裁判文書網開通以來至2015年12月31日發布的所有文書。在上述區間內,我們共收集到14,555,018篇裁判文書。這些裁判文書制作時間主要集中于2014年與2015年。我們根據最高法院網站發布的《人民法院年度工作報告(2014)》與《2015年全國法院審判執行情況》中公開的數據進行計算,得出2014年與2015年全國總共審執結案件數約為30,520,675件。公開文書數量與辦結案件的比例在50%左右。盡管案件與裁判文書并非是一一對應關系,一個案件可能有多份文書存在(比如法院在作出駁回管轄異議的裁定后,繼續審理該案件,并作出判決);而且案件辦結時間與發布時間之間往往存在比較長的間隔,因此這種比較并不完全準確,但具有一定的參考意義。考慮到裁判文書公開推進時間尚短,軟硬件基礎設施還在建設過程中,50%左右的文書公開比例值得贊賞,也令人鼓舞。但另一方面,與裁判文書公開的目標和最高法院的要求相比,文書公開的比例在未來應當還有很大提升空間。

    2.裁判文書類型分布

    表3為各種裁判文書類型在總量中的分布情況。由表3可知,判決書占比超過一半,占相對多數。判決書與裁定書合計占比超過98%,居于絕對多數。這符合法院作為一個審判機關的職能定位。但值得注意的是,其他幾種程序類文書類型,雖然占比較小,但仍然存在。在《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》(以下簡稱《理解與適用》)中,最高法院明確將裁判文書限定為判決書、裁定書、決定書與調解書。但由于2013版文書上網規定第4條第3項明確將調解書列為公開排除事項,實際應當在互聯網公布的裁判文書只限于判決書、裁定書、決定書三種。9因此,其他類型文書的存在,只能算是一個意外的驚喜。但被明確排除公布的調解書仍然有一萬多份被公布,按當時的規定,就屬于把關不嚴了。表3中屬性缺失部分占比為0.76%,不到1%。考慮到技術原因與現實原因,這一水平應該說是較為理想的。

    3.案件類型分布

    表4為所有公布裁判文書中,不同案件類型的文書數量與占比。民事類文書占比62.54%,穩居第一。刑事類文書接近20%,執行類文書近15%,行政類文書3.62%。我們根據《人民法院年度工作報告(2014)》中給出的公開數據進行計算,得出2014年度各類案件審結數量占總審結案件的大致比例,也列在表4中。民事類文書、執行類文書、行政類文書在文書總量中的占比與這三類案件審結占比基本相符。但刑事案件相關文書公開的比例最高。根據計算,2014年刑事審結案件占全國審結案件約8.29%,往年的數據也大致是在這一水平上下浮動,但刑事類文書卻占公布文書總量的18.61%,兩者相差10%以上。其中一個原因可能在于刑事案件中調解結案的數量極少,因此公開比例相對更高。另外,表4中的其他案件文書是指一些不常見的案件類型文書,如司法救助類案件,區際司法協助類案件等。

    4.公開裁判文書的時間分布

    (1)裁判文書制作時間年度分布

    表5為目前數據庫中所有裁判文書的制作時間分布。從表5中我們可以發現,雖然文書上傳主要以裁判文書網正式上線后的2014年、2015年為主,但在之前的時間區間內并非一片空白。據我們調研了解,目前一些地方法院都在有計劃、有步驟地上傳過往裁判文書,這是建構一個資料健全的數據庫的基礎環節。需要說明的是,在實際檢索中,早于2001年或晚于2015年的裁判文書也有零星存在。但我們經過人工閱讀后,發現這類文書大部分都是書寫錯誤或識別錯誤。如案號為“(2012)珠金法民一初字第1281號”的民事判決書,在裁判文書網制作時間被識別為1996年。原因在于系統錯誤地將該判決書中包含的借據日期作為了制作時間。由于這部分文書數量極少,缺乏參考意義,我們將其一并計入屬性缺失。

    (2)裁判文書上傳時間年度分布

    表6是我們通過提取文書的上傳時間匯總所得。由于裁判文書網為2013年7月1日開通,所以2013年只有7月1日之后的數據。實際上,裁判文書網正式對外啟用是在2014年年初,2013年的數據量缺乏參考意義。從表6可以看出,2014年作為啟動年即上傳了約558萬份文書,而2015年更是有接近900萬份的上傳量,比2014年提高了60%多。截至2016年8月23日,2016年共上傳了文書約570萬份,估計全年上傳量可以達到1000萬份左右。可見,裁判文書公開的推進是迅猛的,最高法院對下級法院的督促是有效的。

    (3)裁判文書上傳時間月度分布

    從表7中30個月的月度分布數據,我們可以證明兩點:第一,年底突擊上傳的現象得到證實2014年12月的上傳文書數量幾乎是上一月的三倍,2015年12月的數據也幾乎是11月的兩倍,10月的三倍。可見年底突擊上傳的現象十分突出這顯然是法院采用年底考核方式的結果。第二,季末突擊上傳現象普遍存在。仔細觀察表7,不難發現,每季度的第三個月,文書上傳量相比前兩個月總是會有小幅度上揚。這與我們在調研中得知的高級法院在文書上傳工作中實行“季度小考,年度大考”的信息相一致。

    (4)裁判文書上傳時間的每日分布

    我們提取了在限定區間內每一天的上傳文書數量,但由于數量龐大,九百多天的信息直接列出,既難以展示,也很難一望而知其中隱藏的信息。因此,我們將每月同一天的上傳文書數量進行相加,如我們將三十個月每月第一天上傳的所有文書量相加,即得出所有在每月第一日上傳的總量,依次類推,將每日的數據總量計算出,再進行比較。理論上,如果存在普遍的月中或月底突擊上傳現象,是可以得到的,結果如表8所示。由表8可以看出,在以每月為觀察區間的情況下,確實存在月底上傳量相對于月初和月中的提升。但我們認為這一現象不夠明顯。因為在存在季末突擊和年底突擊上傳的情況下,月底上傳總量受到每季度末月月底與每年十二月底上傳量的拉升,很難斷定月底總量的提高是月底突擊上傳的結果。在我們所調研的幾個省市中,有些省市確實存在由法院審管辦在每月底批量上傳文書的情況,但并非每個省均如此安排。因此,我們很難認定這一情況是普遍現象。

    為了更進一步考察這一問題,我們統計了每季度中間月份上、中、下旬的文書上傳情況。排除季末月是為了限制季末與年底突擊上傳現象的影響,而排除季初月則是為了限制數據上傳延遲現象的影響。從目標月份的統計結果來看,確實存在每月下旬文書上傳量相較于上旬的數量提升。但仔細分析,卻很難用這一數據證明存在月底突擊上傳的現象。

    第一,在統計的八個月中有兩個月的下旬上傳量其實是下降的(2014年11月與2015年2月)。如果存在制度意義上的月底突擊上傳,那這一數據是難以解釋的。

    第二,2014年2月的數據不具有參考意義,應予排除。2014年2月各級法院都處于文書上網的啟動階段,中下旬相對于上旬的數量暴漲顯然不是月底突擊上傳的結果。如果排除掉這一數據,三旬之間的上傳量數字會進一步拉近。

    第三,下旬數據相對于上旬與中旬分別只有42%與12%左右的增長,這與季末與年底突擊上傳中幾倍的增長量完全無法相提并論。

    第四,下旬的上傳量雖然較高,但中旬相對于上旬也有較大的提高。如果存在月末的突擊上傳,那么月中的高上傳量又該如何解釋呢?

    綜上,對于表8中反映的問題,我們認為存在兩種可能的解釋。一是表中的數據可能反映了法院內部具體負責文書上傳的部門月初存在工作拖沓的問題,但不能證明存在普遍的月底突擊上傳;二是部分省份的法院有月底突擊上傳的情況,但并非全國法院的普遍現象。

    5.公開裁判文書的地域分布

    我們對全部公開的文書按省份進行了排名,公開數量排名前三的分別為浙江、山東、江蘇。根據全國審判情況來看,這三地同時也是全國每年收結案件最多的省份。總體上來看,各省公開文書量的排名與各省案件審判的排名是基本一致的。此外,我們還統計了各省高級法院的工作報告中公布的全省結案量,并與我們提取的時間區間內的各省文書公開量進行了比較。這種比較盡管不完全準確,但有相當的參考價值。從表10中的數據來看,文書結案比超過60%的有浙江、山東、安徽、河北、陜西等省份,構成公開領先的第一梯隊。尤其是陜西表現出色,比例接近80%,遠遠領先第二名;河南、福建、湖南、湖北、廣西、寧夏等省比例也都超過了50%,居于第二梯隊;余下各省比例都在20%-50%之間。總體來看,經濟發達省份的公開文書量不僅超過經濟落后省份,公開比例也相對更高。另外,值得提及的是,本部分將最高法院的文書公開量一并進行了提取,一起列入表10中。從數量上看,最高法院在2016年之前一共公開了11,080份裁判文書,相較于最高法院2014年與2015年的總體案件審結量,經過計算比例約為46.13%。這個數字與全國平均數大體持平。這說明在文書上網的道路上,最高法院不僅是一個規則的制定者,也是一個踐行者。但考慮到最高法院作為終審法院的職能定位,考慮到其所辦案件的指導意義,這個比例仍然是偏低的。理論上,最高法院所有的裁判文書都應當向社會公開,“最高裁”文書不應有秘密。最高法院仍需努力!

    (二)2014年裁判文書公開特別分析

    為了更清晰地展現裁判文書網目前文書的分布情況和上傳趨勢,我們繼續對研究時間區間進行限縮,用一整年的完整數據作為分析對象。具體做法是,我們將整個數據庫所有制作于2014年的文書單獨抽取出來進行分析。之所以選擇2014年作為重點分析的區間,原因有三:第一,《理解與適用》中明確要求各級法院從2014年1月1日開始上傳文書。前文的數據也證明,各地法院開始在裁判文書網上傳文書基本始于2014年年初,2013年12月上傳文書5000多份,2014年1月即暴漲到12萬份以上。因此,將2014年作為中國裁判文書在互聯網發布的元年應該是沒有問題的。第二,由于目前文書上傳的及時性尚難以達到最高法院的要求,根據我們的統計,目前數據庫中2014年制作的文書,仍有一小部分是在2015年上傳的。我們抽取的制作于2014年的裁判文書也包括2015年上傳的2014年文書。這一數據更具備完整性。第三,同樣由于數據的延遲性,2015年的文書在2016年仍在陸續上傳中,無法保證數據的完整性,選擇2014年更有利于分析的展開。當然,2014年制作的裁判文書進入2016年以后還在陸續上傳,但數量已經很小。

    1.2014年裁判文書公開總量及文書類型分布

    目前數據庫中共有2014年公開文書6,095,938份。其中2014年公開了4,299,283份,占比70.53%;2015年公開了1,796,655份,占比29.47%。11

    由此可見,近30%的2014年文書是遲延到下一年才上傳的,即便考慮到等待文書生效導致的延遲,這一比例仍顯太高。

    2.2014年裁判文書案件類型分布

    我們根據最高法院公布的數字計算出了主要案件類型中上傳文書與審結案件的比例。從數據上來看,刑事案件與行政案件的比例均超過了100%,這個數字在調研中得到了部分印證。由于刑事案件與行政案件的結案方式較為單一,一般都是判決或裁定,而且大部分案件都不止一份裁定,所以比例超過100%是正常現象。但是民事案件結案方式中調解結案比例較高,一些基層法院派出法庭的調解結案數量超過總結案量一半是常有之事。按照規定,調解書屬于公開排除事項。因此,民事案件比例較低也是可以理解的。賠償案件與執行案件的公開比例較低,推測可能有三種原因:一是這兩種案件中也存在調解結案的情況;二是這兩類案件中可能涉及當事人隱私較多,可能一些法院考慮到其敏感性,選擇了不公開文書,比如一些司法賠償案件;三是這兩類案件一般以裁定結案為主,最高法院在《理解與適用》中有這樣一段話,“對于裁定書和決定書,可以根據具體類型和內容,選擇與當事人實體權益關系密切的裁定書、決定書在互聯網公布”12。也就是說裁定書的公開地方法院是有一定的選擇權的,與判決書的要求不盡相同。因此這兩類案件文書公開量偏低與現行規定也有一定關系。比如我們在調研中就遇到過一類情況,有些地方對執行庭公開文書的要求較為寬松,只規定了公開必須達到一定數量,沒有對公開的比例作要求。

    3.2014年裁定書的類型分布

    中國法院所使用的裁定書具體種類繁多。根據我們統計,在各種審判程序至少存在144種裁定書。但除了民事、刑事、行政、執行之別,裁定書一般不再標明裁定書的具體類型,而只籠統地使用“裁定書”作為名稱。由于無法從裁定書的名稱或者字號中識別裁定書的具體類型,我們只能通過人工抽取的方式判斷。具體的做法是,對裁定書的尾段進行關鍵字提取,以確定其所處的審判程序與裁定類型。這種方法有較大誤差,但在沒有其他路徑的情況下,統計結果仍然為我們提供了關于裁定書具體類型的有益信息。

    有必要說明的是,表14中各項裁定書總數相加為2,299,106份,相比于上文的2014年共公開2,793,281份的裁定書,覆蓋率為82%左右。導致這一結果的原因是,裁判文書表達方式的多樣化和技術能力限制。我們按照法院級別、結案方式、審判程序、案件類型、文書類別五個指標來確定一份裁定書的具體屬性;五個指標中,單個指標的裁定書提取覆蓋率均在96%以上,但由于各個指標的覆蓋范圍呈交叉狀態,綜合覆蓋率在現有技術條件下只能做到82%。我們已經根據需求多次修改算法與程序,但限于目前的文書規范化程度不高與文本挖掘技術的水平有限,目前這已經是努力之后的結果。但我們認為對這一數據在相當程度上仍然是有參考價值的。觀察表14,有幾點現象值得關注:在民事案件中,一審裁定總數占去民事總裁定書數量的80%左右,其中一審撤訴裁定占去總數的60%以上。

    可見,民事一審中調解結案仍然是主要的結案方式。在刑事案件中,與民事案件不同,行使二審的裁定書數量占去刑事總裁定數的90%以上,其中二審維持裁定占去總數的近三分之二。但應當提醒的是,這一數字不能完全說明全國刑事案件的維持率較高,因為刑事案件如果二審改判,一般是以判決形式作出的,不會計入表14中。在行政案件中,非訴執行裁定占去行政總裁定數的70%以上,其中準予執行裁定占去總數的60%以上,占去所有非訴審查執行裁定的85%以上。由于非訴審查執行案件的結果一般均以裁定書的形式作出,這一數據是可以反映現實問題的。這一數據表明,法院對行政機關的執行申請審查有“走過場”之嫌。

    此外,由于最高法院在裁定書的公開問題上語焉不詳,賦予了地方法院一定的公開裁量權,我們按照裁定書是否會導致案件程序的終結,將其分為結案裁定13與非結案裁定。統計結果顯示,在目前公開的裁定書中,結案裁定比率均占據絕對比重。尤其是在公開的刑事裁定書中,結案裁定占比接近97%。以此推知,各級法院對《理解與適用》中所言的“與當事人實體權益密切相關的裁定書”14時,一般均將是否導致案件程序結束作為衡量的主要標準。但我們認為,這一理解是有失偏頗的。一方面,實體利益與程序利益在審判實踐中本來就存在界限模糊、相互交叉的問題;另一方面,實體利益概念與是否導致案件程序終結并不處于同一層面。如關于財產扣押、解封的裁定必然涉及當事人實體利益,但一般并不導致案件的終結。最高法院有必要在未來進一步明確裁定書的公開種類問題。

    4.2014年裁判文書的審判程序分布

    需要交代的是,我們沒有在這里使用“審級”的概念,主要是一些特殊程序案件很難被審級的概念所囊括。此外,還有一些類型的文書因為數量太少,我們沒有列入其中,如強制醫療決定書只公開了3份。從表19來看,一審案件中判決書和裁定書是占絕對多數的,這符合法院的實際審理情況。值得關注的是,在一審、二審、再審中判決書的數量都是裁定書的2-3倍左右。關于全國范圍內判決書與裁定書的比例我們缺乏公開的數據可以進行比較,很難斷定實際審判中何者的比例更高。

    同時,一些地方也存在明確將一些種類的裁定書排除出公開范圍的情況。15但無論如何,裁定書的公開數量都相對較低。可能正如上文所言,法院在對裁定書有選擇公開權的情況下,執行力度相對于判決書較弱。

    5.2014年裁判文書法院層級分布

    表20展示了2014年裁判文書的法院層級分布。基層法院發布的文書占據了全國法院文書公開量的79.84%,中級法院占去18.52%,高級法院與最高法院總共只占了0.2%。從上到下金字塔形的文書發布量符合我國目前四級法院的審判實情,但也從側面再一次印證了基層法院面臨的審判重壓。有興趣的學者可以使用表中的層級案件類型文書發布量做進一步的研究。

    6.2014年執行文書法院層級分布

    表21是全國公開執行文書在各級法院的分布。由表21可以看出執行案件絕大多數還是出現在基層。與2014年全國各級法院共執結2,906,861件執行案件相比,四分之一左右的文書案件比是明顯偏低的。

    7.2014年調解文書在審判程序與法院層級中的分布

    2014年調解文書中公開的共5065份。按照最高法院的有關規定,調解書是明確的公開排除事項,理論上這些文書是不應該出現在數據庫中的。根據數據庫統計,這些調解文書中廣東法院的公開量占據了近一半。今后調解書是否一律不公開,值得討論。

    8.2014年裁判文書的區域分布

    總體上,2014年公開裁判文書的省級分布基本與總量上的文書分布相差不大。雖然我們沒有統計2015年的數據,但與總量對比,我們依然可以發現一些省份的進步非常顯著;比如浙江2014年的文書結案比尚不到40%,但總量在65%以上,可見2015年的進步幅度非常大。

    我們列出了各省不同類型案件文書的公布量,并計算了其在全國同類型文書中的比重,可以供有興趣的學者進行比較研究。

    9.2014年最高法院裁判文書概況

    我們將最高法院在2014年制作的文書單獨提取出來進行了分析。在最高法院公開的所有文書中有3809份是制作于2014年的。在案件類型上,絕大部分是民事案件文書,行政案件文書與刑事案件文書都在300份左右。另外,最高法院公布的其他案件文書為全國最多的,通過提取后人工閱讀,這一部分絕大多數是駁回申訴通知書。在審判程序上,最高法院發布的再審復查和審判監督案件文書也占絕大多數,這是最高法院作為我國法院系統內的最高司法監督機關的地位體現。值得注意的是,其中有253份復核文書,與表25的刑事案件文書接近,通過人工閱讀,證明這一部分主要是死刑復核文書。在文書類型上,裁定書占據了壓倒性的多數。我們分析認為,這是因為最高法院作為最高司法監督機關,在再審案件、再審復查案件,以及審判監督案件中,多以糾正下級法院審判錯誤為主,多采用裁定書的形式,很少直接判決。此外,復核文書也是以裁定書的形式作出。因此,裁定書占據絕大多數是可以理解的。但是,審判職能畢竟是最高法院的基本職能之一,如此多的案件“審而不判”是值得注意的。

    (三)社會熱點案件的文書公布考察

    在對中國裁判文書網公開的裁判文書進行數據歸納整理之后,我們對裁判文書網的文書公開情況已經有了一個初步的了解。但仍有一個問題是我們無法僅通過上文數據回答的,即法院裁判文書的公開是否有選擇性?這個問題無法從公開文書的數量和比例中得到回答。所以,我們采用抽樣調查的方式選擇一些社會熱點案件在中國裁判文書網進行檢索,來回答這一問題。我們收集了2014年、2015年社會關注度比較高的一些案件,這些案件廣泛來自媒體、網絡、法學會評選等渠道。我們共收集到近百件熱點案件,然后對這些案件進行了初步篩選。篩選原則為:該案件在2014年、2015年內確定進入了訴訟程序,產生了相應的裁判文書,并且按照要求這些裁判文書應當在中國裁判文書網公開。在我們收集到的案件中,其中一些沒有進入訴訟程序,或出于特殊原因進入訴訟程序但沒有裁判文書產生,如徐才厚案雖然進入了訴訟程序,但由于當事人在審查起訴階段因病死亡,所以沒有相應的裁判文書產生。最終我們確定了有65件案件符合我們的標準。其中,民事案件24件,刑事案件29件,行政案件8件,賠償案件3件,執行案件1件。我們對這65件案件根據收集到的案件信息在裁判文書網進行了檢索。

    需要說明的幾點是:1.由于案件事實與審判過程的復雜情況,部分案件在一個訴訟程序中不止有一份裁判文書,一些案件在一個審判程序中既有裁定書也有判決書,出于考察目的的需要,我們將這些裁判文書計為1件。2.一些案件雖然社會公眾將其視為一個案件,但實際上在法律程序為卻表現為數個案件。如江蘇昆山“8·2”特大爆炸事故案,該案中有數名犯罪嫌疑人,法院根據犯罪事實將其按照多個案件分別處理。我們將這一類案件也計為1件。3.部分案件根據目前有限的公開資料,我們無法判斷其是否存在相應的審判程序,我們將其視為沒有此審判程序。

    在我們進行檢索的65起案件中,有26起案件的裁判文書完全未公開,19起案件的裁判文書一、二審均有公開,30起案件的文書部分公開18.在案件一審中,有24起案件公開了裁判文書,占比約為37%,超過三分之一。27起案件公布了二審文書,10起案件公布了再審文書。在我們確定存在的117個審判程序中,共公開文書61件,比例約為50%。在確定存在的50個民事審判程序中,公布了26件裁判文書,占比約為50%;在確定存在的48個刑事審判程中,公開了22件裁判文書,占比約為45%;在確定存在的13個行政審判程序中,公開了11件裁判文書,占比85%。綜合而言,在我們所查詢的熱點案件中,能夠查到裁判文書的審判程序僅占全部總量的一半不到。有一些案件完全沒有裁判文書公開,如蔣潔敏受賄案、張海違法減刑案等;還有一些只公開了部分裁判文書,如無錫冷凍胚胎案僅公布了二審裁判文書。這表明不同法院在對熱點案件、敏感案件的拿捏上還存在尺度上的差異。詳細地給出典型案件的公開比例并非我們的目的,抽樣調查也只能在一定程度上呈現社會熱點案例的公開情況。真正值得我們關注的是,司法公開是否回應了民眾的訴求?社會熱點案例在一定程度上代表了民眾的關心所在,它承載了社會公眾對法律實施的良好期望,它的處理結果是公眾了解司法運行的直接窗口,它能夠最直觀地展示社會主義法治公平、公正、透明的形象。因此,社會熱點案例理應得到全方位的公開。這一公開不僅應當是某些案件庭審過程的直播,還必須全面、詳細地向公眾展示最終的司法裁判結果。這些案件裁判文書的公開既是民眾知情權的應得保障,也是法院塑造司法公信力的重要機遇。對于司法公開來說,這些案件裁判文書公開的意義要勝過成千上萬份普通文書的公開。但實際上,像蔣潔敏案、劉鐵男案等案件,我們至今無法查找到全面的司法文書,無法看到裁判文書中所確認的法律事實和司法機關的裁判依據。因此,全面的司法公開仍然任重道遠。

    三、裁判文書公開的及時性考察

    在2010年版的上網規定中最高法院要求裁判文書應當在生效后30日內上網,但在2013年版的規定中最高法院將這一時間限縮為生效后7日內。可見,最高法院對裁判文書上網的及時性要求大大提高。盡管可以理解最高法院緊迫的心情,但這一要求的可操作性與實效性是需要慎重考察的。這也是我們本部分主要關注的問題之一。在使用數據進行分析之前,我們必須提前交代兩個問題。第一,我們在本部分仍然是以2014年的數據為主進行分析。原因是2015年的裁判文書仍在裁判文書網陸續上傳中,我們數據庫中的數據是截至2015年12月31日。如果用不完全的2015年數據進行分析研究,一些結論可能是有失偏頗的。比如在下文我們將計算文書公開所需要的平均時間,這一結果受極值影響很大,我們目前缺乏在2016年上傳的制作于2015年的文書,而這一部分文書對平均值的結果是影響最大的。第二,限于技術水平,我們目前還無法僅僅通過裁判文書的內容來判斷其生效時間。實際上,這一問題即便在現實中對法官來說也是一個難題。因此,我們選擇了忽略“生效后”這一條件。直接觀察裁判文書上網所需要的時間。盡管我們無法判斷文書上網時間與生效時間的間隔,但通過上網時間與制作時間的對比,我們仍然可以依靠經驗得出一定的結論。我們采用的具體方法是由小到大劃分出時間區間,然后統計在特定時間段內上傳的文書數量,并計算出上傳文書數所需時間的平均數與中位數。19我們主要將間隔區間分為0天、1-10天、11-30天、11-90天、91-180天、181-365天、366-730天7個時間段,其中0天表示文書當日上傳,最長730天是兩年時間。使用這種方法,在分析時再結合訴訟法相關規定與上文的一些數據,盡管有不可避免的缺陷,但大致可以對這一問題給出一幅比較清晰的素描圖。

    (一)裁判文書的上傳時間概況綜合以下各表來看,有幾點值得注意。

    第一,2014年的裁判文書有近30%是2015年上傳的。前文已經指出,這一比例偏高。

    第二,30日內上傳量較低。按照三大訴訟法有關文書送達和上訴的規定計算,一審裁判在當事人不上訴的情況下,刑事判決書與裁定書在作出后的最長生效時間為20日與15日;民事、行政判決書與民事、行政裁定書在作出后的最長生效時間為25日與20日。把這一時間再加上最高法院規定的7日內上傳,從制作到上傳的最長間隔應該在30日左右。二審裁判一經送達立即生效,更是應當在7日內上傳。按照表30給出的統計數據,2014年文書在30日內上傳的不足20%,2015年文書不足30%。考慮到2015年的文書目前并不完整,參考2014年文書的上傳情況,2015年文書被后一年上傳量稀釋之后,實際在30日內的上傳比例應當與2014年接近。盡管我們無法獲得全國總體的案件上訴率,但無論如何,20%的30日內上傳率都明顯偏低。

    第三,文書上傳延遲情況較嚴重。從表30的統計數據可以看出,文書上傳的高峰期為文書制作后的1個月至3個月內。而3個月至6個月內的上傳率在2014年與2015年均在20%左右,尤其是2014年,6個月至1年內的上傳文書占比仍接近20%,1年后上傳的還有7%。即便考慮到二審與再審中的對原審的維持等復雜的審理情況,這一比例也難以得到合理解釋。綜上,我們分析認為,文書上網規定第八條的“生效后7日內”上傳的規定根本沒有得到落實。

    (二)2014年裁判文書上傳時間的案件類型分布

    綜合表33、表34來看,刑事案件的文書上傳效率是相對最高的,1個月內的上傳率接近30%,1個月至3個月內的上傳率接近40%,高于民事案件與行政案件;平均數與中位數的表現更是明顯好于其他類型案件。我們認為,這是因為刑事案件涉及的是比較嚴厲犯罪制裁問題,一般情況下,被告作為犯罪嫌疑人在押比例較高,原告作為受害人的出庭比例也較高,易于確定文書的送達,因此也較易判斷文書的生效時間。同時,刑事文書的法定送達時間相對較短,也是一種影響因素。相對而言,民事案件與行政案件的表現則較差,尤其是民事案件1個月內的上傳率還不到15%,有待進一步提高。

    (三)2014年裁判文書上傳時間的審判程序分布

    從審判程序的視角來看,二審案件與刑罰變更案件的上傳效率是相對最高的,1個月內的文書上傳率都在30%左右,中位數也表現較好。這是因為,在二審終審制的背景下,二審法院已經可以在判決書結尾宣告“本判決為終審判決”,因此也更易確定生效時間。而刑罰變更案件的裁定書根據《刑事訴訟法》的相關規定,是作出即生效的,生效時間的確定較為清晰。相對而言,一審案件的生效情況則較為復雜,在存在上訴的情況下,生效時間的確定受制于上級法院的審理結果,因此在數據上偏低,1個月內的上傳率尚不足15%,中位數的表現相對來說也中規中矩。再審案件則表現不佳,一般而言,再審文書的生效時間確定應該是較為容易的,但1個月內的上傳率也只在20%左右,1個月至3個月內的上傳率約在30%,中位數也不及二審文書。其余審判程序中,值得注意的是復核文書,這部分文書多為死刑復核文書,生效時間應當是較為清晰的,但1個月內的上傳率尚不足8%。

    (四)2014年裁判文書上傳時間的法院層級分布

    裁判文書上傳時間的法院層級分布情況與上文的總體概況基本一致。各級法院文書發布時間仍然集中在制作后1個月到3個月內,四級法院在這一區間的占比都在30%-40%。如果詳加對比的話,可以發現中級法院在文書發布上相對更快一些。一方面,中級法院在文書制作完成的30天內的發布率最高,接近30%,其他各級法院均未超過20%;另一方面,中級法院在90天至1年內的發布率最低,比例為30%左右,而其他各級法院的在這一時間段內的發布率均超過40%。這一點我們從表38中的平均數與中位數對比中也可以證明。無論是平均數還是中位數,中級法院的數值都是其中最低的。尤其是中位數,相比其他各家法院,優勢明顯。這一情況需要與前文的審判程序數據結合來看,正如前文已經證明的,二審文書的公開在各種審判程序中是表現相對最好的。而中級法院作為絕大對數二審案件的審判機構,其文書發布相對較好是自然而然的。基層法院的文書發布情況也和上文的一審案件與執行案件文書發布相一致,二者之間顯然存在因果聯系。

    高級法院和最高法院的表現則不甚理想。如果說其他法院還存在各種影響發布的案件不確定因素的話,那么高級法院與最高法院一般審理的都是二審、再審案件,文書生效時間的確定相對來說是較為簡單的,但實際上二者1個月內的發布率都只是在15%左右,值得反思。我們特意抽取了最高法院在制作1年后公布的81份文書進行人工閱讀,這部分文書中并沒有比較特殊的案件,均為普通的裁定書或判決書,也未發現其中有特別影響文書公開的因素。

    (五)2014年裁判文書上傳時間的區域分布

    各省級的公開及時性與全國總體所表現出的數據一樣,都存在普遍的延遲發布問題。在30天公開量占比達到30%以上的只有青海、上海、寧夏三個省市。但這并不能說明普遍狀況,這三個省市中上海市全年結案量約55萬件,在全國排名中游,青海和寧夏結案量在全國更是屬于比較低的省份。除此之外的省份中,在30天內文書發布率最高的是浙江,但也只有26%左右。其余省份的數據更是堪憂,末尾的西藏30天內上傳率僅有1%左右。

    在30天至90天的時間段內,文書發布率超過40%的有海南、貴州、甘肅、福建、湖南、重慶、上海、寧夏、陜西9個省市,但這些省市的結案量在全國都不占有主要地位。浙江、廣東、江蘇、山東等省份在這一區間內的文書發布比均在30%左右。在90天以上的時間段內,文書發布率超過50%的省份居然超過全國一半。排名前三位的西藏、北京、內蒙古公開率分別為95.54%、73.28%,67.89%。如果說西藏略顯夸張的數據是因為偏遠地區信息化基礎建設不足,那么基礎設施相對較為發達的北京市就實在無法從外在硬件上歸因了。北京的中位數為187天,已經離排名倒數第一的西藏210天相去不遠。山東、江蘇、廣東等省份的發布率均在50%左右。浙江情況稍好,90天以上發布率在38%左右,但也超過三分之一。

    綜合來看,各省市之間表現相對差異較大,不能夠單純用地區經濟發達與否進行解釋。尤其是從最有代表意義的中位數來看,雖然東部發達地區有福建、浙江這樣表現優秀的省份,但也有北京、江蘇等表現一般的省市。而西部欠發達地區雖然有西藏這樣的極端情況,但青海、寧夏的表現都讓人眼前一亮。因此,僅從我們所統計的數據來看,硬件方面的信息基礎設施雖然是重要的影響因素,但并非決定因素。我們更傾向于認為各省高院的重視程度和執行力度是更關鍵的影響因素。

    四、裁判文書公開的內容妥當性考察

    本部分我們主要關注裁判文書公開內容的妥當性,涉及裁判文書公開內容的質量問題,也涉及部分裁判文書網公開的方式和效果的考察。我們將本節分為兩大部分:第一部分主要關注公開的裁判文書的隱名情況,主要以2013年版文書上網規定第6條與第7條的落實情況為考察中心;第二部分主要列舉說明幾類目前裁判文書網運行中以及公開裁判文書中出現的一些有代表性的錯誤類型。

    (一)裁判文書的隱名情況

    2013年版文書上網規定第6條規定了在互聯網公布裁判文書應當實名公開的原則及其例外情形;第7條則是有關信息保護的規定。我們主要考察的問題有二:第一,裁判文書對不宜公開信息的處理現狀如何?第二,隱名等信息處理的程度如何把握?具體的研究對象包括兩類:普通案件的裁判文書和敏感案件的裁判文書。敏感案件的裁判文書以未成年人犯罪和強奸罪為例。

    1.普通案件中的匿名處理

    我們從裁判文書網隨機抽取100份裁判文書,抽樣原則為:

    (1)覆蓋每一省、直轄市、自治區;

    (2)民事案件、刑事案件、行政案件各占比例與總樣本中的相應占比近似;

    (3)分別由基層法院、中級法院和高級法院審理的案件各占比例與總樣本中的相應占比近似;

    (4)判決書、裁定書、決定書和調解書各占比例與總樣本中的相應占比近似。

    最終100份樣本中包含:52起民事案件、28起刑事案件和20起行政案件;82起由基層法院審理的案件,12起由中級法院審理的案件,6起由高級法院審理的案件;70份判決書、17份裁定書、5份決定書和2份調解書。

    2013年版文書上網規定第6條共列舉了三類必須采取符號替代方式對下列當事人及訴訟參與人的姓名進行匿名處理的情形,包括:(一)婚姻家庭、繼承糾紛案件中的當事人及其法定代理人;(二)刑事案件中被害人及其法定代理人、證人、鑒定人;(三)被判處三年有期徒刑以下刑罰以及免予刑事處罰,且不屬于累犯或者慣犯的被告人。22在100份樣本中,共有8份屬婚姻家庭、繼承糾紛案件。其中,有6份裁判文書依規定對當事人及訴訟參與人姓名進行隱名處理,但有2份保留了全名。共有24份文書涉及被害人及其法定代理人、證人、鑒定人信息的刑事案件。這24份裁判文書均依規定對被害人的法定代理人、證人、鑒定人等人員的姓名進行了隱名處理,但有2份保留了被害人的全名,其中1份特別指出這樣做是為了與被告人(隱名處理后)的姓名加以區分。在100份樣本中,共有20份屬被告人被判處三年有期徒刑以下刑罰以及免予刑事處罰,且不屬于累犯或者慣犯的刑事案件。其中,有17份裁判文書依規定進行隱名處理,但有3份保留了全名。

    整體而言,法定隱名在實踐中落實情況良好。但我們在閱讀文書的過程中,發現不同法院采取的隱名方式存在多種形式,有必要進一步考察實踐中存在不同“符號替代方式”。

    在100份樣本中,采取符號替代方式對案件當事人及訴訟參與人的姓名進行匿名處理的共有34份。其中,被采用最多的符號替代方式是保留姓氏,后面其他字以“某”代替,共20份,占59%。此外,有6份采用了保留姓氏,后面其他字以“某某”代替的方式;4份采用了保留姓氏,后面其他字以“某”和“一/二/三……”或“甲/乙/丙……”組合代替的方式;2份采用了保留姓氏,后面其他字以“××”代替的方式;1份采用了保留姓氏,后面其他字以“甲/乙/丙……”代替的方式;1份采用了保留姓氏,后面其他字中的一部分以“一/二/三……”代替的方式

    所采用的“符號替代方式”尚處于比較分散、多樣的狀態,需要進一步的統一。值得指出的是,最高法院在《理解與適用》中推薦采用的隱名方式為“姓+某某”,同一文書中有姓氏重復的則采用“姓+某+甲/乙/丙”。24我們認為,以“×”“*”等其他形式的文字或符號代替可能對當事人及訴訟參與人的姓名不夠尊重,且在不同網絡系統、輸入法系統之下格式可能難以保持一致。最高法院推薦的隱名方式是較為妥當的。

    2.普通案件中的信息刪除

    2013年版文書上網規定第6條共列舉了四種在互聯網公布裁判文書時應當刪除的信息,包括:

    (一)自然人的家庭住址、通訊方式、身份證號碼、銀行賬號、健康狀況等個人信息;(二)未成年人的相關信息;(三)法人以及其他組織的銀行賬號;(四)商業秘密。此外,第5項“其他不宜公開的內容”為兜底條款。我們仍以上一部分中抽取的100份裁判文書為樣本,對明確列舉的四類情形分別進行考察。

    第一,自然人的個人信息。本文所選取的100份樣本均涉及自然人。但是,有7份所涉及的自然人為非當事人的其他案件參與人員(多為訴訟代理人),這7份裁判文書均未提及自然人的家庭住址25、通訊方式、身份證號碼、銀行賬號、健康狀況等個人信息。剩余的93份所涉及自然人為當事人的樣本中:在家庭住址上,45份未公開家庭住址,37份給出區域性地址,4份給出具體到鄉鎮街道的簡略住址,7份給出具體到門牌號的詳細住址;在身份證號碼上,90份未公開身份證號碼,3份完全公開了自然人的身份證號碼;在通訊方式上,92份未公開通訊方式,1份公開了自然人的手機號碼;在銀行賬號上,93份均未公開銀行賬號;在健康狀況上,90份未公開健康狀況,3份公開了自然人的健康狀況。整體而言,法院比較注意對自然人個人信息的保護情況,但仍有少量裁判文書不適當地披露了個人敏感信息。

    第二,未成年人的相關信息。《理解與適用》指出,此處的“相關信息”是指任何足以識別該未成年個人的信息。但“相關信息”的內涵與外延仍不明朗,本文暫且類比2013年版規定第6條與第7條第1項,以姓名、性別、年齡、民族、家庭住址、身份證號、通訊方式等作為指標進行觀察。

    本文所選取的100份樣本中有4份裁判文書涉及未成年人,均對未成年人姓名進行了隱名處理,也未公開其身份證號、區域性地址以下的家庭住址及通訊方式;4份裁判文書均公開了未成年人的民族以及具體到出生年月日的年齡信息;3份公開了未成年的性別,1份未公開;2份公開了未成年人的法定代理人的全名,2份對此作了隱名處理。

    對案件中所涉及的未成年人的保護是否到位,標準在于公開的信息是否足以識別該未成年人個人。因此,需要警惕在裁判文書中公開未成年人詳細出生信息、法定代理人全名的現象。在如離婚等特定類型的案件中,刪去未成年人的出生信息可能影響讀者對案情的理解,且這些信息單獨出現時尚不足以被用來確定個人。但若未成年人所居住地區、法定代理人姓名、出生年月日等組合出現在同一份裁判文書中,仍極有可能暴露該未成年個人。

    第三,法人以及其他組織的銀行賬號與商業秘密。本文所選取的100份樣本中,一方面,案內人包含法人以及其他組織的有52份,所涉及的銀行賬號與商業秘密等信息均未被公開;另一方面,部分裁判文書中對法人以及其他組織的名稱、企業法人住所與經營場所、法定代表人姓名等信息亦作隱匿處理,其必要性與妥當性存疑。在52份裁判文書中,3份完全隱去了法人及其他組織的名稱,49份公開了法人及其他組織的完整名稱;16份未公開企業法人住址與經營場所,9份給出區域性地址,5份給出具體到鄉鎮街道的簡略住址,22份給出具體到門牌號的詳細住址;6份對法定代表人姓名作了部分隱匿或全部刪去的處理,46份公開了法定代表人姓名。上述對信息的過度隱匿表明,部分法院混淆了對不同類信息進行保護的合理界限。2013年版文書上網規定第6條及第7條第1、2項對自然人信息進行處理的目的主要在于保護其隱私權,并使本人不易被識別從而保護其人身安全。與此不同,2013年版規定第7條第3、4項對法人以及其他組織信息進行處理的目的主要在于避免有盈利價值的信息泄露后被用于不正當競爭,保護其經濟安全。國務院頒布的《征信業管理條例》也印證了這一點,該條例第3條規定,“從事征信業務及相關活動……不得侵犯商業秘密和個人隱私”。因此,法院將刪除的信息范圍擴大至銀行賬號和商業秘密之外的經營場所、法定代表人姓名等信息項上是值得商榷的。

    從司法公開的功能上來看,對法人以及其他組織信息的過度隱匿有可能妨礙司法公開價值的實現。司法公開的根本價值之一是為了保證公眾知情權與監督權的實現。在民、刑案件中,充分披露法人信息有助于公眾辨識出涉案法人,從而進一步了解并監督其有無完全民事權利能力和民事行為能力以及其商業信譽如何等。尤其是我國《民法通則》第37條還規定了企業名稱、經營場所、法定代表人姓名等信息是構成法人資格的必要條件。而在行政案件中,行政機關的全名公開應當是公眾監督行政職權行使的題中應有之義,對行政機關的名稱與法定代表人姓名等信息不應當有任何隱匿。但案號為“(2012)鄂洪山行初字第00041號”的裁判文書中,法官卻將當地房屋管理局全稱和房屋管理局法定代表人姓名均作隱名處理,應予糾正。

    第四,其他不宜公開的內容。《理解與適用》指出,刑事裁判文書中血腥暴力和恐怖事實的描述、認定,犯罪方法的解釋以及具體偵查方法和措施的披露等,均應作刪除處理。

    除此之外,為了進一步填補“其他不宜公開的內容”之內涵,本文對100份樣本中法院的非法定隱藏、刪除信息進行了總結。在93份當事人(之一)為自然人的裁判文書中,56份公開了自然人的性別,37份未公開該信息;43份公開了自然人具體到年月日的出生信息,6份公開了自然人的出生年份或年齡,44份未公開該信息;49份公開了自然人的民族,44份未公開該信息。共15份裁判文書涉及自然人的機動車車牌號,其中13份對該信息進行了部分符號代替處理。共12份裁判文書涉及自然人的房產信息(房產地址、產權證號),并且都對此進行了部分符號代替處理。共3份裁判文書涉及自然人的婚姻狀況,其中1份對自然人的婚齡進行了隱匿處理,2份公開了自然人的結婚證號。共47起案件的委托代理人是律師,47份裁判文書均標明了代理律師執業的事務所名稱,但其中有2份裁判文書對代理律師作了隱名處理;共2起案件的委托代理人是律師以外的人員,2份裁判文書均標明了該代理人與當事人的關系。

    以上統計表明,不同法院、不同法官之間對裁判文書的隱名類項與隱名程度上還存在把握不一致的情況。如當事人的性別一項,2013年版規定第7條并未明確將其列為應當刪除信息。且性別信息的特殊性一般較低,幾乎沒有可能通過性別來確定具體的案件當事人,但在部分案件中性別卻可能是法官作出具體判決的影響因素之一。因此,刪除性別信息是不必要的。綜合來看,實踐中對上網規定中未明確是否應當刪除的信息項處理較為混亂,應當進一步規范。

    3.敏感案件的隱名處理

    裁判文書在互聯網公布前需對部分信息作隱匿、替代、刪除處理的主要原因在于,保護案件當事人及訴訟參與人的個人隱私和具有經濟價值的信息,同時維護社會的穩定與和諧。在這一類案件中,比較典型的是未成年人犯罪案件與強奸罪案件。前者是第7條中的明確規定,后者則常涉及被害人重要的隱私信息。因此,我們以未成年人犯罪和強奸罪為例,觀察目前對于敏感案件的文書處理現狀。

    第一,未成年人犯罪。我們從裁判文書網中隨機抽取100份涉及未成年人犯罪的案件,抽樣原則為:(1)覆蓋每一省、直轄市、自治區;(2)分別由基層法院、中級法院和高級法院審理的案件各占比例與總樣本中的相應占比近似;(3)判決書和裁定書各占比例與總樣本中的相應占比近似。最終100份樣本中包含:67起由基層法院審理的案件,28起由中級法院審理的案件,5起由高級法院審理的案件;81份判決書和19份裁定書。

    對未成年人犯罪案件的裁判文書進行信息處理,其主要依據仍在第7條第2項對“未成年人相關信息”的保護,因此應當隱匿、代替或刪除的信息也就包括姓名、詳細家庭住址、身份證號等。在100份樣本中,有27份裁判文書未對未成年被告人的姓名作隱名處理,案件所涉及的犯罪類型包括運輸毒品罪、販賣毒品罪、搶劫罪;有48份裁判文書標明了未成年被告人的出生年月日,這主要是便于理解被告人在實施犯罪行為和被起訴時分別出于哪一年齡段;6份裁判文書公布了未成年被告人具體到門牌號的詳細家庭住址;有39份裁判文書標明了未成年被告人的法定代理人及其與被告人的關系,其中21份將法定代理人的姓名也作了隱名處理。本文所選取的100份裁判文書均未公開未成年被告人的身份證號和通訊方式,這是值得肯定的。但仍有27份文書未對未成年人姓名作隱匿處理,是需要進一步提高的。另外,法定代理人一般為未成年人的直系親屬,屬于“足以識別該未成年人個人的信息”,其相關信息也應當作隱匿處理。

    第二,強奸罪。本文從裁判文書網中隨機抽取100份涉及強奸罪的案件文書,抽樣原則為:

    (1)覆蓋每一省、直轄市、自治區;(2)分別由基層法院、中級法院和高級法院審理的案件各占比例與總樣本中的相應占比近似;(3)判決書和裁定書各占比例與總樣本中的相應占比近似。最終100份樣本中包含:14起由基層法院審理的案件,81起由中級法院審理的案件,5起由高級法院審理的案件;14份判決書和86份裁定書。對涉及強奸罪的案件的裁判文書進行信息處理,關鍵在于依據2013年版第6條第2項保護被害人的個人隱私。本文所選取的100份樣本全部對被害人的信息進行了較恰當的處理,主要方法是以“婦女”代指被害人,或對被害人姓名進行符號替代。值得肯定。

    (二)裁判文書公開錯誤現象考察

    前文已經提到,我們在通過系統整理文書的過程中發現,裁判文書網的公開存在一些錯誤現象,這些錯誤現象給裁判文書的整理帶來了相當大的難度。在我們整理文書的過程中,發現的各類錯誤現象,約占文書總量的5%左右。由于系統復雜性和人力有限等原因,我們難以給出全部的錯誤類型和所占比例。但我們盡力在本節對研究過程中發現的比較有代表性的錯誤現象進行簡要的整理和歸類,提醒以后的研究者在使用裁判文書網時予以注意。

    我們將這些錯誤主要分為兩大類:一類為裁判文書的“公開”錯誤,主要是裁判文書網在公開過程中出現的錯誤現象。這些現象既有各級法院在上傳中出現的錯誤,也有文書網架構不夠完善的原因。另一類為裁判文書的寫作問題。這種問題尤其給我們識別文書帶來了比較大的困擾。它主要是由各級法院法官在書寫文書時的筆誤和表達差異導致的。

    1.裁判文書的公開問題

    裁判文書網的公開錯誤比較有代表性的是統計數據錯誤與裁判文書分類錯誤。

    第一,統計數據錯誤。統計數據錯誤是指在裁判文書網中以某一限定條件進行搜索,得到的各項數字之間存在矛盾或難以自洽的情況。在裁判文書網高級檢索中,在設定的特定檢索條件下,裁判文書網左側欄的各項統計數據應當是自洽的。但實際檢索中我們發現,這些數據常常有“打架”的現象發生。比如我們將法院名稱設定為“北京市第一中級人民法院”進行檢索27,右上角紅字顯示共找到31,200個結果。但是將左側的分類結果相加,數字卻相差甚大。按裁判年份篩選的結果相加所得為25,869份文書,按文書類型篩選的結果相加為27,199份文書。實際上,我們計算了每個分欄目文書相加的結果,沒有一個最終數字是相同的。一般而言,在設定的檢索條件下,文書的篩選實際上是被限定在了一個區間之內,這個區間應該是明確的。各項統計數據在區間內再按照細分條目進行篩選,并對所得結果進行加減即可。即便考慮到審判程序分類繁多等復雜情況,各項數據有存在誤差的可能性,但誤差量也應該是極小的。而上述統計數字接近20%的誤差,實在難以用常理解釋。只能說明裁判文書網的后臺算法仍然存在較大的問題。對于使用者而言,這樣帶來的一個不利后果是,使用者一般沒有能力對這些數據進行甄別,選擇不同的數據作為研究依據可能帶來不同的研究結果。這顯然是存在問題的。

    第二,文書分類錯誤。網站進行文書分類的基本原理是對文書的案號進行提取和判斷,以此確定文書所屬于的案件類型。目前裁判文書網在檢索文書時均是在案件左上方以紅底白字標示出案件所屬類型和所屬程序。應當說,這樣是有利于檢索人盡快了解案件信息、節省信息篩選時間的。但是我們在研究過程中發現,裁判文書網有大量的案件類型分類錯誤,在一定程度上影響了各種案件類型的數據統計。例如,我們在高級檢索中設置案件類型為“刑事案件”,案件名稱為“合同糾紛”,居然仍有數百份的檢索結果。仔細檢查檢索結果,我們發現這些裁判文書絕大多數為執行裁定書和民事裁定書,與刑事案件相去甚遠。如案號為“(2013)武海法執字第00421號”的“中國民生銀行股份有限公司武漢分行金融借款合同糾紛執行案裁定書”,被標為刑事案件;再如案號為“(2014)深中法商終字第1106號”的“深圳市華萊士齒輪有限公司與深圳市興龍輝科技有限公司定作合同糾紛二審民事判決書”,被標為刑事二審。我們將各種案件類型與其他案件類型中的不同案由進行組合檢索,發現這一類錯誤比比皆是,難以窮盡。可以想象,裁判文書網給出的各項統計數據必然受到了這些分類錯誤的影響。

    以上兩種錯誤類型,是裁判文書網公開過程中比較有代表性的兩種錯誤,但并非全部。我們在系統架構和數據統計的過程中發現了不少類似的錯誤。但由于各種錯誤繁多,我們限于研究能力,無法對其進行全面的列舉和分類。我們提醒后來的研究者在使用過程中注意這些明顯的錯誤,尤其是裁判文書網提供的各種統計數據,應當謹慎使用。

    2.裁判文書的寫作問題

    我們在研究過程中,由于需要確定裁判文書的制作時間、上傳時間、當事人、案件類型、法院級別等信息,所以也需要通過電腦系統對裁判文書的基本內容進行讀取。在讀取過程中,我們發現,一部分裁判文書在系統整理過程中總是會出現無法識別的情況,也就是屬性缺失的情況。我們通過人工閱讀發現,這些屬性缺失主要是由裁判文書的寫作錯誤或寫作差異導致的。我們將其分為兩種:一種是文書標識性信息的寫作錯誤;另一種是文書內容的表達多樣化問題。

    第一,標識性信息錯誤。我們所指的標識性信息主要是指文書的標題、案號、時間、地點、法院級別、審判程序、文書類型等信息,這些信息綜合定義了一份文書的基本屬性。一般而言,這些信息在裁判文書中格式化程度較高,出錯的概率也較小。但實際上,還是有相當數量的文書存在這樣或那樣的寫作錯誤。以文書標題的編寫為例,我們在研究過程中發現,部分法官編寫的文書標題存在錯誤,甚至個別案件的標題與文書內容毫無關系。例如,在一份案號為“(2015)二中民(商)終字第08055號”的裁判文書中,原標題為“北京市第二中級人民法院民事裁定書”,案件上訴人與被上訴人分別為“陳國奎”與“吳志軍”,均為自然人。該案是一起普通的合同糾紛上訴案件,該文書為法院對上訴人的準許撤訴裁定。此案本身是一起非常簡單的民事案件,文書中各項內容也書寫清楚,沒有發現明顯錯誤。但該文書標題卻寫為“姜莉莉訴北京市東城區發展和改革委員會政府信息公開案二審行政裁定書”。雙方當事人姓名、案由、案件類型等信息無一項正確。類似的還有案號為“(2015)海民(知)初字第22075號”的北京市海淀區法院民事判決書,標題卻為“王敬民與北京市豐臺區人民政府房屋征收辦公室信息公開一審行政判決書”。還有案號為“(2013)陜民一終字第00126號”的案件,標題寫為“……民事二審裁定判決書”。“裁定判決書”一詞顯然是該案法官的筆誤了。再以最容易確定的時間信息為例。一般制作時間注明在文書末尾,采用中文大寫數字。但在實際中,文書時間出現中文大寫與阿拉伯數字夾雜的情況仍然不少,還有一些文書時間存在缺字、多字、年份缺失、月份缺失、日期缺失等情況。我們在前文計算2014年裁判文書的時候曾經按照兩種條件進行提取,一種是只篩選年份,只要文書制作時間開頭為2014年的即列入統計;另一種是篩選年、月、日,只有制作時間可識別為“2014年××月××日”的文書,我們才列入統計。所得結果顯示,前者比后者多出了8000多份文書。而這還是在我們已經對時間錯誤進行部分修正以后的結果。可見,這種時間寫作錯誤不僅是個別案件的問題。這一類錯誤還有很多,限于篇幅,我們不再一一舉例。對于依靠裁判文書網進行的研究,特別是數據研究,這一類錯誤需要注意。

    第二,文書內容的表達多樣化問題。文書內容的表達多樣化是指文書的在案情陳述、裁判依據、裁判結果存在文字表達上的差異。應當說,這一問題不是在文書上網中出現的,而是長期以來一直存在的;甚至這一問題也并非錯誤,出于法官個體之間表達習慣的差異,對同一個問題存在不同的表達方式是正常的。我們之所以在這里提及這一問題,是因為在文書上網之后,為了處理大批量的文書,機器讀取將在以后成為常態;為了適應這一趨勢,文書表達的格式化、規范化將是必然的發展趨勢。因此,有必要對這一問題進行說明。

    在文書內容的表達上,由于人言人殊,對于相近問題的不同表達給機器讀取帶來了很大的識別難度。我們這里以行政訴訟中判決被告履行法定職責的表述為例,該判決一般是為了表達被告有義務在在一定期限內對原告作出某種行政行為。其中就單單祈使動詞就有表述成“責令/責成/判令/限”等多種情況,在時間限期上也可以表述為“在/于/自×××天/日/月/年內”多種情況,在要求行政機關履行行為上也存在“對/就/向/履行/受理/×××依按/照/受理×××作出/做出/給予/進行/法定職責/予以/處理/申請/履行”多種表述。這些表述之間又相互組合,衍生出更多的表達形式。而且在同一個判決之內,往往又存在多種不同的裁判結果,這些結果根據案情又可以進行海量的表達組合。尤其是在復雜的民事案件中,這些組合的數量相對其他案件又呈指數級提高。對于人工閱讀至為簡單的事情,在機器這里卻異常復雜。我們在研究中盡量少的涉及文書內容方面的數據統計,正是因為在與人工閱讀比對后,發現這種手段目前并沒有十分成熟,結果的精確性有待提高。這種文字表達多樣化的問題幾乎存在于文書的每一個角落。上文的標識性錯誤還可以通過一定的手段予以校正,表達的多樣性問題則只有依賴于深度學習技術的進一步發展。但是,我們認為,裁判文書內容的表達規范化和格式化應當由最高法院盡快予以推動。

    五、報告總結

    (一)進步與成果

    本報告力圖在現有的技術水平上,對正在如火如荼推進的裁判文書上網的總體情況提供一幅比較清晰的全景圖。總體上來看,中國裁判文書公開取得了巨大的、在幾年前甚至還是難以想象的進步,令人欣喜和鼓舞。它突出表現為以下幾點:

    第一,它實現了司法公開理念的突破。多年來,各級法院往往將裁判文書看作是自己的私有物,不僅當事人以外的公眾難以見到,連律師復印案卷也時常遇到不正當的阻撓。以往通過最高法院公報與《人民法院案例選》等媒介公布的案例,不僅數量極其有限,而且都經過遴選和修飾,帶有鮮明的目的性和傾向性。裁判文書網這種全范圍、大批量的公開方式,代表了司法公開理念實現了一個質的飛躍,是司法公開的一個里程碑式事件。在推進過程中,許多法官有不適應,一些當事人也有抵觸,但總的來說,還是比較平穩、順利。打造“透明法院”、實行“陽光司法”,提升司法公信力,獲得了越來越多的共識。

    第二,建立了全國統一、運轉良好的文書發布平臺。裁判文書網的建立使得裁判文書的公開有了統一、穩定、高效、可預期的發布渠道。在異較大的國度,如果沒有一個全國性的平臺作為統一的發布渠道,信息的公開必然是零散、瑣碎、低效率的。2010年版的上網規定沒有引起較大的反響,缺乏統一的發布平臺就是原因之一。而中國裁判文書網的出現在相當大程度上避免了上述問題。同時,裁判文書網在兩年多的時間里,已經經歷了數次改版,不斷完善。盡管它也存在網站不穩定、鏈接速度較慢等常見問題,但相比較于絕大多數政務性網站,它的進步是明顯的。我們在與華宇公司合作搭建數據庫的過程中,也不斷遇到各種各樣的技術難題,深感法律與技術的結合確非一件簡單的事情,建立這樣一個分類復雜、數據量龐大的網站,是需要付出相當努力的。

    第三,文書公開制度化。最高法院在2010年、2013年、2016年連續發布裁判文書上網規定,由粗到精,由易及難,步步推進。文書公開范圍越來越明確的界定,體現了以公開為常態、不公開為例外的原則。不同層級法院、法院內部不同機構和人員在裁判文書公開責任上的明確,更是強化了公開原則的落實。以往小批量、運動式的文書公開將成為過去式,公開將成為司法文書的內在屬性和人民法院的常態工作。打造“透明法院”、實行“陽光司法”的目標,至少在裁判文書公開領域,正在快速接近。

    裁判文書發布量的突飛猛進,不但提升了司法的透明度和公信力,也為法律大數據技術開發建立了良好的基礎。從前文的數據來看,2014年作為裁判文書公開的第一年,即發布了550多萬份裁判文書,2015年又將總發布量相比14年提高了60%以上。合理推測,目前所公布的文書應該占到全國總文書量的近一半。如此多的文書,無論是對于學術研究還是商業開發,都蘊含了非凡的潛力。在法學研究上,它甚至可能一定程度地改變中國法學的研究走向。過往的法學研究以思辨和經驗取向為主,缺乏可以依靠的實證數據作為分析基礎。但現在通過對大規模文書的技術處理,我們可以精確地驗證以往的研究猜想,甚至發現新的學術課題。在商業上,最近幾年的法律互聯網服務市場日漸火爆,催生了不少創新性的法律服務模式,產生了巨大的商業價值與社會影響,這與裁判文書網海量的司法文書公布不無關系。更長遠來說,裁判文書上網未來將在國家“數據強國”與“信息社會”的戰略中展現出更大的價值。

    (二)存在的問題

    盡管裁判文書的公開已經取得了重大成果,但其中仍然存在一些不可忽視的問題。我們希望,指出這些問題有利于進一步落實和完善裁判文書的公開。

    第一,文書公開量仍然有待提升。按照前文計算,一半以上的文書仍未公布在裁判文書網。一些具有重大社會影響、公眾關心的案件,無法在網上找到。更重要的是,這些未公開的文書未能說明不公開的具體理由。2013年版規定第4條第4項的“其他不宜在互聯網公布的”文書,含義太過寬泛,也未能給出更細致的操作細則。

    第二,公開的及時性有待提高。依照2013年版規定的第8條,有關文書生效后7日內即應當發布。這一條在現實中基本沒有得到落實,連最高法院自身執行得也不夠理想。7日內發布的規定(特別是一審判決發布的時限)有待澄清,可操作性更有待加強。

    第三,已發布裁判文書的撤回需要規范。文書撤回制度充分考慮了當事人隱私與社會和諧等價值,有積極意義。但規定中只指出撤回的標準是法定理由或特殊原因。這一規定基本不具有實操性,賦予了法院過大的裁量權。在現實中,法院目前遇到申請撤回的情況,基本都是不作審查,一撤了之,導致該條款形同虛設。第四,法院文書發布管理體系有待重構。最高法院在規定中確立了“誰的文書誰公布,誰公布誰負責”的原則。但在實踐中,基本上由基層法院和中級法院打包傳輸給高級法院,高級法院負責傳輸到裁判文書網;文書撤回也由高級法院說了算。

    由于各級法院的系統都是初建,存在許多技術問題尚待解決,如數據格式不統一、智能隱名不夠準確等。這些問題各級法院都在文書上網的工作中時常碰到,由此導致的錯誤文書只能向高級法院申請撤回。在這種情況下,許多基層法院的法官限于時間和精力以及對抽查的僥幸心理,干脆選擇對錯誤視而不見。

    裁判文書上網規定對文書公布管理中各級法院的職責分配有待完善。

    第五,文書公開監督有待進一步深化。在監督體系上,按照第13條的規定,目前的監督體系是最高法院監督全國各級法院,高級法院監督轄區內各級法院。這種監督只限于內部監督,缺乏有效的外部監督路徑。考慮到裁判文書公開面向廣泛的社會公眾,可以考慮引入一定程度的社會監督。從監督內容上來看,目前的監督主要集中于文書上網數量,對文書公布的及時性基本沒有列入考核。各省比較通行的方式是,高級法院在每季度末和每年末將各級法院在裁判文書網的公開量通報全省法院,并作為考核評比的依據。這就造成了前文數據所證明的季末突擊上傳與年末突擊上傳現象普遍存在。而對文書公開的質量監督,目前主要是以對各級法院進行文書抽查為主,這種方式工作量大,執行力度明顯遜于對公開量的考核。

    第六,法院內部各系統之間有待進一步協調。統一的發布平臺運行順暢的基礎是,法院上下級之間的軟件系統能夠協調統一。但出于多方面原因,目前全國法院后臺辦公系統是由各省自主招標建設。由此就導致了各省之間、各省與裁判文書網之間的系統對接問題。我們調研的數個省市法官都反映,他們自我記錄的文書公開量與裁判文書網每季度的通報量存在不一致。由于技術標準存在差異,一些省市上傳的文書需要經過文書網的運維方轉換格式后再傳入文書網,因此,數據延遲是常有的現象。這些問題都反映了目前的內部系統協調還存在較大的問題。除此之外,目前各省內部上下級法院之間系統的協作程度也普遍不高。以上下級法院之間的卷宗移送問題為例,如果上下級法院系統能夠統一協調,下級法院或法官能夠通過內部網絡提醒知悉該案件的裁判結果,那么文書上網根本不用等到卷宗送達,可以做到即時公開。在我們調研中,許多基層法院與中級法院法官反映雖然法院內部實現了辦公自動化,但上下級法院溝通基本還是依靠傳統的方式,制約了法院內部效率的提高。

    第七,文書公開的地區差異有待進一步消除。前文的數據已經指出,在裁判文書公開的地域分布中,“西低東高”的現象較為明顯。我國中東西部的地域差異與經濟差異,是一個不爭的事實。最高法院在文書上網規定發布時,其實也已對此有所考慮。第14條規定:“中西部地區基層人民法院在互聯網公布裁判文書的時間進度由高級人民法院決定,并報最高人民法院備案。”該規定顯然是考慮到了地區差異的結果。《理解與適用》中則提到會盡快確定“中西部地區三級法院生效裁判文書實現全面上網的‘時間表’與‘路線圖’”。盡管有這些提前考慮,但綜合近兩年的數據來看,東西部地區在文書上網的步伐仍然差距較大。西部地區文書上網,不僅數量少,而且及時性差。西藏自治區210天的文書發布時間中位數就是一個極端情況。這些差距應當是在以后推進文書全面上網的過程中逐漸彌合的。

    (三)我們的建議

    考慮到裁判文書上網在我國法院全面推行不過兩年多的時間,硬件架設和制度建構都在草創階段,存在上面這些問題是完全可以理解的。最高法院新近發布的2016年版裁判文書上網規定,對其中的部分問題已作了回應。但是也有一些我們所關注的問題仍然沒有得到很好的解決。我們愿意把我們的一些思考和設想繼續貢獻出來,為未來的持續改進提供有啟發性的建議。

    首先,在現行規定的基礎上,進一步構建責任分配合理的管理與監督機制。這一機制既包括法院外部,各級法院之間責任的良性分配,也包括法院內部業務庭與專責機構的良性分工。在各級法院之間,前文已經說明,目前的管理與監督方式是最高法院監督與指導全國各級法院,高級法院監督與指導轄區內各級法院。在這種機制下,中級法院與基層法院只有發布的責任,沒有管理與監督的責任。我們在調研中,曾有高級法院審管辦的法官向我們透露,下面各級法院的文書上傳問題都要匯報到高院審管辦來,他們的擔子很重,事多人少的矛盾非常突出。而中級法院和基層法院審管辦的法官則反映他們主要負責督促各業務庭上傳文書和統計數據,問題還是都交給高級法院處理。這顯然不是一個良性的機制。我們認為,各級法院應當重新劃分責任機制。具體方案是“高院適當放權,各級法院自擔發布責任,中院承擔主要監督責任,建立完善的系統行為記錄”。更詳細地說,高級法院將文書撤回權下放給下級法院,由各級法院自行決定文書的刪除、更換與撤回,但建立起完善的系統行為記錄,每月、每季度、每年的撤改率都由系統記錄在案,作為公開考核的主要指標之一。中級法院承擔起監督基層法院的責任,高級法院主要負責監督中級法院,形成層次分明的逐級監督機制。前文的數據表明,文書發布量的最大貢獻者仍然是基層法院,占據了文書公開量的80%。由高級法院去監督基層法院的文書發布,體制上畢竟隔了一層,既拉高了監督成本,也難收實效。在法院內部各部門之間,目前各省法院文書上傳工作機制并不統一。有些法院是由業務庭的辦案法官個人發布,審管辦負責督促與統計;有些法院是辦案法官將裁判文書交至審管辦,由審管辦統一進行技術處理,并打包上傳;有些法院是審管辦負責隱名技術處理,處理后的文書再由辦案法官各自上傳。我們建議,在員額制推行以后,案件的隱名處理與上傳發布采用法官負責制,但可以由法官助理負責具體操作;對于不在排除事項之內,而法官又認為不宜上網的文書,法官必須給出書面意見進行說明。審管辦主要負責審核文書形式錯誤與統計公開數據,并負責與上級法院審管辦對接具體的技術問題。同時,審管辦還負有對法官文書不公開意見審查的義務,并向分管副院長提出處理意見。

    除了以上兩點,在對文書公開的監督中,在上級監督與自我監督外,我們還建議引入社會監督機制。各級法院應當定期對外發布文書公開工作報告,并在年度工作報告中列出每年的文書公布量與案件公布占比。這是文書公開接受社會監督的重要途徑。其次,在文書上網規定上,進一步強化可操作性。

    在公開文書種類上,進一步區分各種裁判文書的差異,明確界定應該公開的文書。判決書除法定事由外,一律公開。裁定書與決定書需要進一步細化。尤其是裁定文書的種類多種多樣,在審判中的作用也差異極大,有些裁定書可以導致法律程序的終結,如駁回起訴的裁定書;有些只起到程序性作用,如財產保全裁定書。目前的規定仍然較為籠統,下級法院對裁定書的公開有一定的裁量權。應當由最高法院對各種裁定書仔細權衡,列出詳細的公開類目,并明確不公開的具體情況和標準,限縮下級法院在裁定書公開上的裁量權。我們建議對于能夠導致結案的裁定,除法定理由外,必須一律公開;非結案性裁定書,可以區別不同種類對待,對于案件裁判結果有實質性影響的必須公開,純粹程序性的可以由法官自己決定是否公開。但這仍然是一個過于主觀的標準。更簡易的操作辦法是,最高法院和高級法院的裁判由于具有一定的示范意義,裁定書和決定書應當全部公開;中級法院和基層法院的結案性裁定書必須一律公開,非結案性裁定自行決定。決定書也采用這種區分方法。同時,對于不公開的文書,應當在裁判文書網公開案號與文書類型,并注明不公開原因。

    在文書生效問題上,主要涉及文書上傳的時間問題。我們有兩種建議方案:一是繼續沿用“生效后”的規定,但放寬上傳時效,重新啟用2010年版規定中的生效后30日內上傳規定;二是棄用“生效后”這一限制條件。規定文書送達當事人后,必須在一定的期間內上傳,建議設置期限為30日。對于需要公布但又未生效的文書,應當在網頁顯眼處注明該文書尚未生效;待上級法院審理結果作出以后,再標注其效力。我們更推薦后一種方案。這些建議在技術上實現起來并不困難。在文書格式上,目前裁判文書格式化程度不高,對于進一步利用大數據技術進行文本挖掘,帶來了很大困難。我們認為,最高法院應當對各類文書給出基本的格式規范。這種格式規范包括兩個方面:一是我們通常所講的格式化裁判文書,即文書的寫作應當符合特定的格式要求。這一措施據我們了解最高法院目前已經在醞釀當中。

    二是一種技術規范,是指利用網絡技術對文書特定段落進行標記。比如對于文書中的證據,由法官在寫作或上傳時在法院的內部文檔處理系統中點擊特定按鈕在后臺進行技術標記,對于案情介紹、裁判說理、判決結果的段落也進行相應的標記。這樣就可以方便地實現同類段落的文本聚類,也不會再出現前文那種將證據日期識別為結案日期的低級錯誤。這種文本標記技術才是對信息技術的深度利用。對數據在制作階段就進行初步分類,才有利于各種大數據處理技術的后期開發。最后,在系統上,最高法院應當進行協調統籌。各省法院自建系統的權力應當得到保留,這既是適應地區多樣化的客觀需要,也是促進技術創新的最好方法。但是最高法院應當在系統的基礎方面給出統一的技術標準。

    在文書的上傳、儲存、發布格式與流程上,最高法院應當給出全國通用的技術標準。我們在調研中,遇到很多法院反映格式不統一帶來的困擾,嚴重地影響了文書的發布與統計。我們也了解到,最高法院現在已經開始進行這方面的工作我們期待這些工作能夠盡快取得實質性成果。在信息化建設中,最高法院可以提供文書發布網站的基本技術架構,或者提供可以通用的技術架構。各省通過招投標尋找相應的服務提供方對這種技術架構按照自己的需求再進行改造,實現技術在統一基礎上的多樣化。這種辦法尤其有利于目前信息化建設較為落后的中、西部省份,可以節省一定的信息化建設資金。在數據流通上,最高法院應當建立不同法院之間的信息共享機制。

    目前各個法院的辦公系統猶如一個個密封的堡壘,只有一兩個數據統計出口與其他法院進行信息對接,很難實現信息的即時流通,無法發揮出信息化的優勢。我們認為在關聯案件中,各個法院應該建立信息共享機制構建一套能夠共享關聯案件信息的內部系統。比如上訴案件的一審法官應當能夠看到二審法官對案件的審判流程。這樣方便一審法官盡快知悉自己一審裁判文書的效力狀態。盡管我們不贊成各個法院之間完全相互公開審判系統,但關聯案件是應當互相公開知悉的。這一目標的達成,由于可能牽扯到不同法院之間、不同級別法院之間、不同序列法院之間的信息互傳問題,必須由最高法院進行全局統籌,開發各法院之間能夠有條件信息共享的軟件系統。

    在文書發布系統上,從技術上持續改進中國裁判文書網。這些技術改進包括但不限于:完善文書的糾正、撤回機制,建立文書變更記錄。文書的撤回應當網上留痕,并保留撤回說明;建立關聯案件文書鏈接,如同一賄賂事實中的受賄案件文書與行賄案件文書關聯等33;同一案件的多份文書在裁判文書網建立文書群或文書鏈,并以時間線上可視化的形式展現;建立裁判文書與庭審視頻關聯。目前最高法院已經建立了中國法院庭審直播網,積累了一部分的審理錄像,可以將裁判文書與相對應的庭審視頻進行關聯提示;設置熱點案件文書公開首頁置頂;提供PDF格式文書;增加“當事人”檢索項等。

    最后想強調的是,司法公開應當是全面的公開。除了本文所考察的裁判文書公開,還有訴訟流程的公開、法庭審理的公開、訴訟檔案的公開、司法統計數據的公開。在不違反法定理由的情況下,訴訟檔案也應當分層級、有步驟地向社會公眾開放。一些法院以“能夠上網的裁判文書都已經上網”為由,拒絕公眾甚至案件當事人、利害關系人查詢訴訟檔案。這不是進步,是倒退。我們在研究過程中,需要將我們收集的數據與全國的審判數據進行比較,確定與衡量公開文書的定位與態勢。但我們發現各級法院公布的司法統計數據存在嚴重的數據公開不全面、數據標準不一致、數據前后不連貫、數據公布時間隨意化等現象。這對我們的研究造成了很大的障礙。我們曾向最高法院有關部門申請數據公開,但沒有獲得相關數據。我們期望最高法院以推進裁判文書公開的精神和魄力,推進全國司法統計數據的主動、及時、全面公開。

【注釋】
本報告系何海波、于曉虹主持的“清華大學司法改革與大數據研究課題”的部分成果。清華大學法學院博士生馬超具體負責并執筆,清華大學的俞黎芳、謝智潔、許星源、易霏霏、張兆函、黃敏達、周小琪等同學參與了文獻收集、數據整理等工作。
許星源、易霏霏還參與了本報告部分章節的寫作。課題組成員感謝北京華宇信息技術有限公司為課題研究提供的資金和技術支持。
1.周蔚:《大數據解讀2014年裁判文書公開》,載http://oicwx.com/detail/314889,上傳日期:2015年4月13日。
2.高榮英:《北京市專利侵權案件數據分析報告》,載http://www.zhichanli.com/article/22454,上傳日期:2016年1月8日。
3.王麗娜:《公開判決書中賄賂案件大數據分析》,
載http://xbxsf.nwupl.cn/Article/llqy/201407/17171.html,上傳日期:2014年7月25日。
4.對于現有報告常常重點關注的文本分析,如案由分析、裁判說理分析等,我們較少涉及。一方面,是受限于本報告的研究主旨;另一方面,是受限于現有的技術水平。我們通過文本挖掘軟件和人工抽檢進行比對,發現其精確度難以達到我們的要求。
5.需要說明的是,在《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》中,最高法院要求各級法院開始上傳裁判文書的時間為2014年1月1日。但在此之前裁判文書網已經上線。根據我們統計,自2013年從7月1日開始到2013年年底已經有上萬份文書發布在裁判文書網。這部分數據雖然可能是系統內測時的遺留數據,但我們為了保證數據的完整性,依然自2013年7月1日開始算起。
6.需要說明的是,我們的總數高于裁判文書網總數是正常的。至少存在以下兩個原因可供解釋:一是裁判文書網存在文書撤回機制。在實際運作中,文書撤回的權限在各高級法院,自裁判文書網上線以來,由于影響力日漸擴大,不少案件當事人出于對隱私泄露的擔心,向法院申請撤回個人涉案文書,而由于沒有明確的撤回標準和監督機制,各高院為了息事寧人,往往不經審查,一撤了之。比如,課題組在西南某省調研時,得知該省2015年就撤回了一千多份文書。而我們的數據庫是在不同時間段內逐步提取的,其中包含了一些被撤回的文書。二是裁判文書網自身的技術問題。比如我們發現廣東某市將一些系列案件都歸入一個案號下操作。這樣如果以案號為準進行判斷,這一批系列案件在系統總數上只會顯示為一份文書。我們的系統采取了不同的識別方法,將這些案件都視為單獨的裁判文書。這樣在總數上稍高于裁判文書網總數是完全正常的。我們分析有兩個原因可能導致這種情況:1.主審法官可能基于某種考慮故意將落款時間后移,保留較為充裕的宣判時間,卻
裁判不慎被“提前”發布了;2.主審法官筆誤寫錯了。
7.本報告所指時間如無特別說明,一般所列時間為文書制作時間。
8.如所指為文書發布時間,將會特別說明。
9.參見賀小榮、劉樹德、楊建文:《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》,載《人民司法(應用)》2014年第1期。
10.必須指出的是,在各省的司法數據公開中,存在統計口徑不一致、統計標準不統一等問題。我們在后文的附隨報告中專門有一份報告考察司法數據的公開問題。但就目前而言,各省高院的工作報告已經是我們能夠找到的最權威數據。同時在表10數據中還有有兩點要予以說明:1.部分省份公布的結案量是以“萬(件)”計,沒有精確到個位,我們對其省略的位數直接按零計;2.寧夏回族自治區的工作報告沒有透露2015年度的總結案量,我們按照其工作報告中給出的單項數據進行了匯總,得出的數據與往年對比,相差不大,應該比較準確。
11.需要說明的是,由于部分裁判文書書寫錯誤,在數據庫中以2014年作為檢索對象和以2014年××月××日作為檢索對象,結果是不一致的。前者比后者多出5萬份左右,即這5萬份文書只能識別出制作于2014年,卻無法判斷具體日期,出于數據一致性和精確性的考慮,我們采用了后一份數據。
12.賀小榮、劉樹德、楊建文:《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》,載《人民司法(應用)》2014年第1期。
13.我們認可的結案裁定主要有以下幾項:在民事案件中,一審案件中的調解;終結;按撤訴處理;撤訴。二審案件中的終結;駁回起訴;按撤訴處理;撤訴;發回重審;維持;撤銷變更原裁定。再審復查案件中的不予受理;終結;按撤回申訴、再審申請或抗訴處理;指定原審外其他法院再審;撤回申訴、再審申請或抗訴;指令原審法院再審;駁回申訴、再審申請或抗訴。特別程序案件中的終結;按撤回申請處理;準予申請;撤回申請;駁回申請。破產案件中的撤回申請;重整;宣告破產;終結破產程序。在刑事案件中,一審案件中的按撤訴處理;撤訴。二審案件中的按撤訴處理;終止;撤訴;調解;撤銷變更原裁定;改判;發回重審;維持。再審案件中的按撤訴處理;終止;撤訴;撤銷變更原裁定;改判;發回重審;維持;指令原審法院再審。再審復查案件中的指令原審法院再審;駁回申訴、再審申請或抗訴;指定原審外其他法院再審。復核案件中的終止;改判;發回重審;核準(或同意原判)。強制醫療案件中的終止。在行政案件中,一審案件中的按撤訴處理;終結;調解;撤訴。二審案件中的按撤訴處理;駁回起訴;終結;調解;撤訴;改判;維持;發回重審;撤銷變更原裁定;維持原裁定。再審案件中的按撤訴處理;駁回起訴;終結;撤訴;維持;發回重審;撤銷變更原裁定。再審復查與審判監督案件中的終結;不予受理;按撤回申訴、再審申請或抗訴處理;指定原審外其他法院再審;撤回申訴、再審申請或抗訴;指令原審法院再審;駁回申訴、再審申請或抗訴。非訴執行審查案件中的終結;撤回申請。非訴執行審查復議中的駁回申請;裁定不予執行;裁定準予執行。在執行案件中,和解并履行完畢;維持(駁回復議申請);執行完畢;終結;未完成送達或調查;撤銷或改正;撤回申請。共95種。
14.賀小榮、劉樹德、楊建文:《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》,載《人民司法(應用)》2014年第1期。
15.如山東省高級人民法院在《山東省高級人民法院關于在互聯網公布裁判文書的實施辦法(試行)》中,明確將于撤訴有關的裁定書排除出公開范圍;浙江省高級人民法院則在《浙江省高級人民法院關于在互聯網公布裁判文書的實施細則》中,將確認人民調解協議效力的裁定排除出公開范圍。
16.總量占比是指某省特定的案件類型文書數量在該案件類型全國總量中的占比。
17.限于篇幅,我們無法在此全文展示該表。有興趣的讀者可以到以下網址下載該表,http://pan.baidu.com/s/1mio8ehi.需要提醒的是,由于有部分案件我們無法確定是否存在相應的訴訟程序,該統計結果僅供參考。
19.出于這兩種數據的特性,我們在本報告中推薦采用中位數進行比較。以下各表我們在計算總都排除掉了上傳時間先于制作時間的錯誤文書,這一點前面已經有過介紹。
20.這部分數量雖然極少,但是可能對下文某些數值計算影響極大。
21.在上訴案件中,當事人上訴,一審法院向上級法院移交卷宗移交,二審結案并給一審法院寄回卷宗。如果維持原判,一審裁判文書生效;如果撤銷原判,一審文書并不生效。這一點減少了文書上傳(一審法院通常不會上傳被二審法院撤銷的文書),更是拖延了上傳時間。
22.后兩類情形在本文所抽取的刑事案件樣本中經常同時存在。此處為了更加清晰地與第6條相對應,仍區別計算。
23.一個值得探討的問題是,假如案件類型本身不屬于婚姻家庭、繼承糾紛,但案情敘述或判決說理中涉及該類法律關系或相關案外人的情況,是否應當進行相應的隱名處理。我們認為,從保護個人隱私的立法目的出發,案件中所涉婚姻家庭、繼承信息均應予以隱匿。
24.賀小榮、劉樹德、楊建文:《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》,載《人民司法(應用)》2014年第1期。需要說明的是,根據《理解與適用》的解釋,“家庭住址”是指家庭住址中可識別的相關信息,即自然人縣級(直轄市及副省級城市區級)行政區劃以下的具體住所地,縣級(直轄市及副省級城市區級)行政區劃以上區域性地址一般應予保留。“通訊方式”除傳統的書信、電話通訊方式外,還包括自然人在網絡所注冊的各種地址和各類賬號。
25.參見賀小榮、劉樹德、楊建文:《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》,載《人民司法(應用)》2014年第1期。
26.賀小榮、劉樹德、楊建文:《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》,載《人民司法(應用)》2014年第1期。
27.檢索時間為2016年8月23日。
28.有文獻將“特殊原因”解釋為“足以導致撤回該裁判文書的價值已經大于繼續公布該裁判文書的價值”。
29.賀小榮、劉樹德、楊建文:《〈關于人民法院在互聯網公布裁判文書的規定〉的理解與適用》,載《人民司法(應用)》2014年第1期。
30.2013年版規定第11條規定,“……需要撤回的,應當由高級人民法院以上負責互聯網公布裁判文書的專門機構審查決定,并在中國裁判文書網辦理撤回及登記備案手續”。如我們在系統中發現了一份案號為“(2012)魚民初(一)字第730號”的民事判決書,其標題為“廣某壯族自治區柳州市魚某區人民法院”。這種荒誕可笑的隱名方式,無疑是自動隱名軟件造成的。但這種一望而知的錯誤卻沒有得到撤回,只能說明撤回的成本對于基層法官來說實在太高。
31.值得提及的是,2015年5月最高法院發布了《關于人民法院案件案號的若干規定》及配套標準,這是最高法院在文書格式化方面一個可喜的進步。
32.2015年,最高法院出臺了《人民法院數據集中管理技術規范》,提出對全國審判數據、司法人事數據和政務數據進行集中管理,確保全國法院數據上下聯動、互聯互通。但這一技術規范文本并未對外公布,具體內容外界不得而知。參見中國社會科學院法學研究所法治指數創新工程項目組:《中國司法透明度指數報告(2015)》。
33.我們注意到,在近期的裁判文書網改版中已經添加了這一功能,部分案件在查詢結果中已經給出了關聯文書的提示。這值得肯定。
        
        
      首都法學網       北京市高級人民法院       中美法律信息與圖書館論壇(CAFLL)
      國家圖書館       美國法律圖書館學會(AALL)       國家檢察官學院
      中國社科院法學所圖書館       國際法律圖書館協會(IALL)       最高人民法院圖書館

主管單位:中國法學會  主辦單位:中國法學法律網合作機制 技術支持:北大英華科技有限公司(北大法寶)
電話:010-82668266-152 傳真:010-82668268
加入收藏 | 本站首頁 | 聯系我們
go