一、中國目前司法統計實施情況
司法統計是通過數理統計和概率論的數學建模知識,對在司法活動中收集的系統性數據 進行分類整理、匯總描述、量化分析和總結,從而做出推斷和預測,為相關司法領域的問題提供決策和論證的依據與參考。司法機關從訴訟案件入手,運用統計分析的手段,從數量中觀察案件牽涉的社會現象并發現其發展規律和變化趨勢,為社會治理提供應對之策。司法統計的成果不僅反映司法活動狀況;而且也是促進司法改革理論和實踐必不可少的重要依據,同時對社會問題的發現和解決也有重要作用。
目前我國司法統計基本上按照以案件信息為核心,以司法統計報表為重要補充的司法統計模式。但是,總體上信息化水平較低且信息系統建設不夠完善;而且各地區、各層級法院的司法統計工作發展不平衡,數據共享較為困難。
近幾年法院內部施行的審判管理制度,在一定程度上促進了司法量化統計工作的開展;但審判管理制度與司法統計工作的相互促進作用仍不突出。事實上,目前許多省份建立的司法統計信息平臺與其審判流程信息管理系統尚無法實現信息對接和數據交換。大部分法院在程序未對接的情況下只能將審判流程管理程序中的信息表手工錄入司法統計報表,不僅造成了大量的重復性勞動;而且數據的真實性也難以保障。
為了促進司法統計的有效執行,一些法院對司法統計工作本身也會有考核,涉及司法統計工作的主要方面有信息表直接生成法綜表情況、裁判文書報送情況、死刑死緩報送情況、半年綜合統計分析情況、全年綜合統計分析情況、專題統計分析情況、統計機構設置、人員配備情況、統計資料整理、保存情況、對基層法院統計及相關人員培訓情況等等。這些措施對于司法統計工作的規范化、制度化開展具有積極的促進作用,細化了司法統計工作的內容和目標,有助于提高法院對于司法統計工作的重視程度。但是,對于當前及今后的司法工作形勢和要求來說,仍然需要創新理念以促進其實質性進步。
二、大數據對司法統計工作的影響
2013年召開的全國法院第四次司法統計工作會議分析了司法統計面臨的新形勢、新任務,尤其強調在大數據時代要重視數據、尊重數據、運用數據,改變重定性輕定量、重觀點輕數據的傳統思維模式做到用數據說話、用數據管理、用數據決策、用數據創新。
大數據的關系分析是直接計算現象之間的相依性。首先,需要得到盡可能多的原始司法統計數據,只要是案件中產生的數據,都可以全面記錄。接著對收集來的大量的分散的數據,運用大數據統計分析方法進行系統化分析,尋找變量之間的相關關系,這種相關關系可能是微弱的,也可能是密切的,可能是已知的,也可能是新發現的。那些新發現的變量關系對法律和法學研究都是極為重要的新實證資料。而那些微弱的相關關系也為更加深入分析問題提供了可能的方向和思路。大數據理念指導下的司法統計,勢必要求數據的全面、真實、可靠,用數據發現司法活動中存在的問題;同時也用數據回應社會對我國司法的認識,司法改革才能向著更深的層次推進。
三、大數據背景下司法統計方式的改革
大數據的“大”要求在司法統計的數據采集環節具有很高的數據獲取能力,司法統計方式直接決定司法統計口徑方案的可行性。所以,在大數據背景下,司法統計的方式要做出積極改變,確保數據的全面、準確、及時。
(一)注重從抽樣到總體的統計思維方式
轉換傳統統計多采用抽樣調查的方式,基于一定的科學抽樣理論以確保抽樣調查具有一定的精確性和可靠性。這已不能完全應對司法工作中產生的大量數據及數據分析需求。大數據的統計方式就是要使數據樣本盡量接近總體。盡可能多地獲取數據資源,與此同時,數據的集中必然會提高數據的交流,有助于打破長期以來存在的數據孤島現象。
。ǘ<涌焯嵘痉ńy計信息化水平
近幾年各級各地法院基本上已經普及了電子化統計信息系統。在此基礎上,要進一步提升司法統計的信息化水平,針對目前信息化工作中存在的問題做出相應對策。同時,要加快落實司法統計軟件系統與審判流程信息管理系統數據庫信息對接,這樣可以避免司法統計軟件系統數據的孤立運轉、保障統計數據可以及時有效地獲取,減少人為數據轉錄的重復工作; 另一方面,信息庫的對接還可以避免在這一環節中出現的數據篡改和數據錄入錯誤等問題。
。ㄈ﹪栏衤鋵嵃讣鞒谈櫣芾頇C制
對于司法統計工作來說,案件流程跟蹤管理可以有效保障數據來源的原始性和真實性,避免數據統計時間出現偏差,為大數據分析提供有價值的數據基礎。
。ㄋ模┳⒅厮痉ńy計數據的原始性
大數據規模巨大、數據結構復雜,在整理數據的過程中可能會損壞原有數據中有價值的信息。在統計研究過程中,對于不同的研究者,會根據不同的需要,不同的數據算法而選擇取舍不同的數據作為基礎。別人的分析結果往往不能滿足自己的研究需求,此時必要根據原始數據,運用自己的統計模型和研究方法得出自己的統計分析結果。由此可見,在司法統計時應該注重數據的原始性,盡量避免在初次數據采集時就進行人為的歸納和提煉,保持數據最真實、最原初的狀態,這是大數據理念的鮮明特點。
四、大數據背景下司法統計口徑的改革
司法統計口徑的科學合理規劃,直接影響著統計分析工作的效率和統計結果的數據價值。 大數據治理的理念給司法統計口徑改革提供了新的思路。
(一)建立更加全面的統計口徑
司法統計信息化水平不斷提升的同時,數據量也將不斷增加。如果不加大數據統計口徑的廣度,不斷擴充司法統計指標體系,那么統計到的數據就會成為“被塵封”的資源,難以發現數據背后的巨大價值。因此,擴充現有的司法統計指標體系,建立更加全面的統計口徑具有十分重要的意義。司法統計工作研究部門要有計劃、系統地不斷擴充統計指標體系,制定指標建設規劃,廣泛征集實務部門對統計指標的建議和意見。一方面,要對原有的指標體系進行優化和細化,對傳統重點指標保持重視的同時,加強新的指標的建立。另一方面,根據案件流程和案件內容,如刑事、民事、行政和知識產權等不同類型案件的特征,分別建立相適應的評價指標。
。ǘ┙y計口徑的創新
大數據理念下的司法統計數據中,非體系化的、非結構化的數據比重增大要發揮其價值, 最直接的方法就是在這些非結構的數據基礎之上創新司法統計指標體系,建立相應的司法統計數據倉庫,讓這些“沉睡的數據”說話,實現結構化數據與非結構化數據的對接。大數據分析的核心就是數據挖掘,司法統計研究部門就是要基于不同數據類型和格式的各種數據挖掘算法,科學地呈現出數據本身具備的特點及聯系。需要說明的是,通過數據挖掘構建司法統計指標體系,不僅可以充分運用司法系統自身產生的數據,那些來自司法系統外部的相關數據,如工商、環境、稅務、專利等執法部門、戒毒機構或者相關民間組織的數據也可以作為重要的參考。
。ㄈ┙y計口徑的統一協調和多樣化
統計口徑的統一協調,就是不同的統計主體適用一致的統計口徑。即各級各地法院適用相同或相關的口徑內容,統計的口徑內容包括:指標體系和統計時間區間標準等統一協調工作,需要最高法院的大力推行和地方各級法院的積極配合。尤其是在司法統計信息平臺的軟件設計和數據庫構建上,要推行采用相同的基礎標準,確保在一定范圍內的統計口徑統一;另一方面,要特別強調鼓勵各級法院在司法統計口徑的上的創新和多樣化,在遵循統一的統計口徑基礎標準的前提下,允許各級法院積極探索和嘗試增加新的口徑指標;并適當選取試點進行實施。本文原載于《統計與信息論壇》2017(3)