大數據時代,數據開放運動正在全球范圍內興起。2016 年國家發改委印發《關于組織實施促進大數據發展重大工程的通知》,提出建立完善公共數據開放制度和建立統一的公共數據共享開放平臺體系的要求。目前,數據開放的主體多集中于政府部門,廣義上來說司法機關作為一種特殊公共機構,理應在一定程度上開放數據。與此同時,信息化時代“智慧司法”工程的推進,對司法數據進一步提出釋放與共享的需求。筆者以法院數據、檢察數據為研究樣本,通過實證調研、實證分析等方法,歸納我國司法數據開放共享現狀及存在的問題,并提出司法數據開放共享體系的構建。
一、數據開放共享的意義
司法數據是指司法機關根據法律規定,在履行職責過程中所產生或獲取的、以一定形式記錄和保存的數據資源。司法數據開放最早可以追溯到“司法信息公開”。隨著大數據時代的到來,“司法信息”開始向“司法數據”轉變,特別是隨著大數據、新一代人工智能時代的到來,智慧法院、智慧檢務工程的深入發展,司法數據開放共享進入全面推進階段。
(1)司法數據開放共享有助于提高司法公信力
隨著當今社會政治、經濟、文化的發展,公民對于參與、了解司法的需求越來越大,要求越來越高。處于當事人、社會以及輿論媒體的監督之下的司法機關,需要以司法數據開放來滿足公民的知情權。司法數據的開放,使得法院、檢察院司法工作走入社會公眾視野,倒逼司法機關提升司法透明度,促進司法公平公正及司法公信力的提高。
(2)司法數據開放共享倒逼司法監督機制的形成
司法數據開放在提升司法公信力、保障公民知情權的同時,也對司法活動產生了監督效應。從外部看,將案件數據、司法業務數據置于陽光下,接受社會公眾及訴訟參與人的監督。從內部看,司法數據的系統內共享,促進同行業、上級機關對司法工作的內部監督。隨著大數據技術的深入推進,更多細粒度的司法行為數據將被采集,在此基礎上形成對案件質量的動態、實時評查,從而實現將權力關進“數據鐵籠”的現代化監督模式。
(3)數據開放共享推進智慧司法工程建設
黨的十八大以來,以習近平同志為核心的黨中央站在黨和國家事業發展全局的高度,順應信息科技時代發展潮流,明確提出網絡強國戰略、“互聯網+”行動計劃、大數據戰略、新一代人工智能戰略等重大決策部署。在此背景下,以類案推送、量刑建議、決策支持等功能為代表的智慧司法工程正在如火如荼推進。無論是基于何種業務的智慧司法應用技術,都依托于司法數據的采集。例如類案推送體系、量刑建議體系需要以海量的司法文書作為機器學習的“原料”,案件質量評查體系需要以海量的業務流程數據為“原料”。司法數據開放共享對智慧司法工程建設具有重要的工具價值和基礎意義。
二、司法數據開放共享模式
司法數據有開放和共享兩種形式。其中,數據開放包括完全開放型和有限開放型。完全開放即面向公眾完全開放,用戶可直接獲取司法數據;有限開放則是指數據面向特定主體的開放,這類數據一般與訴訟進程、當事人權益密切相關,不宜完全公開。數據共享是指司法機關系統內部或司法機關與其他部門之間,因履職需要而提供、獲取數據的方式。
(1)司法數據開放
法院數據開放以“中華人民共和國最高人民法院官網”為主要平臺,其匯聚了中國審判流程信息公開網、中國庭審公開網、中國裁判文書網、中國執行信息公開網、全國法院減刑、假釋、暫予監外執行信息網等七大平臺,對法院數據進行全面統一開放。其中,庭審現場、裁判文書、司法執行、企業破產重整等信息呈完全開放狀態;審判流程信息公開網、訴訟服務網則主要面向案件當事人、律師開放數據。檢察數據開放主要通過“人民檢察院案件信息公開網”來實現。人民檢察院案件信息公開網具體包括案件程序性信息查詢、法律文書公開、辯護與代理預約以及重要案件信息公開四大平臺。其中,“重要案件信息”和“法律文書”面向社會公眾開放,屬于完全開放類型;“案件程序性信息查詢”面向特定人群開放,屬于有限開放類型。
(2)司法數據共享
相較于數據開放受眾群體的廣泛性,司法數據共享主要面向司法機關本身,司法機關基于職能行使的需要,而獲取司法系統內部或其他部門的數據。
法院系統數據共享。法院數據共享以“人民法院大數據管理與服務”平臺為代表。該平臺堪稱全球最大審判信息資源庫,實現“全國法院”“案件數據”以及“統計信息”的全覆蓋,有三大類、十八小類,總計 148 項的應用功能和逾 9000 萬的案件信息。其開放的數據內容包括:外部數據、審判執行信息、司法人事、政務等信息,具有“數據管理”“共享交換”“數據服務”三大功能。
檢察系統數據共享。檢察數據內部共享以“全國檢察機關統一業務應用系統”為代表。統一業務應用系統能夠實現檢察人員在線辦案,將以往零散化的辦案行為數據、文書數據匯聚到統一平臺中。近年來,不少檢察機關開始盤活累積多年的統一業務應用系統中的數據,用以分析案件規律、輔助智慧檢務系統構建。
政法系統數據共享。基于智慧司法工程的推進和司法辦案需求,司法數據需要在公、檢、法三機關之間流轉、共享。政府數據共享以蘇州“跨部門大數據辦案平臺”、貴州省“政法大數據辦案系統”為典型代表。以蘇州模式為例,在蘇州市政法委牽頭、蘇州市人民檢察院承辦下,該市打造了“綜合信息管理平臺”,協調了公、檢、法、司四個部門數據。該平臺以信息流、業務流、管理流、監督流為主線,打造以刑事案件跨部門網上系統辦案為重點的信息共享平臺,不僅刑事案件數據全部在該平臺流轉,多年來還匯集成海量的數據資源池,為智慧司法工程推進奠定基礎。
不同行業間數據共享。隨著智慧司法進程的不斷推進,需要對不同行業的數據進行共享、匯聚,典型代表如“大數據職務犯罪偵查平臺”。基于對職務犯罪預防和打擊的需求,很多大數據偵查平臺融合了工商、稅務、水電、房產等與職務犯罪相關的其他行業數據。通過對多種數據的匯聚融合,能夠預判職務犯罪趨勢,對職務犯罪進行精準化預防和打擊。
(3)司法數據開放新形態
大數據時代,除了司法機關通過官方平臺開放數據外,開始出現一些商業化數據開放平臺。目前,法院數據的商業化開放模式較為成熟。商業化開放平臺的司法數據仍然來源于法檢官方平臺,但是其對檢索功能、文書類型、數據維度等都進行了加工和細化。從數據獲取及利用的便利性角度而言,商業化的數據開放平臺更受用戶歡迎。
四、司法數據開放共享存在的問題
(1)司法數據開放不均衡
整體來看,我國司法數據開放呈不均衡態度。首先,法、檢系統間數據開放不均衡,相較于法院系統的審判流程信息公開、裁判文書公開、庭審直播公開等七大平臺,目前檢察系統面向全社會開放檢察數據的平臺僅為“人民檢察案件信息公開網”以及部分省市的“兩微一端”。并且,社會公眾對檢察數據開放知之甚少,未達到預期的開放、利用效果。其次,地域間數據開放不均衡,經濟文化發達地區的司法數據開放水平明顯更高。以庭審直播數據為例,如北京市接入8 家法院,累計直播案件 809 場;“西藏自治區”接入 6 家,累計直播數量僅 10 場。
(2)司法數據可用性不高
司法數據開放延續著傳統司法公開對公民權利保障的需求,但還強調對數據資源的利用,通過挖掘數據背后的價值、規律,服務于社會治理并促進司法模式革新,這就對數據格式提出了要求。然而,相比于政府數據開放的結構化數據,司法數據多為非結構化數據,給數據的后續利用、分析帶來不便。除了法律文書數據可供機器直接分析外,庭審直播視頻數據、審判流程等非結構化數據利用程度并不高。
(3)司法數據共享程度不高
目前,司法系統內部數據共享仍存在一定壁壘,數據共享權限往往呈“倒金字塔”型。以檢察機關統一業務系統為例,該系統實現了全國檢察機關四級辦公、辦案數據的匯聚,但仍是一種不對等的、有限的共享。統一業務系統數據對不同地區、不同層級、不同個體的開放權限各不相同。一般來說,上級檢察院享有比下級檢察院更大的開放權限,同級不同院之間數據互不流通。很多數據處于分散、孤立的“沉睡”狀態,數據背后的價值尚未真正挖掘。
(4)開放共享體系不規范
數據共享體系不規范。隨著智慧司法的推進,司法機關對于其他行業數據的共享需求將會越來越大。然而,目前司法機關與其他行業間的數據共享尚沒有法律依據,各地司法機關多基于自身業務需求而進行“個性化”共享,實踐中不乏遇到數據共享受阻的困難。各機關在數據共享范圍、共享方式、數據利用限度、個人信息保護等方面的做法不盡一致,亟須進行統一化規制,特別是通過立法賦予司法機關基于職能需求獲取其他行業數據的法律依據。
商業開放體系的不規范。商業平臺通過對官方司法數據抓取、整合、開放的方式逐漸成為一種流行趨勢。然而,“人民檢察院案件信息網”“中國裁判文書網”等官方平臺均聲明,未經官方授權、同意,不得對網站數據進行商業性利用。目前,商業平臺的數據來源是否合法、是否有官方授權尚處于模糊地帶。從技術上來說,利用爬蟲等技術從官方網站獲取數據并非難事,官方的禁止聲明能否發揮實際約束效力存疑。另外,司法數據開放的本質就是為了司法信息公開,方便用戶獲取、利用數據,其禁止聲明某種程度上背離了數據開放宗旨,折損了數據開放、利用的效果。
(5)個人信息安全風險
個人隱私、個人信息保護及數據安全問題,是司法數據開放中最大的隱患。盡管法律文書中當事人、代理人、證人等個人信息已經過屏蔽處理,但仍會有電子郵箱、工作單位等相關信息沒有經過匿名化處理,多條匿名化數據匯集后仍有可能指向具體的個人。并且隨著大數據技術的發展,不排除不法分子運用撞庫、數據挖掘等方法,對數據加工后獲悉個人信息。
在數據共享機制中,個人信息安全問題更令人擔憂。基于司法職能行使的需要,在數據共享中對部分個人信息不宜采取屏蔽等技術手段,但不排除共享中還有大量與職能無關的個人信息。另外,大數據時代的司法數據共享往往是出于對犯罪預測、犯罪預防的考慮,這就需要以各類海量數據作為基礎數據庫。海量數據的匯聚融合,無形中形成一種“監控”態勢,給個人信息、個人隱私保護帶來威脅。
五、司法數據開放共享的完善路徑
(1)司法數據開放共享的立法完善
目前,就司法數據開放共享的立法而言,僅有少部分關于文書公開、案件信息公開的規則散見于各政策、規定中。當前的規定存在以下問題:首先,多為政策文件、內部規則,體系零散,且位階效力較低;其次,多側重于司法數據的開放,鮮有關于數據共享的規定;再者,規則設計多圍繞傳統的司法信息公開理念,并沒有考慮到大數據時代公眾對于司法數據“可用性”的需求,因此在數據格式、數據檢索、數據標準等方面欠缺相關規定。
對此,建議制定《司法數據開放共享規定》,對司法數據開放共享進行統一規制。具體可參照目前較為成熟的政府數據開放共享相關立法,對數據采集、數據開放范圍、數據開放方式、數據共享程序、數據標準、元數據、個人信息保護、法律責任等進行全面規定。
(2)檢察數據開放共享的程序完善
檢察數據在開放共享過程中,應確定、遵循一定的程序規則,特別是應當注意以下事項:
數據開放范圍。考慮到司法業務的特殊性,檢察數據開放中要兼顧數據開放與數據保護。可通過“目錄”清單形式,事先確立需要開放的檢察數據的種類、范圍、期限等,要注意根據刑事訴訟法的相關規定,不開放涉及國家秘密、商業秘密、個人隱私和未成年人犯罪的案件信息。
個人信息保護。目前,大部分司法數據開放時,已經隱去當事人、訴訟參與人姓名、身份證號、地址、賬號等個人信息,但仍要特別注意防范大數據時代通過數據聚合來識別個人信息的情形。另外,根據個人數據保護的內涵,仍應當保障當事人等主體對個人數據的部分自主控制權,至少要保障其對個人司法數據開放的知情權以及對錯誤數據提出修正、刪除的救濟權利。
數據商業開放規范。商業平臺對司法數據的整合開放已成為一種趨勢,盡管各大官方平臺都聲明未經過同意或授權,不得建立鏈接、鏡像,拷貝及傳播數據。然而實務中,數據一旦開放就處于不可控的狀態,難以對數據的商業化利用進行規制和防范。建議建立常態化“許可-授權”機制,明確獲得官方授權的商業平臺可開放數據。官方平臺應及時公布具有開放資質的商業平臺名單,從而保證司法數據開放的準確性、權威性及可信性。
行業間數據共享規制。在沒有法律規定下,司法機關與其他行業間數據共享難以把握范圍邊界,容易造成數據濫用。對此,應對數據共享進行嚴格的法律程序規制。通過立法明確行業間數據共享必須是基于履職的正當需求,雙方應通過書面協議形式明確數據共享范圍、數據接入方式、共享期限、個人信息保護等內容,并交由官方機構審核備案。
(3)司法數據開放共享的機制完善
打破數據壁壘。在建立司法機關系統內部數據共享機制時,要打破既有的數據壁壘。第一,打破權限壁壘。按職能需求分配數據權限,對一線辦案人員可分配較大的數據權限。第二,打破地區壁壘。不同地區的司法數據,可建立常態化的數據共享機制。第三,打破行業壁壘。如有學者提出,要建立全國統一的刑事司法數據庫,將公安、檢察、法院、司法數據互聯互通。
數據統籌管理。第一,分類管理。按照業務類別的不同,對司法數據進行分類管理。初步可分為文書數據、案件流程數據、司法人員數據、其他行業數據等。第二,統籌管理。在數據開放基礎上,可按照不同維度對數據整合,賦予用戶多元化數據查詢方式。增加一些基本的數據挖掘、數據可視化功能,便于用戶直接對司法規律進行初步分析。第三,增加結構化數據比例,例如將年辦案數、各類案件數據、各地區發案數等進行統計公布,以增強司法透明度。
嵌入業務應用。大數據時代,司法數據的采集、開放及共享,應以智慧司法需求為導向。例如類案推送、智慧定罪量刑系統需要以海量的判例為數據基礎;績效考核系統需要對卷宗數據、流程數據以及檢察官的在線行為數據進行采集等。智慧司法工程對司法數據提出了更高要求,需要在原始數據基礎上,基于業務應用需求,對數據進行多維度關聯整合,最大程度發揮數據效用。《法治》