隨著國家法制建設的發展 ,圍繞國家大政方針的制定 ,立法決策機關越來越重視科學立法的重要性。而立法過程中法律文獻的收集、檢索及利用作為一項重要的基礎性工作因其文獻本身的特殊性成為立法工作急需解決的首要問題。隨著現代信息網絡技術的發展,以《北大法寶》、《律商網》、《國家法規數據庫》為代表的法律法規信息系統和服務網站逐步取代了以往法規原本文件,成為當前立法工作者主要的參考工具。然而 ,現有的各類系統、網站因其承建主體資質的局限性 ,導致文獻內容不全、失效、質量參差不齊等各種問題 ,這主要體現在:信息來源缺乏權威性、準確性;法學期刊、論文種類有限 ;深層信息挖掘和聯系有待完善等方面。
因此 ,理清現有系統的優劣 ,充分利用信息網絡技術挖掘法律法規各類文獻,建立一個集文獻收集、全文檢索、原版展現、個性化定制四位一體的法律法規信息服務系統已成為立法工作的一項重要議程被允以實施。筆者認為,該系統的建設主要分為數據加工、數據管理、數據發布和利用服務等環節 ,并最終實現為立法機關提供豐富、準確、權威的法律信息,以此建立關聯、立體的法律知識網絡,從而構建全方位的法律法規信息服務系統。
一、系統建設情況
1)立項情況。
基于對市場現有各類法律法規信息服務系統的調研以及立法決策機關的需求溝通 ,以文獻收藏最為豐富的圖書館為切入點 ,聯手相關政策法規制定部門 ,建立我國法律法規數字資源共享中心,成為信息網絡時代立法工作的新途徑。
該系統于 2010 年正式立項并投入建設,本著“邊建設、邊服務”的原則,在系統服務方面,希望最大限度地滿足用戶全方位、多渠道獲取權威信息與知識的需求。經過詳細調研與設計,至 2013 年 11 月 ,正式推出了“中華人民共和國法律法規信息服務系統”(以下簡稱系統),并面向部分中直機關提供服務。系統收錄了法律、行政法規、部門規章等各種規范性文件以及各類相關的立法背景資料、政府工作文件,并可提供完整的規范性文件政府公報、政報原圖下載,從而確保信息權威、準確。
2)系統規劃。
“中華人民共和國法律法規信息服務系統”是面向中央國家機關的立法決策部門和執法部門而建設的一個法律法規數據整合化、精細化、專業化信息系統。
在數據來源方面 ,系統基于圖書館及政策法規制定部門全面、宏大的法律法規館藏資料,對國內法律法規文件、歷史法律法規文件、現行法律法規文件以及政府公告文件等信息進行數字化加工和內容結構化處理,并對外提供服務,從數據來源上保證了系統的權威性。
在應用服務方面,系統需要從兩方面考慮。一方面 ,可以為用戶提供基于法律法規元數據、全文內容數據、法條內容數據等多層次的檢索、分類、展現、全文原版原貌查看、原文回溯查看等服務,實現針對整部法律及至法律法規中一個具體條款的歷史沿革、關聯法律、關聯法條推薦等服務 ,以更加精細化、專業化的服務水平為中央國家機關提供立法決策的參考輔助和智力支持。另一方面,也為相關科研人員提供方便、靈活、高效的法律法規數據管理和維護等功能,提升工作效率和服務水平。
因此 ,從整體上考慮,平臺需要構建為一個集法律法規數據加工、數據管理、數據發布和利用服務于一體的綜合性信息服務系統,以“知識本體”的理念深層挖掘與揭示法律法規內在邏輯關系,形成一個全面、立體的信息服務網絡,從而幫助立法工作人員快速、全面、準確地獲取所需法律信息。
二、 系統功能實現
“中華人民共和國法律法規信息服務系統”采用先進的系統構建方法、智能化及人性化的信息服務與檢索方式。其設計目標是要建立一個安全、穩定、準確、及時、全面的法律法規信息服務系統,并且整個系統在總體設計上遵循開放、可擴展、安全的原則 ,從而使整個系統結構合理、技術先進、易于擴展,既能滿足當前的業務要求 ,又符合長期發展的需要。在應用功能層,主要設計了項目所需的各個應用系統或功能模塊,包括數據加工系統、信息發布系統、資源服務系統等 ,各系統的技術實現如下。
1)信息采集與加工。
系統的數據來源主要包括政府公告文件、現行法律法規文件、歷史法律法規文件以及國外法律法規文件等。這些文件基本都是以紙質文件形式進行保存 ,因此必須首先對這些文件進行數字化加工。數字化加工主要包括紙本文件的掃描、OCR 識別和生成 PDF 文件。
此外,系統要求提供細化到具體條款級的內容服務。因此 ,在完成法律法規文件的數字化加工后,還需對數字化內容進行結構化加工,即根據法律法規的內容結構規范(元數據規范),通過軟件工具對全文內容進行結構化分析、標引、抽取和保存。工具需要支持智能分析、智能標引和快速人工標引 ,支持可視化的加工內容編輯與審核 ,支持加工方案(包括標引字段、識別規則與輸出方式)的自定義以及多種方式的加工數據輸出。實現專業、準確的法律法規文件結構化加工的同時 ,盡可能的減少人工參與 ,提高加工效率 ,確保識別準確度。
2)數據發布與管理。
為確保系統的數據權威性 ,在每一條法律法規結構化數據對外提供服務前 ,都需要有嚴格的數據審核機制和科學規范的工作流管理。同時 ,為了更準確地提供法條內容關聯服務,需要人工對關聯內容進行審核與維護。這些工作都需要通過系統的發布管理端實現。系統發布管理端為工作人員提供法律法規結構化數據與原始數據的同屏比對、數據修改、關聯內容選擇與自定義等功能。數據審核通過后,才能進入正式庫中進行發布。通過此系統,提高法律法規數據發布管理流程的工作效率,進一步保證數據的準確性與權威性。
3)資源利用與服務。
在對外服務方面 ,系統提供全文檢索、分類導航、全文原版原貌展現、原文內容回溯、法條關聯、法律法規知識詞網等應用服務。其中,檢索范圍包括法律元數據信息以及法條內容 ;分類導航可以依據適用范圍、類型、年代、地區(國家)、主題詞等進行法律法規的分類瀏覽;全文原版原貌展現要求以原始文件的排版格式進行展現 ;對于檢索到的一條法條,可以快速調用原始文件,并直接定位所在頁面進行查看 ;針對整部法律法規以及法律法規中的每一項條款,都提供相關的內容推薦,包括立法背景、歷史沿革、相關法律(條款)、相關案例等信息 ,使用戶可以全方位了解該部法律或該項條款的相關知識 ;提供基于關鍵詞的法律法規知識詞網 ,實現相關關鍵詞之間遞進延伸的關聯網絡 ,為用戶揭示相關法律、相關法條、相關案例、相關參考資料等信息。總之 ,在資源利用服務方面 ,需要為立法律法規知識網絡。
三、系統設計
法律法規信息服務系統從軟件設計角度來說可以分為數據結構化加工、元數據倉儲、全文檢索定位、站點發布等子系統。從項目實施過程來看,還包括了法律法規文件的分類梳理以及數字化加工兩方面內容。平臺系統總體架構如圖 1 所示。圖 1 法律法規信息服務系統總體架構設計(略)
1)數據結構化加工。
首先對法律法規文件進行分類梳理,對于梳理出來的法律法規紙質文件按照分類進行數據字化加工,并轉換成雙層 PDF。對于 PDF 文件,通過數據結構化加工平臺進行內容的結構化加工 ,根據確定的數據結構提取出對應的結構化字段文本內容。數據結構化加工平臺支持加工方案的自定義,實現對 PDF 內容的自動分析、智能標引以及人工劃框標引 ,加工結果可以保存為 PCI 文件以備審核校對。加工后的數據可以導出為 XML 文件或直接同步到數據庫中。
數據發布管理平臺可以為國家圖書館工作人員提供法律法規結構化數據的審核、維護,支持原始文件(PDF)的同屏顯示與人工比對 ,可以提高數據審核效率。同時,還可以為每條數據提供關聯內容查看、選擇、刪除等功能 ,允許用戶自定義添加關聯內容 ,并默認優化顯示。審核通過后的數據,才會保存到元數據倉儲中待發布。
2)元數據倉儲。
元數據倉儲是本系統的核心組件 ,它提供了不同法律法規類型的元數據庫 ,用以存儲相應的結構化數據。同時 ,利用全文檢索引擎 ,對于存儲數據的文本內容進行索引 ,建立全文索引倉儲。此外 ,所有數字化加工后的 PDF 文件都按分類保存在文件目錄 ,通過元數據倉儲可以調用全文查看 ,并定位法條所在頁面進行原文回溯查看。
3)全文檢索定位。
全文檢索引擎可以實現對法律法規結構化數據的檢索。分析引擎和規則引擎可以實現法律法規數據的分類導航與法條關聯。WordNet 組件可以實現基于關鍵詞的詞與詞間關聯查看以及與法律、法條、案例、參考資料等的內容關聯。原版原貌組件可以實現法律法規全文原始樣式的在線查看。元數據倉儲管理平臺實現對元數據倉儲的數據維護和接口配置。PDF 閱讀工具可以嵌入到平臺上 ,提供 PDF 文件的在線瀏覽與頁面定位。
4)站點發布。
通過系統發布站點,向立法決策用戶提供信息搜索、分類導航、原版原貌展現、原文回溯查看、法條關聯、關聯詞網等應用服務 ,并可根據用戶需求定制個性化頁面 ,采用可視化編輯模塊,方便用戶制作符合個人閱讀習慣的站點模塊。
四、 對系統提升的幾點建議
法律法規信息服務系統經過近兩年來的建設與發展 ,已基本滿足立法工作者對于法律信息查找與回溯的需求,但系統本身的可用性仍有較大的提升空間。筆者認為 ,可以從以下幾點入手 ,提升系統服務能力。
1)增加標引項目 ,加強揭示力度。
全文檢索及關聯揭示是系統主推的特色功能 ,而標引項目則是對法律法規各個特征的揭示。標引項目的多少。直接決定著檢索途徑的多少。一般來講,標引項目應包括法律法規的名稱、類別、頒布部門、效力狀況、生效日期、修改日期、失效日期、效力范圍等。
2)提升語義檢索與法條關聯的準確度。
基于語義檢索實現的各種功能是本系統最核心的部分之一 ,但從目前的服務情況來看 ,盡管針對該方面投入了大量的人力、物力 ,卻并未收到應有的建設成果。究其原因 ,主要是其與法條關聯的準確度有待提高。若想實現系統基于知識本體的深層挖掘 ,則需在此方面加大調優力度。
3)擴展異構資源整合功能。
法條數據的完整性及時效性直接決定著立法工作的順利與否 ,同樣也是本系統功能實現的關鍵點。而法條的發布與展示因其頒布者選用方式的不同導致了數據收集渠道和方式的差異,這就要求系統能對各類異構資源進行整合。同時,面對不斷變化的實際情況,還需不斷制定新的法律法規。在這樣一種情況下,需要切實加強系統的數據更新與維護工作 ,對新出臺的法律法規要及時予以收錄,對那些或修改或廢止的法律法規要及時予以標引。
4)多渠道分發。
法律法規整合服務的展現方式是可以多種多樣的 ,網站只是其中之一 ,還可以通過觸摸屏、手機、電視等不同的方式向用戶提供服務。從業界已經實現的網站和移動服務反饋情況來看,都受到了很好的社會效益。因此 ,系統后續還應考慮通過多媒體等方式為用戶提供服務,讓用戶可以隨時隨地地獲取到所需信息。
法律法規信息服務系統的建設是一項浩大而復雜的工作 ,也是法制信息化和電子政務建設的重要成果,系統的建設和應用不僅對于搞好法學研究和法律實務工作大有裨益 ,而且對于保障科學、公正、民主立法 ,推進依法治國這一治國方略也具有重要意義。隨著系統在立法機關的深入應用,系統將在數據質量、檢索功能、人機交互性、智能分析處理等方面得到進一步改進和完善,以更好地服務于我國立法工作。《硅谷》2015年第2期。