改革開放以來,法律出版在國家依法治國的目標指引下,在宣傳法律知識、普及法律常識、推進民主法制建設方面發揮了重要作用。在面對新時期的政策要求、平臺構建以及技術發展的情況下,如何能夠快速認清形勢、發揮法律出版的突出作用,通過與其他業態進行結合和優勢互補,是目前法律出版要考慮的重大問題。中國民主法制出版社法律應用分社暨北京法宣在線科技有限公司(以下簡稱“法宣在線”),在法律出版與人工智能的結合上進行了探索和嘗試。本文將從幾個方面對我們建設法律人工智能服務平臺的思考及實踐進行梳理,以供參考。
1、背景
法律出版的起步階段是新中國成立伊始,主要出版少量的法律法規書籍,以及面向干部的學習材料,還通過翻譯借鑒國外的法律制度和法學著作,出版了一批法學名家的書籍及法學譯本。隨著時代的發展,我國法制建設逐步完善,法律出版密切配合主管部門并服務于行業發展,也逐步向規模化正規化發展。
近年來,我國逐步明確了法律服務要面向廣大民眾,讓群眾感受到法律的公正平等,從而獲得幸福感和安全感。這些都對法律出版提出了更高的要求,需要不斷探索新的內容載體、服務形式及技術突破,這些是提給法律出版的問題,同樣也適用于其他專業出版。
我們再看向法律人工智能的發展。1987年,在位于美國波士頓的東北大學,舉辦了首屆國際人工智能與法律會議(ICAIL),在會上第一次提出了法律與人工智能相結合的問題,并直接促成了1991年國際人工智能與法律協會( IAAIL)的成立,該協會的宗旨為--推動人工智能與法律這一跨學科領域的研究和應用。在創立伊始,IAAIL就設定了十大主要議題,包括自動化法律文本分類和概括、自動化次要、重復性法律任務的法律機器人等研究內容。
而我國對于法律業務當中的人工智能技術也在逐步探索。2017年4月20日,最高人民法院印發 《最高人民法院關于加快建設智慧法院的意見》,旨在深入貫徹創新驅動發展戰略,全面落實《國家信息化發展戰略綱要》和《“十三五”國家信息化規劃》對智慧法院建設的總體要求,確保完成《人民法院信息化建設五年發展規劃(2016-2020)》提出的建設任務,以信息化促進審判體系和審判能力現代化,努力讓人民群眾在每一個司法案件中感受到公平正義。同年7月8日,國務院印發《新一代人工智能發展規劃》,提出“促進人工智能在證據搜集、案例分析、法律文件閱讀與分析中的應用”。目前的法律與人工智能創業潮中,明顯可見的創業方向包括自助合規審查、合同審核、電子證據開示、訴訟結果預測等。
近年來,國家一直在持續推動司法改革和法律信息化,“互聯網+法律”也成為重要的創新創業方向。隨著社會的發展,法律服務越來越成為人們生活中不可或缺的“消費品”,這直接引發了法律服務市場的繁榮和發展。而隨著人工智能技術興起,一批面向 B端或者C端的法律人工智能產品逐步進入公眾視野,為大眾熟知。
2、用戶需求的變化
長期以來,法律出版由于其專業性決定的受眾群體相對固定,主要以司法人員為主,普遍通過圖書等形式出版正式的法律法規書籍,輔以適當的面向普通讀者的普法讀物。這些都限制了法律出版的規劃和發展,具有市場競爭力弱、同質化內容嚴重等問題。
隨著近些年技術的發展,出版的內容搭載介質發生了從紙質圖書、電子圖書、互聯網及移動應用APP的變化,但是法律出版步伐相對較緩,原因也是受眾群體并不是面向普通讀者,沒有旺盛的學習和獲取法律知識的需求。但隨著國家法律服務的發展,以及人民群眾對于自身法律權利,尤其是生命、財產及健康權利的日益重視,法律服務市場的需求越來越廣泛。人們不希望從繁復的法律法規中去自己學習,而是想要向專業的法律人士尋求服務。這對于法律出版是一次重大的機會和挑戰,傳統出版往往以文本、音視頻為核心,從未考慮過將這些內容轉化為知識,再進一步轉化為服務。能夠借助先進技術,尤其是人工智能實現這一步的跨越,將決定法律出版能否迎來新的重大發展和突破。
3、引發的行業變革
3.1 載體變化趨勢
伴隨互聯網進一步發展及計算機、智能手機、平板電腦等介質的普及,數字閱讀成為居民重要的閱讀形式。法律出版物被制作成電子書,出版量逐年上升,都標志著數字閱讀在中國的發展日趨成熟。一方面,數字閱讀產品廉價、便捷,一定程度上影響著讀者的購買選擇,對紙質圖書的銷售形成沖擊;另一方面,由于內容上的差異性,數字閱讀與紙質閱讀可以分別滿足消費者不同的閱讀需求,數字閱讀產品并不能完全取代紙質圖書,二者結合的銷售模式可實現經濟效益的最大化。
隨著人工智能的發展,越來越多的知識以不同形式出現在我們身邊,例如移動應用APP、智能音響、智能機器人及各類智能終端。知識內容也從文字、音視頻轉變為人機交互、智能咨詢及多模態的形式呈現。
3.2 功能變化趨勢
3.2.1 內容檢索方式
如何從海量的、復雜的法律體系文書及內容中,快速找到所需要的材料及內容,對于法律人的價值不言而喻,無論是從業者、公共法律服務人員,還是普通民眾,對于法律知識的獲取,往往需要高效的法律檢索作為支撐。但是,當前的大部分搜索引擎的核心價值在于數據量的龐大與完整,真正能夠提供良好搜索體驗的并不多。使用這類搜索引擎,往往需要用戶對搜索內容有一個完整或清晰的認識,甚至需要能夠提煉出關鍵詞或專業術語,才能達到良好的搜索結果。這對于法律人來說需要經過專業的學習和豐富的從業經驗,但是對于普通民眾來說,則并不適用。所以,基于自然語言處理(NLP)和深度學習的語義檢索和法律問答已經在開始改造傳統的法律檢索服務。比如,支持語義理解的搜索能夠更好地理解用戶的提供,并將相關的搜索結果進行呈現,甚至基于圖譜等知識結構提供引導式的交互體驗,幫助用戶找到更為理想的答案。再結合語音識別技術、意圖識別算法等相結合,在人機交互過程當中,就能夠提煉出用戶所想,解決了對于關鍵詞、字符匹配等傳統技術存在的問題。
3.2.2 輔助生成法律文書
因為法律方面的文書在格式和內容上具有相對標準的格式,所以自動生成法律文書就變得具有很強的可操作性。傳統方式為法律人使用標準的文書模板,自己根據案件的內容進行整理并在模板中進行修改,從而形成一份文書。
目前,這一過程已經有更多的自動化程度。例如自動從上一階段的眾多文檔中進行信息抽取,得到用于生成本階段文書的關鍵信息,然后通過入模版的方式來自動生成法律文書。最后人工再對該文書進行審核,進行一定的校對工作。該種方式,將法律人從編寫文書的大量人力工作中解放出來,從編寫者轉變為審核者,從而從事更為重要的工作。對于廣大群眾來說,也可以通過人機交互的方式回答必要的信息及進行一定的選擇操作。通過獲取用戶信息,就能提供一份相對專業的法律文書,便于用戶了解相關法律法規及辦理流程,以及得到初步提交的正式法律文書材料。
3.2.3 一站式在線法律服務
隨著網絡及互聯網的發展和普及,更多的服務都向在線方向上進行遷移,但是由于法律服務的私密性和嚴謹性的要求,一直處于較低的發展階段。近年來,出現了如在線咨詢、智能問答、案例查詢、智能法律意見書等服務。這些服務一般作為常規法律服務的前期引導和接觸為主,通過較為初步的分析將客戶的法律服務訴求進行收集和整理,并進一步引導客戶來逐步完成后續服務,例如對接律所、律師,人工客服支持等。在未來,隨著公共法律服務業務上的開放和支持,會有更多的一站式服務平臺能夠提供更為完整的服務體系,使得用戶可以在網上完成整個辦事流程,并支持查看跟蹤進度及結果報告等。
3.2.4 更多智能終端形態
這里的智能終端是廣義的,包括PC、手機、觸摸一體機、智能機器人、自助柜員機、無人亭等。這些終端在功能上是較為接近的,根據不同的硬件支持形態及應用場景,會具備特殊化的一些功能。例如PC、手機,隨時可以接觸到,具有更好的實時性,所以適合辦理各類業務的在線辦理,網上提交材料,隨時查詢數據;觸摸一體機,因為大屏展示,查詢和展示內容、播放視頻的效果理想,所以適合擺放在公共法律服務大廳的辦公場地,提供咨詢、引導、查找功能;智能機器人,除了軟件功能外,又加持了機器人硬件本身的功能,包括進行訪客迎接、地圖引導、人機交互、載歌載舞活躍氣氛等功能,適合放在學校、展會、活動組織等場景,起到推廣宣傳的作用;自助柜員機及無人亭,類似于銀行ATM機,特點就是硬件支持完善、功能業務完整,通過與助辦理,彌補人員和人力的不足,適合放在服務大廳中作為柜臺的輔助,或者放在公共場所提供就近的法律服務,尤其是無人亭,還適合放在較為偏遠的地區,作為微型法律服務站存在。以上,將使得用戶可以隨時隨地獲取所需的法律服務,感受到技術發展所帶來的便捷。
3.3 行業競爭趨勢
3.3.1 更多廠家入場
綜合AI技術及解決方案供應商,一般為大型的互聯網企業,以阿里、騰訊為例,其具有完整而成熟的基礎層和算法層面的能力,通過其自身體量和平臺優勢,采用與法律相關公司的戰略合作,形成強強聯合,發揮優勢互補,共同經營法律人工智能這一業務方向。對于出版行業來說,可以與其形成合作關系,體現出自身的核心競爭力,共同完成發展轉型。
專業法律信息平臺,這些公司一般長期從事和法律相關的業務方向,以建設信息管理系統、公檢法工作OA為主,在人工智能興起之前,他們是法律行業的領跑者。近年來,也逐步考慮引入人工智能技術來提升自身系統的競爭力,同時將最終用戶逐步從業務內工作人員變化為更為廣大的普通民眾。對于出版行業來說,可以自身組建這樣的公司,但需要大量的技術投入和時間成本。新興的初創公司,創始人或合伙人往往具有技術和法律業務的多種背景,他們看準某一具體的細分場景,集中全力解決一類問題。用戶目標一般為普通民眾,將用戶數量提升作為自身產品成功與否的標準。因為受到資金和市場的青睞,這類公司會有較為充足的資金進行前期市場營銷和用戶吸引,發展較為迅猛。
3.3.2 領域聚焦細分
人工智能技術是一種新興的技術,可以將其類比人類發明了電、互聯網等,但是與這些資源型技術不同,人工智能技術需要由算法、數據及業務共同互相作用,才能形成良好的應用效果。所以,從應用層面的角度來講,算法必須結合某一行業、某一場景的數據和業務邏輯來進行建模和優化。因此,想要把人工智能的長處發揮出來,所做的工作就必須要絕對的聚焦,瞄準細分領域,踏實地進行數據收集積累、整理標注、建立模型、算法模型改進、設計服務能力,并根據應用情況的反饋進行持續的調整和優化。
3.3.3 生態逐步形成
我們將人工智能的生態分為3個層級:
(1)底層硬件,提供包括AI芯片、各類傳感器在內的基礎硬件,其自身的硬件已開始支持人工智能計算框架的搭載和運算,提供了硬件級別的加速和計算能力。
(2)通用AI技術及平臺,提供云化的服務器及高穩定性的中間件支撐,作為算法的基礎提供了強大的計算能力和可擴展的存儲能力。本次人工智能的發展熱潮,已經是人工智能的第三輪大規模高速發展期,除了算法上有了一定突破外,計算力方面的大幅度提升也是重要原因之一。
(3)應用領域,不同領域、不同類型的廠家都集中在這一層面,借助前兩個層級的硬件及平臺基礎,對自身業務和數據進行處理加工,采用人工智能技術將數據轉化為模型,并提供智能服務。大部分的法律出版公司都應該在這一層面發力,尋找適合自己的業務和應用方向。
4、當前難點及解決方法
4.1 現實困難
面對人工智能的迅猛發展,很多人都認為種可以起到決定性作用的重要手段。但從目前技術及業務的積累來看,在未來很長的一段時間之內,法律人工智能還是會充當接入、引導以及輔助的功能。主要原因如下:
第一,法律數據資源匱乏且低質,出版行業的法律內容,大部分都是非結構化的文字或音視頻數據。對于計算機及算法的有效理解和應用,都還需要經過自然語言處理或語音/圖像識別算法處理,這一過程本身就會造成數據的不準確與失真,同時也需要大量的人力進行結構化標注才能進行模型構建,這就需要長期而巨大的人力投入。
第二,法律數據會涉及相關案例和人員信息,由于保密及辦案需要,很多數據不能完全公開透明,使得數據的使用和積累受到影響。如果我們僅僅從法律法規上去分析,又會使數據不那么立體,缺少數據支撐和數據深度。
第三,算法層面,一些基于統計的機器學習算法,會存在很強的算法歧視性。例如,對于特定人群、特定職業、特定地域可能會存在較為明顯的區別對待,這對于算法而言固然沒有什么錯誤,但是應用起來則會引起很大的爭議。人工智能的算法是具有隱秘或不可解釋性的,例如各類深度學習算法,神經網絡等構建方式,是在模擬人腦的思維過程,通過對結果的評估來選定好的參數來固定模型。至于為何這個參數最有效,以及這些參數代表了什么含義,往往是無從解釋的,這也使得算法對于結果缺少充分的解釋能力,不那么令人信服。
第四,長久以來,法律界對人工智能技術是比較疏遠的,因為法律界是要求嚴謹、合規的,而人工智能技術則顯得神秘、高深,兩者始終有一定的距離。對人工智能缺乏客觀的認識,存在人工智能什么都能做或什么都做不了的兩種極端認識,使得很難接納人工智能技術進入到法律行業。同時,人工智能界對法律行業的投入有限,過于看重眼前收益,當前集中在能快速落地和可以帶來快速收益的行業當中。而法律行業因為一方面涉及民眾、一方面涉及政府職能部門,所以發展和變現能力都相對較弱。
4.2 如何應對
面對困難,我們有辦法對應,但這是一個長期的過程。
首先,要有充分的認識,做好充分的心理準備。比如,如何讓社會接受“機器人法官”,怎樣將人類法官優秀經驗進行歸納,這些都是很長期的工作,不是短期內就能實現的。又如,對于人工智能界來說很現實的一句話“多人工就多智能,沒人工就沒智能”,在現有階段的算法能力上來講,確實已成為法律人工智能能否有效運用的基本操作方式,這就對于數據的積累、有效標注等提出了很高的要求,要經過長期的積累。
其次,合理選擇運用領域進行嘗試。法律人工智能現階段應定位于做輔助法律人決策的助手與“參謀”角色,不要直接參與最終的判決當中,即多適用于非裁判性事務。在民事案件中,像保險類糾紛、網絡支付糾紛、網上金融交易糾紛、小額借貸糾紛、勞動爭議糾紛、交通事故糾紛、婚姻繼承糾紛等;在刑事案件中,盜竊、搶劫、酒駕等,這些案件的案情相對簡單、證據較為客觀,人工智能有著較好的運用前景。但是,對于像職務犯罪,殺人、故意傷害等惡性案件由于需要對證據進行更為仔細的甄別,再加上每個案件都有其特殊性,因此對人工智能的適用需要謹慎。
最后,在技術和人才層面綜合推進。技術層面,根據我們法律行業的業務及數據特點及法律實際,自主研發核心算法,包括但不限于自然語言處理技術、知識圖譜、用戶畫像及個性化推薦等,并注重數據積累,加快法律文書的公開化建設,通過脫密、加密等機制使得更多的數據可以用于研究和嘗試,促進技術發展。人才層面,注重人才的培養與融合,法律人與技術人的結合程度決定法律人工智能的運用深度。從法律人工智能的角度系統培養相關的專門人才,推動法律人士與技術人士在知識結構上的深度融合。
4.3 當前實踐
4.3.1 組建專業團隊
通過上述的分析與思考,“法宣在線”較早作出判斷,結合法律出版新的機遇,確定了自身的發展方向。根據自身為專業法律應用出版社這一實際特點,招聘組建了包括人工智能算法工程師、法律知識工程師及應用研發工程師在內的研發團隊。
通過將自身的法律內容加工形成可供算法訓練學習的原始數據,根據業務應用選取合適的算法進行模型構建,并提供法律分析、推理等服務,形成了一個服務平臺多個服務終端的法律服務平臺體系。通過跟司法部、各省司法廳局的合作及調研,逐步形成了查詢、咨詢、辦理三類業務,并細分為數十個業務板塊的服務架構。
4.3.2 設計全面功能
第一,融合司法行政領域業務。按照法制宣傳、法律服務、法制保障三大職能,設置了法治宣傳、法律援助、律師律所、公證服務、人民調解、司法鑒定等板塊,可進行全方位公共法律服務導引,并涵蓋了婚姻家庭、勞動爭議、交通安全、消費維權等百姓生活中常見的法律問題,可進行智能咨詢。
第二,提供海量的數據查詢服務。云端儲存數據強大,包含有海量的法律問答,還可根據實際需求增加海量數據。除了國家法律法規、各類案例資源庫以外,內容與百姓日常生活息息相關,諸如婚姻家庭、房屋拆遷、遺產繼承、民間借貸、勞動爭議、交通安全、消費維權、物業糾紛、社會保障、旅游糾紛、特殊人群權益保護等多方面的法律內容,均可通過人機對話咨詢、觀看視頻、觸屏瀏覽等方式獲取。
第三,全面的在線辦理業務。對司法行政各項業務單設模塊,把各項公共法律服務內容、辦理條件、辦事流程、收費標準以及投訴建議等全部錄入,目前有上萬條內容,基本可滿足群眾聘請律師、辦理公證、申請法援、尋求調解、進行司法鑒定等服務,并能夠實現在線辦理。同時,把監獄、戒毒、社區矯正等有關服務方面的內容納入其中,可實現遠程視頻、在線通話、親情會見等。
最后,良好的終端體驗。通過便捷智能的人機對話,將各個智能終端與用戶連接起來,使得服務更加人性化。同時,機器人產品還可以進行多才多藝的有趣互動,諸如人臉識別、激光雷達感應、視頻直播、路徑導引、二代身份證掃碼、指紋識別以及熱源避障功能,還有娛樂功能,諸如唱歌、跳舞、表演武術等。
4.3.3 打造明星產品
公司榮獲上海世界人工智能大會“全國優秀服務機器人企業獎”,其中明星產品小律機器人已在青海、北京、浙江、陜西等近十個省廣泛應用。那么,我們的法律機器人具備了哪些功能呢?感官上,有聽的能力即語音識別技術,有說的能力即語音合成技術,有觀察的能力即圖像識別技術,圖像識別技術落實到更具體的為人臉識別和運動識別等技術,有感覺的能力即情緒識別技術。行動上,通過本體運動控制系統, 22個自由度的運動關節,可自由實現抬頭、轉頭、抬舉、曲臂、握手、行走、倒退、轉彎等仿人模擬動作,讓人機交互智能并擬人。大腦上,通過自然語言處理和基于深度學習的語義理解技術,配合基于大數據的分布式計算和檢索技術、處理大量并發消息的并行計算技術和消息隊列技術、感知融智的物聯網技術等新興技術,構建法律服務領域的知識圖譜(即法律領域的基礎知識本體模型),為法律工作者和老百姓提供智能化的法律服務。
4.3.4 更多智能終端
針對不同的放置場所,我們研發了不同的智能終端產品。主要分為以下幾類:
在線法律服務機器人,支持多終端接入法律服務,通過手機應用、微信、電腦等方式操作,加載公共法律服務系統提供人機對話、自助查詢,遠程對話、法律咨詢等服務。
公共法律服務亭,實現司法行政業務指引與智能問答指引,有效輔助群眾在線咨詢與在線辦理業務,使公共法律服務更智慧,更輕松、更快捷。觸摸一體機,為群眾提供包括法制宣傳、法律援助、律師律所等服務及智能法律解決方案、案例文書查詢、遠程咨詢等自助法律服務功能。
自助柜員機,全方位提供法制宣傳、法律援助、自助辦理,還可以進行法律法規及案例文書查詢、在線遠程咨詢,安放在公共法律服務中心或室內公共場所,打造“老百姓身邊的無人法律服務所”。
青少年學法機器人,結合校園及學生的特點,我們專門對功能內容進行了調整和補充,能夠滿足孩子在健康成長過程中對各種知識的需求,提高孩子的綜合素質,讓孩子終身受用。
5、結語
人工智能時代已經來臨,技術的發展帶動法律出版的行業前行,同時法律出版的業務需求也促進科技的不斷進步。法律服務作為與人們日常生活息息相關的領域,越發被政府、企業以及個人所關注。法律出版作為人們知識獲取的重要信息來源,在這種形式下一定要結合自身行業優勢,充分擁抱大數據、人工智能技術,以數據聚合信息、信息凝練知識、知識提供服務,將內在的價值進行深度挖掘,滿足新場景下的需求,打造法律出版新的活力和增長點。