面對(duì)新技術(shù),法律專(zhuān)業(yè)人士通常是最保守的人群之一,但大數(shù)據(jù)時(shí)代,律師和律師事務(wù)所要想脫穎而出,卓爾不群,盡快采用大數(shù)據(jù)技術(shù)是不二之選。
2008年金融危機(jī)以來(lái),律師行業(yè)經(jīng)歷了長(zhǎng)期的低潮,越來(lái)越多的企業(yè)客戶(hù)無(wú)法負(fù)擔(dān)高昂的律師費(fèi)用,導(dǎo)致律所裁員不斷,規(guī)模日漸萎縮。而那些行業(yè)領(lǐng)先的律所開(kāi)始推崇“精益企業(yè)”,收費(fèi)模式也從過(guò)去的固定費(fèi)率調(diào)整為按需服務(wù)。
但是“精益律所”并非根本的解決方案,律師事務(wù)所還必須借助大數(shù)據(jù)大幅降低信息處理成本,提高數(shù)字競(jìng)爭(zhēng)力。近日GigaOM專(zhuān)欄作者Derrick Harris撰文指出,律師事務(wù)所基于大數(shù)據(jù)進(jìn)行流程優(yōu)化時(shí),需要重點(diǎn)考慮三個(gè)問(wèn)題。
一、自動(dòng)化造就“火眼金睛”
文檔檢索可能是大數(shù)據(jù)對(duì)法律工作影響最大的領(lǐng)域。律所通常存儲(chǔ)海量的非結(jié)構(gòu)化電子文檔,包括電子郵件、Office文檔、PDF文檔等等,從數(shù)以TB計(jì)的數(shù)據(jù)中檢索案件相關(guān)文檔簡(jiǎn)直就是律師的噩夢(mèng),費(fèi)時(shí)、費(fèi)力而且準(zhǔn)確性差。通過(guò)大數(shù)據(jù)智能分析軟件,律所能夠大大提高文檔檢索效率。例如大數(shù)據(jù)創(chuàng)業(yè)公司Recommind開(kāi)發(fā)的大數(shù)據(jù)軟件能通過(guò)機(jī)器學(xué)習(xí)算法進(jìn)行“預(yù)測(cè)編碼”,大大提高法律文檔的檢索效率。另外一家值得關(guān)注的企業(yè)--Pure Discovery的語(yǔ)義分析技術(shù)也能大幅提高文檔檢索效率。
值得注意的是Recommind還在不斷開(kāi)發(fā)新的產(chǎn)品Hypergraph(超級(jí)圖譜),例如幫助律師發(fā)現(xiàn)人、話(huà)題、時(shí)間線(xiàn)、非結(jié)構(gòu)化數(shù)據(jù)之間關(guān)聯(lián)關(guān)系的功能(編者按:類(lèi)似圖譜分析)。在這個(gè)領(lǐng)域Recommind面對(duì)的競(jìng)爭(zhēng)對(duì)手包括Zylab、EMC和IBM。
二、一切皆可數(shù)字化
案件訴訟中會(huì)產(chǎn)生大量文檔,而這些文檔“蘊(yùn)藏”的數(shù)據(jù)對(duì)后來(lái)的案件辯護(hù)和審理則具有很高的參考價(jià)值。
大數(shù)據(jù)創(chuàng)業(yè)公司Lex Machina 的目標(biāo)客戶(hù)是知識(shí)產(chǎn)權(quán)律師 ,為他們提供決策支撐數(shù)據(jù)統(tǒng)計(jì)服務(wù)。 Lex machina將很多過(guò)去的較為模糊的定性數(shù)據(jù)都給量化了,例如“這位法官對(duì)被告很不利”、“這種索賠的案件通常都能贏”或“這位律師對(duì)此類(lèi)技術(shù)的經(jīng)驗(yàn)值最高”等。Lex Machina的數(shù)據(jù)分析的數(shù)據(jù)源主要來(lái)自公開(kāi)的PACER(聯(lián)邦法庭數(shù)據(jù)庫(kù)),PACER的數(shù)據(jù)一直在那,但是Lex Machina是第一家通過(guò)機(jī)器學(xué)習(xí)和自然語(yǔ)言處理等技術(shù)從中“淘寶”的公司。
值得注意的是,Lex Machina的前身是一個(gè)非盈利項(xiàng)目--斯坦福知識(shí)產(chǎn)權(quán)法律結(jié)算中心,公司還招募到了斯坦福大學(xué)的機(jī)器學(xué)習(xí)和自然語(yǔ)言處理專(zhuān)家Andrew Ng和Christopher Manning.IEEE Spectrum上有一篇對(duì)Lex Machina的報(bào)道非常精彩。
三、大數(shù)據(jù)應(yīng)用的自助與創(chuàng)新
與其遙遙無(wú)期地坐等大數(shù)據(jù)廠商開(kāi)發(fā)好用的律師工具,律師們需要自己動(dòng)手,創(chuàng)造性地利用各種現(xiàn)成的大數(shù)據(jù)工具和數(shù)據(jù)源。例如律師可以使用類(lèi)似ScraperWiki這樣的工具分析證人的Twitter聯(lián)系人網(wǎng)絡(luò)和活動(dòng)記錄。
律師還可以使用類(lèi)似etcML這樣的免費(fèi)工具(對(duì)應(yīng)的付費(fèi)服務(wù)如AlchemyAPI)分析各種文本,包括推文和電子郵件,來(lái)發(fā)現(xiàn)關(guān)鍵觀念或進(jìn)行傾向性判斷。零用import.io這樣的工具從網(wǎng)站抽取數(shù)據(jù)(例如房產(chǎn)價(jià)格歷史數(shù)據(jù)),并制作成圖表。
另外,律師還應(yīng)當(dāng)學(xué)習(xí)掌握目前比較流行的一些數(shù)據(jù)可視化工具。