今天分享這個(gè)話(huà)題很有意義,昨天科大訊飛獲批認(rèn)知智能?chē)?guó)家重點(diǎn)實(shí)驗(yàn)室,所以我想今天希望通過(guò)這個(gè)話(huà)題的分享我們可以更多建立和司法界的聯(lián)系。
實(shí)際上人工智能現(xiàn)在很受到整個(gè)社會(huì)各界的關(guān)注,講一下人工智能實(shí)際上經(jīng)過(guò)了三波浪潮,第一波、第二波起來(lái)之后很快下去了,為什么這一波人工智能的浪潮長(zhǎng)盛不衰?主要有兩個(gè)原因,一個(gè)是云計(jì)算、大數(shù)據(jù),還有一個(gè)重要的原因,這一波人工智能已經(jīng)在實(shí)際的應(yīng)用中發(fā)揮重要的價(jià)值了。大家可能在看兩邊的大屏幕,實(shí)際上這兩邊大屏幕上是人工智能在后臺(tái)錄入所做的事情,所以現(xiàn)在整個(gè)第三波人工智能的特點(diǎn),一個(gè)是技術(shù)快速突破,第二個(gè)是整個(gè)在應(yīng)用界開(kāi)始產(chǎn)生作用。應(yīng)用界產(chǎn)生作用又帶來(lái)更大數(shù)據(jù)推動(dòng)技術(shù)更快的進(jìn)步,所以我們講第三波人工智能技術(shù)和應(yīng)用雙輪驅(qū)動(dòng),推動(dòng)整個(gè)人工智能非常快速的進(jìn)步。
人工智能最近的過(guò)程中有很多社會(huì)學(xué)家,當(dāng)然大家很多人了解人工智能是因?yàn)楣雀璧膰鍣C(jī)器人,基本上谷歌的圍棋機(jī)器人通過(guò)大量的學(xué)習(xí)現(xiàn)在到了人不可挑戰(zhàn)的層次。另外一個(gè)層面現(xiàn)在整個(gè)人工智能也不僅僅是用在博弈的游戲上,現(xiàn)在在很多工作中,比如BBC和劍橋大學(xué)當(dāng)時(shí)做了一個(gè)研究預(yù)測(cè),未來(lái)幾十年中可能我們有趙國(guó)一半的工作會(huì)被人工智能替代,可能不僅僅是工作崗位,還有大量工作中的一些技能可能被人工智能所替代,所以我想每個(gè)人都要關(guān)注人工智能,人工智能下一步是一個(gè)非常重要的工具,它可能重要程度不亞于互聯(lián)網(wǎng)。
講一下人工智能發(fā)展最重要的三個(gè)技術(shù),云計(jì)算是要有大規(guī)模的計(jì)算資源,當(dāng)時(shí)谷歌為了訓(xùn)練他Alpha Go的圍棋機(jī)器人,可能動(dòng)用了成千上萬(wàn)的CPU。所以對(duì)于整個(gè)司法領(lǐng)域如何快速截取司法要的大數(shù)據(jù)是非常重要的。
第三個(gè)方面是人工智能行業(yè)做的,我們要比機(jī)器賦予更好的算法,新一代神經(jīng)網(wǎng)絡(luò)算法的賦予,使得我們機(jī)器學(xué)習(xí)取得了非常快速的進(jìn)步,所以一個(gè)單向的任務(wù),比如司法領(lǐng)域我們要關(guān)注到底怎么定義一個(gè)任務(wù),司法領(lǐng)域是人工智能以后特別可以發(fā)揮作用的,因?yàn)槿斯ぶ悄苁且?guī)則清楚、邊界清楚,司法領(lǐng)域規(guī)則是比較清楚的。講一下人工智能里面的幾個(gè)關(guān)鍵的技術(shù),這一點(diǎn)上中國(guó)的相關(guān)技術(shù)一直現(xiàn)在也是處于國(guó)際上的絕對(duì)第一陣營(yíng),我們科大訊飛的語(yǔ)音識(shí)別技術(shù)在去年參加谷歌三大語(yǔ)音識(shí)別最關(guān)鍵的比賽,我們叫多通道的比賽上三個(gè)關(guān)鍵指標(biāo)是全球最好的,所以現(xiàn)在語(yǔ)音識(shí)別在大家的日常工作中已經(jīng)能夠發(fā)揮非常重要的作用了。我今天來(lái)展示是因?yàn)樵诮衲昊ヂ?lián)網(wǎng)大會(huì)上,互聯(lián)網(wǎng)大會(huì)當(dāng)時(shí)的麥克風(fēng)接入問(wèn)題效果不是很好,一定要給大家展示一下,大家可以看到雖然我?guī)Я吮容^重的口音,但是語(yǔ)音識(shí)別一點(diǎn)問(wèn)題沒(méi)有。
第二個(gè)我們看一下圖象識(shí)別,現(xiàn)在人工智能中的圖象識(shí)別最近也取得重要的突破,這個(gè)比賽是國(guó)際上一個(gè)叫做肺部影像機(jī)器自動(dòng)識(shí)別,現(xiàn)在機(jī)器自動(dòng)識(shí)別可以做到94.1%,也就是說(shuō)機(jī)器對(duì)于整個(gè)CT等等,相關(guān)的影像自動(dòng)識(shí)別已經(jīng)可以大家三甲醫(yī)院放射醫(yī)生的水平。所以以后基層醫(yī)院的醫(yī)生進(jìn)行影像診斷可以人機(jī)器助手一起協(xié)同進(jìn)行,如果把握不準(zhǔn)最后再提供給專(zhuān)家,所以看到人工智能在圖象識(shí)別上也取得非常大的技術(shù)。
語(yǔ)音合成上很多人了解科大訊飛是通過(guò)語(yǔ)音合成,語(yǔ)音合成這幾年已經(jīng)取得了非常大的進(jìn)步,科大訊飛在過(guò)去12年中,無(wú)論國(guó)際上是中文、英文還是其他語(yǔ)言,科大訊飛是全球最大的。給大家看一個(gè)比較有意思的演示,先看一段視頻(視頻)實(shí)際上這個(gè)是機(jī)器學(xué)習(xí),用我們的機(jī)器插播學(xué)習(xí)特朗普半個(gè)消息的語(yǔ)音,我們可以用他的聲音模型產(chǎn)生任何話(huà),任何中文、英文把文字輸進(jìn)去,特朗普就可以說(shuō)話(huà)。所以這個(gè)是大家可以看到現(xiàn)在機(jī)器學(xué)習(xí)非常強(qiáng)大。
當(dāng)我們今天在中間說(shuō)到很多下一步涉及到司法領(lǐng)域的應(yīng)用,國(guó)際上現(xiàn)在在認(rèn)知智能上,剛才我說(shuō)的是機(jī)器的看和聽(tīng),還有是機(jī)器到底聽(tīng)到是什么,這個(gè)不僅僅是感知智能也需要認(rèn)知智能。斯坦福在今年做了一個(gè)關(guān)于閱讀理解的認(rèn)知智能大賽,做法是讓機(jī)器自動(dòng)讀一篇文章,讀這個(gè)文章的時(shí)候是專(zhuān)家對(duì)這個(gè)文章設(shè)置一些問(wèn)題,這些問(wèn)題答案是由專(zhuān)家之前預(yù)設(shè)的,看機(jī)器讀了文章以后能不能自動(dòng)回答這些問(wèn)題。現(xiàn)在機(jī)器回答問(wèn)題的準(zhǔn)確程度已經(jīng)達(dá)到81%,所以科大訊飛非常高興,我們?cè)谝幌盗兄匾膰?guó)際技術(shù)評(píng)測(cè)中,在斯坦福這個(gè)比賽中科大訊飛是全球最大的。剛才很多人提到圖靈測(cè)試,就是后臺(tái)當(dāng)?shù)刈隽艘粋(gè)機(jī)器還是人,如果分不清楚的話(huà)機(jī)器就是通過(guò)圖靈測(cè)試。但是互聯(lián)網(wǎng)的體系有時(shí)候通過(guò)搜索是可以通過(guò)圖靈測(cè)試,所以現(xiàn)在國(guó)際上有一個(gè)是圖靈測(cè)試的升級(jí)版的比賽,要做認(rèn)知和推理,這個(gè)比賽叫做(英文),比如爸爸抱起他的兒子,誰(shuí)重?那肯定是兒子,所以機(jī)器要理解本體的意思并且可以做出相關(guān)推理。也非常高興去年全球認(rèn)知推理大賽科大訊飛是最好的,雖然是最好的但是只達(dá)到60%,而且認(rèn)知推理是題目不是很難的。
可以提一個(gè)認(rèn)知推理在實(shí)際應(yīng)用中現(xiàn)在可以產(chǎn)生的價(jià)值,我們?cè)诮衲陣?guó)家醫(yī)生資格證書(shū)考試中,這個(gè)考試像有些考試一樣非常難,醫(yī)學(xué)院學(xué)生畢業(yè)兩到三年參加這個(gè)考試,600分總分,360分可以過(guò)關(guān),這是完全的新題目,科大訊飛今年國(guó)際衛(wèi)計(jì)委組織了一個(gè)非常嚴(yán)謹(jǐn)?shù)目荚嚕?qǐng)了公證處公正,機(jī)器人參加考試獲得超過(guò)分?jǐn)?shù)線100分的成績(jī),所以認(rèn)知智能在一些領(lǐng)域里面因?yàn)獒t(yī)學(xué)領(lǐng)域是很復(fù)雜的,在醫(yī)學(xué)領(lǐng)域我們?nèi)〉靡恍┲匾倪M(jìn)步。
國(guó)家在新一代人工智能發(fā)展規(guī)劃中明確提出要加強(qiáng)人工智能和各個(gè)行業(yè)的結(jié)合,其實(shí)中間有一個(gè)比較重要的要加強(qiáng)和司法的資源。因?yàn)橹袊?guó)的司法資源非常的稀缺,而且對(duì)每一個(gè)老百姓非常重要,所以下一步怎么通過(guò)人工智能應(yīng)用能力提升我們司法資源的效率和效果。科大訊飛為了推動(dòng)進(jìn)一步解體數(shù)據(jù),四年前我們就開(kāi)放了科大訊飛的人工智能平臺(tái),所以今天大家在外面看到演示的時(shí)候其實(shí)有很多,是我們科大訊飛的技術(shù)在支撐。這個(gè)平臺(tái)每天支撐的量是40億人次,每天各種語(yǔ)言的合成識(shí)別自然語(yǔ)言圖象非常大,現(xiàn)在累計(jì)在我這個(gè)平臺(tái)上開(kāi)發(fā)的開(kāi)發(fā)者數(shù)目已經(jīng)有48萬(wàn)家,所以有非常大的開(kāi)發(fā)者的提升。
這幾年人工智能在很多行業(yè)、教育、醫(yī)療、安全、政務(wù)很多行業(yè),比如像無(wú)錫最好的中學(xué)天一中學(xué)用科大訊飛人工智能技術(shù)做個(gè)性化的學(xué)習(xí),所以很多方面都開(kāi)始通過(guò)人工智能提高效率提高個(gè)性化。
下面我再介紹一下人工智能現(xiàn)在在司法領(lǐng)域,今天結(jié)束之后我想跟劉總這邊,現(xiàn)在公檢法司,我們和司法下一步的結(jié)合還是偏少一點(diǎn)。
我介紹一下,第一個(gè)是全球現(xiàn)在對(duì)整個(gè)人工智能在司法領(lǐng)域應(yīng)用的非常廣泛比如非洲的人權(quán)法院,協(xié)同倫敦大學(xué)這個(gè)賓夕法尼亞他們一起進(jìn)行相關(guān)研究,最后通過(guò)機(jī)器計(jì)策審判結(jié)果,預(yù)測(cè)準(zhǔn)確度差不多到80%,所以通過(guò)這個(gè)數(shù)據(jù)可以看到這584個(gè)卷宗的案例是比較復(fù)雜的,它更多的是希望機(jī)器是站在事實(shí)的角度而不是站在形式主義的角度,所以它的難度比較大。可以看到80%可以告訴我們兩件事情,第一個(gè)以后在司法環(huán)節(jié)中可以對(duì)我們法律和司法人士起到很好的作用。第二機(jī)器不可能替代法官。
第二剛才孫教授談到最近非常熱的叫Ross是IBM基于沃森做的司法機(jī)器人。我們科大訊飛是第一個(gè)全球通過(guò)醫(yī)生資格證書(shū)考試的機(jī)器人,所以下一步我們認(rèn)知機(jī)器人法律里面可以做更多的事。科大訊飛目前和最高院、最高檢、公安部成立了聯(lián)合實(shí)驗(yàn)室,由此以來(lái)唯一在體系外的實(shí)驗(yàn)室在科大訊飛。在法律中的應(yīng)用幾個(gè)重要的場(chǎng)景,第一個(gè)現(xiàn)在在整個(gè)法庭審判,現(xiàn)在法庭審判中已經(jīng)大規(guī)模的包含最高院的自主庭使用科大訊飛的前審記錄中,現(xiàn)在達(dá)到能達(dá)到95 %以上的準(zhǔn)確度,讓庭審效率提高30 %,因?yàn)樵瓉?lái)書(shū)記員經(jīng)常跟不上整個(gè)庭審記錄的,現(xiàn)在有了這個(gè)機(jī)器人的幫忙以后,比如最高院現(xiàn)在推蘇州模式,當(dāng)時(shí)蘇州是我們和蘇州法院一起做的,差不多原來(lái)一下午審三到四個(gè)案子,現(xiàn)在有了這個(gè)可以多審一到兩個(gè)案子。第二個(gè)像檢察院等等相關(guān)的筆錄過(guò)程,現(xiàn)在檢察官和相關(guān)尋訪人進(jìn)行談話(huà),談話(huà)結(jié)束基本上一份筆錄大概形成,所以這個(gè)場(chǎng)景現(xiàn)在應(yīng)用的非常好。我們?cè)跁?huì)議系統(tǒng)里面,今天我展示這個(gè)會(huì)議系統(tǒng)是中央財(cái)政部里面的,中辦、國(guó)辦都用這個(gè)系統(tǒng),這個(gè)系統(tǒng)是一個(gè)保密性的,并不需要通過(guò)互聯(lián)網(wǎng)大規(guī)模的機(jī)器,這個(gè)我們?cè)谥虚g做了大量的工作,所以任何因?yàn)樗痉üぷ髦薪?jīng)常需要保密,這個(gè)非常好的能夠滿(mǎn)足保密性的需求。
第三個(gè)大家之前還介紹了一些像12348,我們現(xiàn)在整個(gè)電話(huà)服務(wù)在非常多的行業(yè),比如像國(guó)稅總局,它通過(guò)電話(huà)分析中,每天電話(huà)錄音在哪,用機(jī)器把它完全掃描一遍,自動(dòng)通過(guò)整個(gè)的內(nèi)容分析看一下今天有哪些熱點(diǎn)事件,每天可以形成一個(gè)報(bào)表給領(lǐng)導(dǎo)。所以每天成千上萬(wàn)的電話(huà)機(jī)器在后臺(tái)不需要人聽(tīng),一遍掃描以后每天可以有一份分析報(bào)告。另外全場(chǎng)景的語(yǔ)音交互,下來(lái)法庭的法官只要一說(shuō)馬上案件就自動(dòng)跳出來(lái),現(xiàn)在叫自動(dòng)找證據(jù)所以非常迅速,使整個(gè)法庭效率非常流暢。電子卷宗原來(lái)大家很痛苦的講公檢法里面有一個(gè)電子卷宗大家都在做花了很多時(shí)間,但是怎么用?電子卷宗不能得到很好的應(yīng)用,現(xiàn)在看到有人工智能應(yīng)用以后,電子卷宗除了滿(mǎn)足必要信息的自動(dòng)填寫(xiě),到最后幫助法官生成初步的法官文書(shū),首先在使用上可以解決問(wèn)題,可以使得我們整個(gè)公檢法體系辦案方便。第二個(gè)在整個(gè)卷宗上來(lái)說(shuō),也大幅度的通過(guò)相關(guān)的技術(shù)提高了它的使用速度,比如現(xiàn)在機(jī)器是自動(dòng)掃描生成計(jì)算機(jī)可以分析的文字,通過(guò)整個(gè)后臺(tái)平臺(tái)大家統(tǒng)一這個(gè)平臺(tái)都可以使用,所以目前剛才孫教授也說(shuō)了,去年孟書(shū)記在全國(guó)司法工作上說(shuō)到上海,上海高院有一個(gè)專(zhuān)項(xiàng),現(xiàn)在怎么把公檢法里面的一些證據(jù)體系,通過(guò)人工智能和IT的手段規(guī)劃起來(lái),因?yàn)橥耆ㄟ^(guò)軟件的東西大家不同的人仍然有不同的理解,做證據(jù)鏈的統(tǒng)一很困難,所以經(jīng)常認(rèn)為檢察院認(rèn)為可以把案件轉(zhuǎn)到法院,法院認(rèn)為不行又打回,這個(gè)使司法資源極大浪費(fèi)。現(xiàn)在通過(guò)一些IT和人工智能把這些證據(jù)鏈一定意義上,也不能說(shuō)做的非常完美,但是一定意義上做成相關(guān)的統(tǒng)一以后,使公檢法整個(gè)體系能夠更好協(xié)同工作。
所有實(shí)際上在各個(gè)重要的場(chǎng)景中,法庭審判的場(chǎng)景,檢察院詢(xún)問(wèn)的場(chǎng)景,包括以后司法中間還有其他的重要場(chǎng)景,這些場(chǎng)景化的數(shù)據(jù)都可以積累在統(tǒng)一的司法大數(shù)據(jù)平臺(tái)里面。剛才講司法的大數(shù)據(jù)從哪來(lái)?第一個(gè)從人的知識(shí)工程化里面來(lái),第二個(gè)更重要是主要場(chǎng)景里面的行為數(shù)據(jù)里面來(lái),所以現(xiàn)在越來(lái)越多的司法環(huán)節(jié)里面的一些關(guān)鍵數(shù)據(jù)都已經(jīng)開(kāi)始呈現(xiàn)結(jié)構(gòu)化,因?yàn)樵瓉?lái)大量視頻、音頻的數(shù)據(jù)雖然,但是處理很難,現(xiàn)在可以通過(guò)計(jì)算機(jī)把它變成計(jì)算機(jī)處理的結(jié)構(gòu)數(shù)據(jù),這樣后面調(diào)用的時(shí)候非常方便,所以整個(gè)大數(shù)據(jù)下一步還會(huì)推動(dòng)司法人工智能的進(jìn)步。所以今天時(shí)間有限利用這個(gè)時(shí)間給大家匯報(bào)科大訊飛和在司法方面上的工作,謝謝大家! (本文是在首屆中國(guó)國(guó)無(wú)錫智慧法務(wù)發(fā)展大會(huì)上的發(fā)言)