竞彩玩法及中奖规则/足总杯在线直播/欧洲杯2021赛程/内蒙古中优足球俱乐部

 
本站首頁 關(guān)于我們 法律圖書館與法律信息研究會(huì) 法律信息研究 中外法律圖書館 法學(xué)文獻(xiàn)與檢索 政府信息公開 法律圖書館導(dǎo)航 法律法學(xué)網(wǎng)導(dǎo)航
法律信息資源
法律信息服務(wù)
數(shù)字信息檢索
數(shù)字技術(shù)發(fā)展
專業(yè)網(wǎng)站建設(shè)
澳門法律信息
  當(dāng)前位置:首頁 > 法律信息研究 > 數(shù)字信息檢索
數(shù)字信息檢索
暫無下載資料

 基于本體的法律信息語義檢索
            黃都培 點(diǎn)擊量:7675
中國政法大學(xué)
【摘要】
網(wǎng)絡(luò)中海量的法律信息及其多義性為準(zhǔn)確、高效的查詢檢索提出了難題, 進(jìn)而也桎梏著司法判案、決策的方法。為了較好地解決司法信息檢索中存在的問題, 通過對(duì)國內(nèi)外領(lǐng)域本體方法、語義Web 技術(shù)的研究, 借助本體的概念構(gòu)建了面向案例的法律信息語義檢索原型, 為法律領(lǐng)域的知識(shí)管理和信息檢索提供了可借鑒的參考。
【關(guān)鍵字】
法律信息;本體;語義檢索
    

  1 司法實(shí)務(wù)中信息檢索的主要問題

  隨著互聯(lián)網(wǎng)的發(fā)展及各種電子文獻(xiàn)資料的普及, 高效的信息組織管理和檢索成為信息資源利用的關(guān)鍵問題。而目前較成熟的信息檢索工具和搜索引擎大多是基于檢索提問式關(guān)鍵詞匹配技術(shù)。這種檢索導(dǎo)致的兩類主要問題是“信息過載”和“內(nèi)容不匹配”, 前者指在檢索過程中系統(tǒng)返回的信息量過多, 與關(guān)鍵詞相關(guān)或不相關(guān)的內(nèi)容都冒出來, 使用戶應(yīng)接不暇, 難于接受; 后者指因?qū)ν粋(gè)概念的表述出現(xiàn)多義、歧義, 返回的信息并非用戶真實(shí)的查詢意圖和內(nèi)容。就法律領(lǐng)域而言, 大量的法律文獻(xiàn)、法律法規(guī)、案例判例信息主要來自于互聯(lián)網(wǎng)的查詢, 采用檢索關(guān)鍵詞的方法, 信息的查準(zhǔn)率和查全率都得不到保證。司法決策人員在查詢目標(biāo)不很明確的狀況下選擇決策依據(jù)時(shí),注重的是如何從浩如煙海的數(shù)據(jù)中快速地調(diào)出與案件相關(guān)的法律法規(guī)及判例, 而不是遍歷龐大的互聯(lián)網(wǎng)或數(shù)據(jù)庫資源漫無目標(biāo)地去搜尋。

  根據(jù)這樣的狀況, 組織以知識(shí)和案件為核心的信息資源,建立有法律領(lǐng)域?qū)<抑笇?dǎo)參與的、基于本體的語義檢索模型和相應(yīng)的法律信息元數(shù)據(jù)標(biāo)準(zhǔn), 按照案件關(guān)聯(lián)、以義索文、主題提煉、綜合分析的思路來設(shè)計(jì)法律信息語義檢索方式就顯得十分迫切和必要。
  
  2 基于本體的法律知識(shí)表述

  2.1 本體的知識(shí)組織體系

  2.1.1 本體的基本概念

  所謂知識(shí)組織體系( Knowledge Organization Systems) , 是對(duì)知識(shí)的內(nèi)容概念及其相互關(guān)系進(jìn)行描述和組織的機(jī)制, 能夠?qū)Ω鞣N信息對(duì)象按照知識(shí)內(nèi)容和知識(shí)結(jié)構(gòu)進(jìn)行管理和組織。

  目前本體( Ontology) 技術(shù)被廣泛運(yùn)用于知識(shí)管理過程中。B.Chandrasekaran 等人認(rèn)為:“Ontology 是研究特定領(lǐng)域知識(shí)的對(duì)象分類、對(duì)象屬性和對(duì)象間的關(guān)系, 它為領(lǐng)域知識(shí)的描述提供術(shù)語”; Thomas R.Gruber 認(rèn)為:“本體是共享概念化的明確的規(guī)范說明”, 綜合相關(guān)學(xué)科的研究結(jié)果, 人們普遍認(rèn)為: 本體是關(guān)于領(lǐng)域的顯式的、形式化的共享概念規(guī)范。本體首先是按照一定的組織形式聚合起來的概念集, 這些概念集常常潛在地包括大量不同的層次和含義, 往往具有某些類型特征和本質(zhì)性的關(guān)聯(lián); 其二, 本體是對(duì)這些概念的涵義、屬性、層次、關(guān)系等的明確說明和規(guī)范。

  2.1.2 本體的知識(shí)結(jié)構(gòu)

  在本體中, 知識(shí)劃分為三個(gè)層次, 即具體事實(shí)知識(shí)、領(lǐng)域概念知識(shí)和通用概念知識(shí)。

  通用概念知識(shí)是一種公理化的大家認(rèn)同的知識(shí), 無需做特別說明, 也不會(huì)有二義性的理解, 用通用本體來刻畫。領(lǐng)域本體是專業(yè)性的知識(shí)體系, 匯集了與專業(yè)領(lǐng)域相關(guān)的所有概念及其之間的關(guān)系, 以及該領(lǐng)域所涉及的具體事實(shí)。領(lǐng)域本體內(nèi)的具體事實(shí)知識(shí)是用來描述、解釋或求解領(lǐng)域內(nèi)具體事物、具體事件或具體問題的知識(shí), 它用領(lǐng)域概念知識(shí)來表達(dá)具體事物、具體事件。

  構(gòu)建領(lǐng)域本體可以按領(lǐng)域需求分類搭建該領(lǐng)域本體的知識(shí)層次結(jié)構(gòu)、共享專業(yè)領(lǐng)域知識(shí), 同時(shí)還能夠避免在知識(shí)抽取和共享時(shí)所產(chǎn)生的概念語義歧異。例如:“訴”是一個(gè)通用領(lǐng)域中的詞匯, 可以理解為“ 告訴”、“ 訴說”、“ 傾訴”? ? , 而“ 訴訟”一般只適用于法律領(lǐng)域,“刑事訴訟”則適用于更狹窄的“刑法”范疇。

  根據(jù)對(duì)概念關(guān)系的揭示程度, 可以將本體中的知識(shí)組織體系分為三個(gè)層次:

  ( 1) 詞匯表( Term Lists) , 強(qiáng)調(diào)概念的定義, 一般不涉及復(fù)雜語義關(guān)系和分類結(jié)構(gòu), 例如: 詞匯表、字典、人名表等。

  ( 2) 分類聚類體系( classification/categorization) , 強(qiáng)調(diào)概念間的層次聚合和類別體系, 例如: 主題詞表和分類表。

  ( 3) 關(guān)系列表( Relationship Lists) , 強(qiáng)調(diào)表現(xiàn)概念之間關(guān)系, 例如: 敘詞表、語義網(wǎng)絡(luò)和概念集。

  2.1.3 主題關(guān)系詞表及其語義環(huán)境

  按照上述知識(shí)組織體系的劃分, 主題關(guān)系詞表在領(lǐng)域本體中扮演著極其重要的角色, 它將本體中的知識(shí)進(jìn)一步概念化、具體化、形式化、顯明化, 使用專業(yè)術(shù)語或詞匯的集合表達(dá)概念及其各種聚類、所屬關(guān)系; 作為一種將網(wǎng)絡(luò)資源和信息用戶的自然語言轉(zhuǎn)換為規(guī)范化語言的工具, 主題關(guān)系詞表搭建了本體與語義檢索之間的橋梁, 對(duì)信息的有序組織與機(jī)化管理提供了有力的支撐, 在文獻(xiàn)標(biāo)引和信息檢索等方面具有廣泛的應(yīng)用。主題關(guān)系詞表也通稱主題詞表, 是一種主題檢索系統(tǒng)所用的檢索詞的有序化詞匯表, 設(shè)有參照系統(tǒng)和各種索引, 以顯示詞間語義關(guān)系和提供各種查詞途徑。主題詞是能夠表達(dá)自然語言之間語義關(guān)系的、有標(biāo)引和檢索意義的詞或詞組。

  主題詞表具有知識(shí)的結(jié)構(gòu), 是一種簡(jiǎn)單的本體, 本文后面將介紹以此實(shí)現(xiàn)的一個(gè)簡(jiǎn)單的基于主題詞表的法律領(lǐng)域本體信息檢索系統(tǒng)原型。

  2.2 法律信息本體的構(gòu)架

  按照前述領(lǐng)域本體中知識(shí)內(nèi)容的層次關(guān)系, 可以對(duì)法律信息大致進(jìn)行不同知識(shí)層次的劃分:

  第一層, 法律信息公共資源的一般性、概括性的描述。通常適用于描述供歸檔的法律公文( 法律公文、法律法規(guī)等) 信息,由一組抽象出來的專業(yè)術(shù)語表征, 基本上可以羅列出如下若干項(xiàng): 發(fā)文編號(hào)、發(fā)文機(jī)構(gòu)、文件名稱、主題、摘要、發(fā)布日期、發(fā)布范圍、使用語言、事件、關(guān)聯(lián)、密級(jí)、有效性等( 可用“ 元數(shù)據(jù)”描述) 。

  第二層, 從法律信息的應(yīng)用角度( 性質(zhì)或適用領(lǐng)域等) , 對(duì)法律信息的知識(shí)單元進(jìn)行組織和描述, 如, 把它們分為刑事類、民事類、行政類、海事類, 或者分為起訴類、判決類、合同類、公告類, 還可以把它們分為法律、法規(guī)與判例、案例, 形成針對(duì)不同問題域和檢索目標(biāo)的知識(shí)維。

  第三層, 依據(jù)具體信息內(nèi)容進(jìn)行概念的抽象和描述, 通常可以針對(duì)法律公文的主題、內(nèi)容摘要以及描述具體案件、事實(shí)的信息( 往往用若干個(gè)關(guān)鍵詞來描述) , 如: 罪名、事由或案情簡(jiǎn)介, 并定義其下屬概念、內(nèi)容和相關(guān)的屬性及關(guān)系, 如, 案情摘要中的主要關(guān)鍵詞, 原告、被告、被害人及其姓名、性別、年齡、身份、特征等。通常第三層信息較零散、模糊、不規(guī)范, 屬半結(jié)構(gòu)化或非結(jié)構(gòu)化信息, 涉及的實(shí)例多, 難以描述, 如: 案情摘要中的犯罪動(dòng)機(jī)、造成的危害及后果等。歸納起來, 面向案件事實(shí)的法律公文包含的知識(shí)主要有:( 1) 法律文獻(xiàn)信息;( 2) 機(jī)構(gòu)或個(gè)人信息;( 3) 事件信息;( 4) 犯罪信息等。

  進(jìn)一步將這些抽象出來的概念整理, 找出它們之間的邏輯關(guān)系。以司法文書中的起訴書為例, 從第一層所描述的司法文書的名稱、主題、摘要中可以抽出下層有關(guān)罪行、犯罪性質(zhì)和犯罪事實(shí)信息, 再進(jìn)一步尋根索驥, 調(diào)出犯罪人、犯罪動(dòng)機(jī)、作案經(jīng)過、犯罪后果以及判決結(jié)果等詳細(xì)說明信息, 這些又直接與罪行相適應(yīng)的法律條文和判例相關(guān)聯(lián)。由此, 就形成了一個(gè)依據(jù)描述法律事實(shí)的司法文書而搭建的本體( 語義網(wǎng)絡(luò)) 。

  如圖1所示。

  3 建構(gòu)于本體之上的法律信息語義檢索

  3.1 依據(jù)法律本體的語義檢索

  所謂信息檢索( Information Retrieval) , 是指從大量的信息資源中方便、快捷、有效地查找出與使用者需求相關(guān)的內(nèi)容。目前的信息檢索技術(shù)大致分為三類: 全文檢索( Text Retrieval) 、數(shù)據(jù)檢索( Data Retrieval) 和知識(shí)檢索( Knowledge Retrieval) 。全文檢索和數(shù)據(jù)檢索從本質(zhì)上說都屬于關(guān)鍵字匹配的檢索技術(shù), 這種基于關(guān)鍵字匹配或是基于學(xué)科分類的檢索工具之所以不能令人滿意, 最主要的原因之一就是它們無法挖掘概念之間的內(nèi)在聯(lián)系, 搜索出更深層的含義, 在查全率和查準(zhǔn)率方面都有一定的局限性, 因此, 采用基于本體語義匹配技術(shù)的知識(shí)檢索, 因其檢索效果更好而成為了當(dāng)前信息檢索領(lǐng)域的研究重點(diǎn)。

  本體在信息檢索中的功能主要表現(xiàn)在:

  ( 1) 消除自然語言理解中的歧義, 明確概念所屬范疇和涵義, 提高信息檢索的查準(zhǔn)率。通常, 信息檢索流程的第一步就是通過人- 機(jī)界面接口輸入用戶檢索請(qǐng)求( 查詢關(guān)鍵詞) , 由于自然語言具有豐富多彩的表達(dá)形式, 有大量的同義詞、近義詞、多義詞存在, 計(jì)算機(jī)要自動(dòng)識(shí)別檢索詞的準(zhǔn)確含義, 就需要借助__本體中概念和概念約束的明確規(guī)范說明, 幫助系統(tǒng)在多個(gè)可能的詞義中選擇最適合的含義, 給予該信息的準(zhǔn)確的定位。例如:“主體”一詞通常表示事物的主要部分, 一般用于描述事或物,而把它放入民法的范疇中, 用來描述民事法律關(guān)系———“民事主體”, 則指享有民事權(quán)利和承擔(dān)民事義務(wù)的法人或自然人。

  ( 2) 在語義標(biāo)引的基礎(chǔ)上, 借助本體進(jìn)行語義推理, 利用文獻(xiàn)的語義標(biāo)注和概念集的語義關(guān)系及推理規(guī)則, 從而挖掘出相關(guān)或隱含信息, 實(shí)現(xiàn)智能檢索和知識(shí)組織, 提高檢索結(jié)果的可用性。比如, 在表述案情的司法文書中, 通過司法文書的元數(shù)據(jù)( 標(biāo)題、主題詞、類型、摘要等信息) , 可以挖掘出該司法文書所指控的案件罪名、適應(yīng)的法律范疇及其它屬性, 并建立相關(guān)的法律、法規(guī)和判例的鏈接。再如: 假設(shè)用戶想了解法律領(lǐng)域里有關(guān)合同的信息, 在系統(tǒng)中輸入關(guān)鍵詞“合同”, 該系統(tǒng)輸出來的不僅是對(duì)“合同”的概念解釋以及它的同義詞、上、下位詞, 還應(yīng)該輸出合同的特點(diǎn)、格式、分類、范本、用例等本體中的相關(guān)信息, 并舍棄與之無關(guān)的東西。

  3.2 法律信息主題詞表的設(shè)計(jì)

  如前所述, 法律本體是根據(jù)法律專家長(zhǎng)期司法實(shí)踐的經(jīng)驗(yàn)和法律專業(yè)知識(shí)匯總形成的。由于目前在法律界關(guān)于基于本體的法律信息語義檢索方面的研究還屬于空白, 尚未編制出一套用于語義檢索的、可共享的法律本體標(biāo)準(zhǔn)。為了實(shí)現(xiàn)本文所提出的基于法律本體的語義檢索意圖, 我們依據(jù)“最高人民法院關(guān)于印發(fā)《人民法院公文處理辦法》的通知”( 1996 年4 月9日, 法發(fā)〔1996〕9 號(hào)) 附錄中的“人民法院公文主題詞表”, 并參照中國科學(xué)技術(shù)信息研究所編制的“綜合電子政務(wù)主題詞表( 試用本) ”, 設(shè)計(jì)了一套用于本研究檢索原型系統(tǒng)的法律信息主題詞表查詢模板。

  在“人民法院公文主題詞表”中一共設(shè)有379 個(gè)主題詞, 其中刑事審判類138 個(gè), 民事審判類64 個(gè), 經(jīng)濟(jì)審判類34 個(gè), 行政審判類66 個(gè), 海事審判類17 個(gè), 審判程序類60 個(gè)。以民事案件的主題詞為例, 這些主題詞大致可以分為兩類: 一類是在歸檔時(shí)用以區(qū)分法院各審判庭審理的案件, 如“民事審判”、“民事案件”、“民事糾紛”、“民事權(quán)益”等, 按照前述領(lǐng)域本體的劃分, 這些主題詞可歸類為領(lǐng)域概念知識(shí); 另外一類是通過民事審判庭內(nèi)部審理案件的具體事實(shí)來定類的, 如“抵押”、“不當(dāng)?shù)美薄ⅰ胺鲳B(yǎng)”、“遺產(chǎn)”、“繼承”、“遺囑”等, 在領(lǐng)域本體中可歸類為具體事實(shí)知識(shí)。在具體事實(shí)類主題詞中, 如果詞之間的相關(guān)度比較高, 主題詞中還有屬- 分的邏輯關(guān)系, 如主題詞“知識(shí)產(chǎn)權(quán)”是上位概念, 而“著作權(quán)”、“專利權(quán)”、“商標(biāo)專用權(quán)”則是下屬概念;“人身權(quán)”是上位概念,“健康權(quán)”、“姓名權(quán)”、“肖像權(quán)”、“榮譽(yù)權(quán)”、“名譽(yù)權(quán)”等則是下屬概念。由此可見, 司法中的主題詞是建立在對(duì)某類法律事實(shí)性質(zhì)的界定下的。參照“綜合電子政務(wù)主題詞表( 試用本) 的范疇表歸類, 對(duì)“人民法院公文主題詞表”中部分主題詞進(jìn)行了分類編碼, 給出如表1 樣例。

  樣例中, 主題詞表的自左至右體現(xiàn)了主題概念的樹形層次結(jié)構(gòu)。第一列表示主題詞的所屬范疇, 如:“刑事”、“刑事”??。第二列為歸類于左列范疇下的主題詞, 如:“刑事責(zé)任”屬于“刑事”范疇。第三列為與左列主題詞相關(guān)的概念, S-( 屬) 項(xiàng), 表示該詞的上位概念; F-( 分) 項(xiàng), 表示該詞的下位概念; C-( 參) 項(xiàng),表示該詞的參考概念; T-( 同) 項(xiàng), 表示該詞的同義詞。第四列為左列包含的概念, 每一概念下又可繼續(xù)下分具體內(nèi)容( 如:第五列) 。

  例如,“刑事處罰”屬“刑事”范疇, 它的上層類屬( 上位詞)是“處罰”, 它的下層分類( 下位詞) 是“主刑”、“附加刑”、“勞動(dòng)改造”, 它的參考概念是“刑法”, 它的同義詞是“刑罰”; 而在其下層概念中又包含了更下層( 下位) 的概念, 如,“刑事處罰”的“主刑”中可包含“ 管制”、“ 拘役”、“ 無期徒刑”、“ 有期徒刑”、“死刑”,“死刑”中更具體的是“立即執(zhí)行”和“死緩”。

  3.3 法律信息語義檢索系統(tǒng)模型

  依據(jù)法律信息主題詞表, 作者在其上試制了一個(gè)原型系統(tǒng)Law- Retrieval。系統(tǒng)主要由三個(gè)部分組成:( 1) 按照法律信息元數(shù)據(jù)及其標(biāo)識(shí)機(jī)制對(duì)網(wǎng)頁上法律公文( 包括反映法律事實(shí)案例的司法文書) 自動(dòng)進(jìn)行標(biāo)引和分類, 通過元數(shù)據(jù)建立法律公文主題詞與法律信息主題詞表相關(guān)概念的映射關(guān)聯(lián), 將關(guān)聯(lián)的主題詞及對(duì)應(yīng)的網(wǎng)頁法律公文地址( URL) 存放在指定的數(shù)據(jù)庫表中。( 2) 根據(jù)用戶輸入的查詢請(qǐng)求關(guān)鍵詞, 在本文設(shè)計(jì)的法律信息主題詞表查詢模板中進(jìn)行相關(guān)概念和上下位概念的檢索,找出與之相關(guān)聯(lián)和匹配的主題詞或上位、下位詞。( 3) 按照元數(shù)據(jù)所標(biāo)引的主題詞的網(wǎng)頁法律公文地址( URL) 檢索出網(wǎng)頁中用戶所需要的法律公文內(nèi)容以及相關(guān)的法律知識(shí)。

  如圖2所示。由于信息系統(tǒng)開發(fā)是一項(xiàng)大型、復(fù)雜、艱巨的工程, 尚有許多的基礎(chǔ)工作要做。為了快速實(shí)現(xiàn)上述基本思路, 本文采用小型的關(guān)系數(shù)據(jù)庫管理系統(tǒng)ACCESS 對(duì)Law- Retrieval 原型系統(tǒng)進(jìn)行了簡(jiǎn)單的、理想化的模擬。

  ( 1) Law- Retrieval 原型的基本結(jié)構(gòu)

  Law- Retrieval 原型的主要數(shù)據(jù)結(jié)構(gòu)是4 個(gè)數(shù)據(jù)庫表。它們分別是: 敘詞詞表Main, 敘詞關(guān)系表Relation, 分類表Category,和文件索引表Docfile。其中Main 表記錄了本文所設(shè)計(jì)的主題詞表模板中的所有概念, 對(duì)于這些概念中的非正式主題詞提供了與其同義的正式主題詞在該表中的位置, 對(duì)于一般要求的檢索和標(biāo)引, Main 即可實(shí)現(xiàn)控制功能; Relation 表記錄了主題詞的位置及主題詞間的各種關(guān)系( 包括該詞的同義詞、參照詞、上下位詞, 主題詞間的分、屬關(guān)系也記錄在該表中) , 據(jù)此表可以提高信息檢索的擴(kuò)檢功能; Category 表記錄了主題詞所屬分類范疇; Docfile 表記錄了用元數(shù)據(jù)標(biāo)識(shí)的某個(gè)主題詞對(duì)應(yīng)的網(wǎng)頁上的法律公文主題詞的映射關(guān)系, 以及該文檔索引名稱和相關(guān)URL 網(wǎng)址。用分類法和主題詞法結(jié)合起來構(gòu)成系統(tǒng)上層本體的詞匯網(wǎng)絡(luò), 下層由Web 中的法律文檔構(gòu)成實(shí)體信息資源。之所以這樣設(shè)計(jì)系統(tǒng), 目的是使得檢索系統(tǒng)能夠表達(dá)法律信息元數(shù)據(jù)和主題詞表概念間的兩種關(guān)系, 各表之間的層次關(guān)系

  通過上面的數(shù)據(jù)結(jié)構(gòu)以及層次結(jié)構(gòu)的分析可以看到, 以法律信息主題詞表為基礎(chǔ)構(gòu)建的原型系統(tǒng)不僅僅是一個(gè)有關(guān)法律主題詞的抽象概念的集合, 更是一個(gè)包含了具體法律信息實(shí)例的知識(shí)網(wǎng)絡(luò)。系統(tǒng)中的兩個(gè)層面———上層的本體和下層的實(shí)體信息由元數(shù)據(jù)被緊密地結(jié)合在一起, 從上而下, 使下層的法律文檔作為本體的具體實(shí)例很好地繼承了上層本體中概念間的關(guān)系; 也正是通過這些關(guān)系, 下層的具體實(shí)例擁有了豐富的語義聯(lián)系, 不再是孤立的信息單元, 而成為關(guān)聯(lián)的知識(shí)單元, 借此可以提取法律本體中與用戶查詢需求相符合的、有助于司法決策的關(guān)鍵信息。

  ( 2) 檢索輸出

  在用戶輸入?yún)^(qū)域輸入某個(gè)關(guān)鍵詞后, 系統(tǒng)首先按照模糊查詢的方式在敘詞表Main 中進(jìn)行掃描, 當(dāng)找到與用戶輸入的關(guān)鍵詞相一致的主題詞時(shí), 根據(jù)數(shù)據(jù)庫各表的指針, 隨之確定了該詞在Relation 表中的位置及其上、下位關(guān)聯(lián)詞和所屬范疇;進(jìn)一步地, 用戶還可以在窗口中選擇并確認(rèn)與該主題詞相關(guān)的上、下位或同義詞, 經(jīng)Docfile 表找到已用元數(shù)據(jù)標(biāo)識(shí)和定位了的、含有符合用戶查詢關(guān)鍵詞的Web 頁面中相關(guān)法律信息文檔。

  例如, 在原型系統(tǒng)窗口中選擇“詐騙”一詞, 隨之該詞所屬范圍的“立體”結(jié)構(gòu)就以樹型方式體現(xiàn)出來, 可以看到“詐騙”所屬范疇是“刑事”, 其上位概念是“侵犯財(cái)產(chǎn)”, 它的下位概念包括:“金融詐騙”、“手機(jī)費(fèi)詐騙”等。

  在檢索結(jié)果“ 主題詞相關(guān)文檔”窗口, 可以檢索到歸屬于“侵犯財(cái)產(chǎn)”范疇下與“詐騙”主題詞相關(guān)的網(wǎng)絡(luò)法律文獻(xiàn)有2篇, 當(dāng)雙擊任何一個(gè)文檔名, 就會(huì)按照文檔的鏈接網(wǎng)址打開該文檔, 供用戶點(diǎn)擊瀏覽查看。見圖4 所示。

  顯然, 以這種方式提供的檢索結(jié)果不再局限于以前的關(guān)鍵字匹配檢索, 它充分利用了法律本體的語義關(guān)系, 保障了用戶查詢需求與目標(biāo)結(jié)果的一致性, 因此既提高了查全率, 又確保了查準(zhǔn)率。

  4  結(jié)語

  本文通過對(duì)國內(nèi)外關(guān)于本體、信息檢索方法的研究分析,結(jié)合司法實(shí)踐中法律信息檢索問題, 提出了一個(gè)以司法事實(shí)為主線, 依據(jù)法律信息的語義特征及其關(guān)系構(gòu)建法律本體, 進(jìn)而實(shí)現(xiàn)法律信息語義檢索和知識(shí)抽取的解決方案, 為今后的法律信息組織、標(biāo)識(shí)、檢索提供了可借鑒的理論和實(shí)踐依據(jù)。

【注釋】

[1] Chandrasekaran B.What are ontologies and why do we need them[J].IEEE Intelligent Systems, 1999, 14( 1) : 20- 26.
[2] Gruber T.A translation approach to portable ontology specification[J].Knowledge Acquisition, 1993, 5( 2) : 199- 200.
[3] 康樹華.犯罪學(xué)大辭書[M].蘭州: 甘肅人民出版社, 1995: 44- 45.
[4] 付謙, 張申生, 胡錦敏.基于本體的領(lǐng)域知識(shí)共享研究[J].計(jì)算機(jī)集成制造系統(tǒng)- CIMS, 2001, 7( 11) .
[5] 張曉林.元數(shù)據(jù)研究與應(yīng)用[M].北京: 北京圖書館出版社, 2002: 197.
[6] 最高人民法院關(guān)于印發(fā)《人民法院公文處理辦法》的通知( 1996 年4 月9 日, 法發(fā)〔1996〕9 號(hào)) 附錄:“ 人民法院公文主題詞表”[OL].http://www.law- lib.com/.
[7] 綜合電子政務(wù)主題詞表[M].北京: 科學(xué)技術(shù)文獻(xiàn)出版社, 2005.
[8] 朱禮軍, 陶蘭.基于本體的語義信息檢索框架設(shè)計(jì)[J].計(jì)算機(jī)工程與設(shè)計(jì), 2004( 9)

備注:原載《計(jì)算機(jī)工程與應(yīng)用》2008,。44( 28)。為加強(qiáng)業(yè)內(nèi)交流轉(zhuǎn)于此,特示鳴謝。

        
        
      首都法學(xué)網(wǎng)       北京市高級(jí)人民法院       中美法律信息與圖書館論壇(CAFLL)
      國家圖書館       美國法律圖書館學(xué)會(huì)(AALL)       國家檢察官學(xué)院
      中國社科院法學(xué)所圖書館       國際法律圖書館協(xié)會(huì)(IALL)       最高人民法院圖書館

主管單位:中國法學(xué)會(huì)  主辦單位:中國法學(xué)法律網(wǎng)合作機(jī)制 技術(shù)支持:北大英華科技有限公司(北大法寶)
電話:010-82668266-152 傳真:010-82668268
加入收藏 | 本站首頁 | 聯(lián)系我們
go