一、法律文獻檢索效果的評定
法律文獻效果的評定是以檢索系統對教學科研人員需要滿足的程度為標準,通常主要通過查全率和查準率這兩個指標來表達。
文獻檢索的目的是為教學科研人員提供全面準確的所需文獻,但迄今為止,文獻檢索總是存在著一定的誤差。這是因為對法學文獻檢索效果存在著兩種判斷依據一個是檢索系統對教學科研人員特定需要的響應,凡符合提問特征即匹配檢索策略的相關法律文獻,會被系統自動輸出,這類被檢出的法律文獻,是檢索系統認為符合教學科研人員提問特征的,稱為系統相關性預報。系統認為不符合提問特征的法律文獻則不會輸出,稱為未檢出法律文獻另一個是教學科研人員的判斷依據。從教學科研人員角度看,在所有被檢出的法律文獻中可分為滿足了需要和不需要兩部分。前一部分就是教學科研人員判斷的相關法律文獻,而后一部分是指雖是被系統判斷為相關法律文獻,但在教學科研人員眼里卻是不需要的相關法律文獻。查準率是指在所有被檢文獻中真正滿足教學科研人員需要的程度,它是由被檢出的滿足教學科研人員需要的相關法律文獻量與全部被系統輸出的文獻量之比。一方面,對于系統判斷為不符合提問特征而未被檢出的法律文獻中,在教學科研人員認為還可能存在著他所需要的相關法律文獻,是系統所漏檢的。查全率就是被檢出的相關法律文獻與反映滿足教學科研人員需要的全部相關法律文獻之比。
這里,我們可以看到相關性的評價基本上是由教學科研人員的主觀判斷作依據的。因此,在任何一次檢索中,檢索系統的全部法律文獻可以分為四個部分,下列的表格,表示了這四種狀態:
教學科研人員相關性判斷
相關法律文獻非相關法律文獻總計
被檢出法律文獻aba+b
未檢出法律文獻cdC+d
總計a+cb+dA+b+c+d
1.查準率(p)=該檢出的相關法律文獻量除以全部被檢出的法律文獻量
P.查準率=a除以(a+b)乘以100%;要保證查準率高,就要擴大a量,減少b量
2.查全率(R)=被檢出的相關法律文獻量除以系統中所有的相關文獻量
R.(查全率)a除以(a+b)乘以100%,要提高查全率,就要減少c量,擴大a!量。
3.誤檢率(N)=被檢出的非相關法律文獻量除以全部被檢出的法律文獻量
N.(誤檢率)=b除以(a+b)乘以100﹪
4.漏檢率(0)=未檢出的相關法律文獻量除以系統中所有的相關法律文獻盤
0.(漏檢率)=c除以(a+c)乘100﹪
一個檢索效率高的系統,應該是查全率和查準率都高,誤檢率和漏檢率都低,即擴大a的輸出量,減少c減少b的輸出:擴大d。如果能使查全率和查準率都達到1,那當然是最理想的。但事實上,當一個情報檢索系統的查全率和查準率達到最佳對比關系后,若要再提高查全率就會降低查準率,反之亦然。即它們之間是互逆關系。
查準率可由教學科研人員對全部被檢出法律文獻進行判斷而得要獲得查全率則較困難,特別是貯存信息量多的系統更為如此。一般是借助其他已有的二次文獻進行估計而得。但無論是查全率或查準率,都不是能絕對精確計算的。
二、如何提離法律文獻檢索效率?
法律文獻標引工作的質量高低是法律文獻檢索效率的一個關鍵因素。查全率和查準率首先取決于在標引時對法律文獻內容分析的深度和廣度,如果標引時對法律文獻內容的各個概念的分析深人而具體,分析出的主題檢索專業性強,則檢索系統輸出相關法律文獻時,查準率會相應提高。標引時法律文獻主題網羅性廣(即對法律文獻分析深透、標引全面、相關法律主題沒有遺漏),就可減少漏檢率而取得較高的查全率。因此,在標引時要絕對避免僅僅依據篇名標題標引,要對能表達該文獻研究對象的概念(名詞、詞組一一列舉出來),當然也不能瑣碎細雜。為此,必須提高圖書館圖書情報工作人員的專業知識水平、文化修養和業務工作能力。
檢索語言是進行文獻標引和查找的基本手段。一般說,使用自然語言作為檢索語言具有較高的命中率。因此,各種規范化的檢索語言應盡童與自然語言靠攏,當然,這里要注意克服自然語言在檢索使用中的缺點。檢索語言規范化、標準化的目的是在于保證文獻標引的一致性和準確性,從而提高查全率和查準率,檢索語言也應隨著科學的進展而不斷地充實、提高、完善。
再者,提高教學科研人員表達提問特征概念的正確性,也是提高法律文獻檢索效率的一個重要方面。由于教學科研人員對他所要查找的法律文獻最為清楚,如果他們了解和熟悉檢索語言和標引規則,那么在選擇和組配符合提問特征的檢索詞時就會更全面更精確。為此,必須對教學科研人員進行法律文獻檢索和計算機檢索知識的教育,使他們掌握主題詞的選擇、提問式的構造、組配以及現代檢索工具使用的基本原理、技術與方法。
最后,提高法律文獻檢索效率還要加強法律文獻策略的研究。所謂檢索策略,就是處理檢索提問的邏輯與查找步驟的科學安排。即如何正確地構造邏輯提問式以確切表達教學科研用戶的文獻需求,又如何根據教學科研人員提問式所表達的概念范圍來選擇檢索工具,確定檢索途徑等。