一、引言
社會生活中有大量的法律信息需要處理,僅靠人們的觀察很難對語言進行科學的分析。正如語言學家 Biber[1]所說:全面的語言研究不能僅靠人的直覺意識所獲取的觀察證據或者靠很少的語料,它需要由自然語料組成的大型語料庫來進行實證研究。鑒于目前計算機等信息處理技術較為發達,可以采用新技術建成大型系統,綜合處理各種法律信息,供大范圍的人員共享。可以大大降低重復性勞動,提高工作效率。
法律信息處理系統語料庫CLIPS就是為此目的而建設的語料庫,法律信息處理系統LIPS Legal Information Processing System是該語料庫的核心部分,主要功能是處理法律語言信息與系統的其他各個組塊相接,以適應各相關行業對法律語言信息的需求,提高信息處理效率。法律信息處理系統語料庫是依據法律語篇信息理論[2]。而構建的特色語料庫(以下簡稱信息型語料庫)其主要特點是所存儲的語料經過了語篇信息標注。 包括宏觀信息結構和微觀信息結構:前者指語篇中各信息單位所構成的相互聯系,后者指信息單位內部各成分形成的結構。本文將從信息型法律語料庫的功能出發,結合具體的分析,揭示信息型法律語料庫在語篇研究尤其是法律語篇分析中的潛在作用。
二、信息型法律語料庫的基本特點與功能
(一)普通語料庫的特點及局限性
人們在不同時期對語料庫的理解不同,因此定義也會不同。1982年美國Brown大學的名譽教授W.Francis認為:語料庫是一個用于語言分析的文本集合,對某一種語言、方言或語言的某一方面具有代表性[3]。1991年John Sinclair教授給出如下定義:語料庫是一個存儲于計算機的自然語言的集合,用來反映語言的狀態及變化特征。[4]根據語料庫目前的發展狀況 其較為完整的定義應為:語料庫是以計算機為工具建立、存儲和使用語言素材的集合,并可對其中的語言素材進行檢索\分析和處理得出語言的特征和規律或有益于語言的應用和教學。[5]
從語料庫的建庫目的和用途來分,語料庫有普通語料庫和專門語料庫。普通語料庫指用于多種用途的語料庫。例如語言學研究、語法研究、詞典編纂、教材編寫等,側重反映語言的普遍規律。如COBUILD BNC Longman Lancaster Corpus等。專門語料庫是用于某一特定研究目的或某一特定研究領域的語料庫,如口語語料庫、用于文學作品分析的各種作家語料庫、用于歷史語言學分析的歷史語言語料庫、用于翻譯或翻譯研究的平行語料庫等。本文所討論的信息型法律語料屬于專門語料庫。
首先,普通語料庫在選材方面,針對性不如專門語料庫強。普通語料庫語料來源豐富,適應范圍廣,但不能滿足特定領域內語言研究的需要。其次普通語料庫對語篇內部結構的處理比較簡單,較多處理普遍的語法規則、詞匯等,對于語篇分析的作用十分有限。
法律語言為機構性語言,其宏觀語篇信息結構和微觀的信息成分都有自身的特點。隨著法律語言學研究日漸深入,研究者發現傳統的研究方法不能單獨支撐研究的進展。法律語料庫便應運而生,但是專門的法律語料庫還為數不多。封鵬程[6]對法律語料庫的建立原則和建立步驟進行了詳細的說明并對法律詞匯進行了詞性標注、詞頻統計和詞表比較。該研究中提取的慣用表達式和高頻詞匯對法律詞典或慣用表達式的編撰有一定貢獻,但是該研究局限于詞、句的研究,尚未上升到語篇分析的高度。李葆嘉[7]提出了根據不同語域構建日常商務和法律語料庫的構想,并制定了比較詳細的技術路線,但尚未實施。法律信息處理系統語料庫則是依據系統的理論和方法而建, 具有獨特的功能和充分的未來發展空間,在法律語言研究、教學中已經得到應用。
(二)信息型語料庫的特點
信息型法律語料庫的語料采用語篇信息理論進行了分析和標注,該理論將語篇看成一個由核心命題及其下層信息組成的信息系統。呈樹狀結構每一個信息單位由一個命題構成,每一個信息單位與其上層信息單位的關系稱為信息(節)點。信息點共有十五類:何事、何據、何事實、何推斷、何處置何人、何時、何地、何方式、何因、何效果、何條件、何態度、何變化、何結論,這些信息點可以用來表示語篇中所有信息單位之間的關系。因此,具有通用性語篇的信息單位之間的關系構成語篇的宏觀信息結構。
與宏觀信息結構相對的是微觀信息結構。這是指信息單位內部各信息成分之間的相互關系。信息成分共分為三類: 即個體、過程和環境:每類信息成分又有子類,個體的子類包括施事、經受、客體、使成、歸附;過程的子類包括狀態、性質、關系感受、生成、改變、行為、否定;環境的子類包括工具、方位、來源、目標、伴隨、時間、影響、借助、語境(中)。微觀結構與語言表層的關系更為直接,因此,常可以與語言結合分析,可以作為翻譯研究的理論工具。見[8][9]。
信息型語料庫是法律信息處理系統的核心庫,能與該系統的其他不同類型信息庫有效對接, 以便結合分析、處理、調用庫中其他類型的材料, 語料庫包括多個模塊,分別執行材料入庫、分析、檢索、輸出等具體任務。語料庫所存儲的材料類型包括文本、音像、視頻、圖片、實物記錄等,其中文本語料包括不同語種的材料,是平行語料子庫中的基本語料。信息型語料庫中的語料都經過了語篇信息標注,包括信息單位標注和信息點標注。平行語料子庫的材料還做了信息成分標注,標注所用的是本語料庫系統的專用規范和軟件,吸收了同類軟件的一些優點,兼容了正則表達式等規范和技術。
三。信息型法律語料庫的功能
語料庫的主要用途是檢索語篇信息,繼而激活信息處理系統的相關資源。語料庫也可以獨立運行,僅檢索語篇信息。其機制適合于進行相關的統計計算,適合于資料的預處理和精確處理,所存儲的材料可用于語言分析、語篇分析、信息統計、信息網絡構建、遠程傳輸、語言教學等普通的語言分析。語料庫發展至今,相關的技術和工具較為豐富,詞語索引、搭配研究、頻率統計等,適合進行基本的語言分析。信息型法律語料庫兼容了這些普通語言分析功能,使用者可以根據自己的研究需要,結合其它語言分析理論和工具對語言進行分析語篇信息檢索。信息型語料庫檢索軟件除了具備普通的語料檢索功能外,更重要的是可以根據研究者的需要對語料庫中相關的語篇信息進行檢索,信息單位、信息點和信息成分可以按信息層級、標注符號、信息值、信息源等內容進行分別和復合檢索。可對這些檢索參數進行任意排列組合檢索,分內容檢索和信息結構檢索。內容檢索一般以指定的信息單位或信息成份為基準,根據需要選擇語境范圍,并一起呈現。信息結構檢索包括宏觀結構檢索和微觀結構檢索,宏觀結構檢索結果是某級別信息在整個語篇信息結構中的定位,根據需要,整體結構可一并呈現。微觀結構檢索結果是某信息單位內部成分之間的關系,整個信息單位的結構全部呈現信息統計。該語料庫設置了信息統計功能,可對字、詞、句、標點等各種普通統計指標進行計量;同時還可以對語料庫中的語篇信息進行分類或綜合統計 可根據語料庫與其他子庫的關聯,對其他子庫的相關資料進行連帶統計信息網絡構建。信息型語料庫以處理書面語言信息為核心任務;同時具有處理口語信息、音像材料信息、網絡信息、物質材料信息、檔案信息等各種信息的擴展功能。因此,該語料庫能作為主要模塊與其他多種數據庫對接,建立各種信息之間的關聯,用于搭建復合型信息網絡。除了滿足局域的信息檢索需求外,尚可進行遠程傳輸。目前,以該語料庫為基礎的大型法律信息處理平臺設計已經立項并開始研究教學應用。信息型語料庫中設置了跨語言平行語料子庫、外語測試語料子庫、教學視頻庫等,這些語料庫的材料可用于教學、翻譯和研究。
三、信息型法律語料庫在法律語篇分析中的應用
以上對信息型法律語料庫的基本特點和功能進行了討論。以下從不同角度討論信息型法律語料庫在語篇分析中的應用,涉及法律語篇研究、法律語言教學、法律翻譯等,這些領域的研究都離不開法律語篇分析。法律語篇除了傳統的書面語篇,還包括語音語篇和多模態語篇。如涉及法律的語音材料和視頻等。法律語言教學中,對法律語言的信息進行研究以找出法律語言的信息特點,對于教學實踐有非常重要的指導意義。在法律翻譯研究中,不同語言的語言表層結構不同,但是傳達的信息是可以對應的。對不同語言之間信息對應方式的規律的探索可以為翻譯實踐提供重要的理論指導。
一、法庭語篇分析
法庭語篇分析是指對庭審過程中產生的語言進行分析。如法官語言、律師語言、證人語言、檢察官語言等。杜金榜[10]對法律語言學的研究方法作了探討,他提出:法律語言學的研究可以用不同的理論、從不同的角度進行,主要包括:法律語言的特點、功能、所涉及的語言行為,所表現的社會關系,如上下關系、強弱關系、平等或不平等關系、權力層次等。對法律實施過程和結果的影響,對語言使用者的心理影響,法律對語言的要求和制約,法律實施過程中的語言使用的特點等。因為語篇表現了社會關系,所以應將語篇分析置于社會框架中,令社會關系分析貫穿整個研究過程,提綱挈領。作為語篇分析的根據,語篇分析既要深入語言層面,又要關注宏觀結構,以便為各種語篇尋找共同的規律。語篇分析中,信息分析不可或缺,應當作為一個重要視角。 [11]
在法律語篇中,人們的社會關系一般有明確的定位,立法語篇中法律所規范的對象、法律執行者、法律解釋者、以及司法語篇中的當事人、證人、律師、法官等均處于明確的關系網絡中。每一角色的發言、或者對每一角色的語言描述或規定,都直接影響語篇信息的處理,影響信息結構的編排。[12]用信息結構理論提供的方法將法律語篇進行標注,放入語料庫中,用計算機進行統一調用。我們可以得到不同尋常的發現,當然,語料庫包羅萬象,也需要使用者有足夠的洞察力和明晰的研究目的,才可以窮其所用。
在法律語言理論研究領域,語料庫能夠提供語篇處理的各類信息。如信息點的分布、層級關系的布局、語用功能的實現等。法律語言研究的最終目的是解決司法領域的問題,為完善司法實踐中的語言使用提供切實可行的理論基礎。從如下實例中可以看到信息型語料庫在法庭語篇分析中的一些常用功能。
1.法庭問答功能與庭審各方交際目標的實現
龍宗智認為刑事庭審具有三種主要功能:事實查驗、法理闡明、沖突處置及其正當化。[14]杜金榜認為庭審交際目標是基于庭審條件,根據自己的利益形成的主張,靠法庭程序和話語予以實現。 [15]他認為:有關語篇的活動以信息處理為核心,庭審活動基于語篇信息處理實現庭審的三種功能:實現庭審交際目標,[16]對語料庫中的語料進行分析,結果表明事實查驗功能多與客觀類問答相關,客觀類問答主要處理事實相關的信息,較多用在法庭調查階段。如:例1
<WF> 審判長 起訴書指控的內容是否屬實?
<WA> 你對起訴書中適用法律及指控事實有異議嗎?
<WF> 被告人 屬實<WA> 沒有
<WF> 審判長 起訴書指控的內容是否屬實
<WA> 是否自愿認罪
<WF> 被告人 屬實 <WA> 自愿認罪
注:這是取自信息型語料庫的材料,為節省本文篇幅,原有標注符號在此被簡化。WF表示該信息點類別,是“何事實”WA 表示,何態度?審判長兩次問話都是要求被告證實真實性,證實類問答一般涉及已知內容,采用是非問,應答一般用“是”或“否”,從類別上看,這些問答均涉及WF信息和WA信息,顯然審判長征求的是被告人對事實的確認及表態。
2.庭審過程中的信息流動與庭審過程控制
潘小鈺 杜金榜[17]詳細地論述了庭審問答中,法官如何通過信息流控制庭審過程。文章應用了法律語篇信息成分分析法,在句際層面分析了庭審過程中的信息流動現象,通過信息成分的標注在語料庫中調取了:過程、個體、環境、的信息成分,發現信息成分的流動使語篇信息得到增生,信息流動方向得到控制。該研究表明,采用信息型語料庫可以對交際過程,尤其是庭審過程進行深入的分析,該語料庫的具體作用可見一斑。
3.庭審過程中的語篇建構
庭審過程中,各方通過語篇建構來表達自己的立場。在互動中建構自己的語篇,將話題導向于己有利的方面。對每一方都十分重要。陳金詩[18]曾利用該語料庫工具,對控辯審關系的建構進行了研究,通過語篇分析表明,法官在庭審互動過程中建構出控辯審間的倒三角關系,在操作庭審的過程中,法官獨白偶爾會有“控審合作”的傾向。在法庭對話中,法官也會使用有違庭審程序的、有罪推定、語篇信息,而法庭問答中法官的語篇信息處理也可能會導致“有罪推定控審合作”等有違司法公正的后果。這些語篇信息可以通過對語料庫的綜合應用檢索出來,通過大量的語料剖析問題有助于司法問題的解決。
二、法律語篇實用分析
法律語篇實用分析是指采用法律語言學的分析方法,對法律活動中使用或產生的語篇進行分析,以便針對性地解決所涉及的具體法律問題。如文本鑒別、語音識別、法律語言心理分析等。在這些研究任務中,信息型法律語料庫可充分發揮作用文本鑒別是法律語言學應用研究的主要任務之一。在法律活動中,需要對一些文本的真偽、性質、質量等做出鑒別。對文本的歸屬和作者做出判斷,為解決法律問題提供證據。進行文本鑒別前,為了盡可能減低工作量,提高效率,可以針對檢材,待鑒別文本的基本題材、體裁、語言、主題、風格、作者特點等與語料庫中相關的語篇進行比對, 以便確定檢材所屬的具體范疇。在此基礎上,對檢材和比對文本進行語篇信息分析,確定更為具體的鑒別范圍。例如:為鑒別一份授權書的真偽,可對檢材和比對材料的信息結構特點,信息點分布情況、信息點的搭配使用、信息單位的內容、語言表述等進行比較。從而找出檢材中異于真實授權書比對文本的具體信息特征。經過語篇信息分析,分析范圍可得到具體界定,有時可直接解決問題。如:翁金翠采用語篇信息理論對有關作家代筆的事件進行了研究,并在國際學術會議上宣讀了論文[19]取得了良好的效果。
語音識別主要采用語音分析技術和相關的理論,截止目前尚未用到語篇信息分析方法,運用語篇信息分析方法時,首先要對具體語音出現的語境進行綜合性信息分析。這時,可以采用語篇宏觀和微觀信息分析方法,由于語音很少單個出現,總會受到相鄰音的影響,語音的特點和變化也必定受所傳遞信息的影響。如例2:他總是這樣埋怨,我沒有理過他。其中每一個音的輕重以及變化均與此句話的信息焦點,每個信息單位以及此句話在語篇信息結構中所處的位置有關,語音特點與信息特點的連帶分析可令語音識別更為精準;而且,講話人即使有意識對語音予以調控 也無法關照到與信息的關聯,必定留下痕跡。因此,采用信息型語料庫中的相關語音材料進行比對,是一種可行的方法較之在語音識別中的作用。在法律語言心理分析中,語篇信息的作用更為明顯,心理活動與講話內容密切相關,因此從信息角度分析心理狀況甚為直接。此外,法律語言心理分析所用的材料一般較長,如一段談話、一段寫作材料等,足以進行語篇信息的深度分析,基于語篇信息分析心理活動將是法律語言心理分析的重要方法。
三、法律語言教學中的語篇信息分析
信息型語料庫可用于法律語言教學的語篇信息分析。信息型語料庫中的平行語料子庫、教學視頻子庫、語言測試子庫等都可以為教學和研究所用。杜金榜[20]曾將學生的英語習作進行了語篇信息分析,分析內容包括核心命題、信息層次、各層信息單位數目、種類等,并結合進行了語言實現分析。這是在教學研究中對信息型語料庫的具體應用。
除了寫作教學外,信息型語料庫還可用于聽力、閱讀、翻譯等教學。語篇信息分析對于聽力訓練具有直接作用,通過信息分析,可以具體確定學生在聽力訓練過程中獲取信息的能力。由于語料庫中的材料均經過信息分析和標注,信息的層級、數量、類別等已十分清晰,因此,調用語料庫的材料進行教學或輔助教學,可以方便地對學生的語篇信息處理情況進行評價,對學生提出具有針對性的建議。例如,兩位學生閱讀同一篇文章后獲取信息數目相等,由于信息所處的層級不同,教師可根據信息在語篇中的重要程度決定哪位學生獲取信息的能力更強,顯然獲取語篇上層信息越多,能力就越強。
同理,在閱讀過程中,學生的能力也主要表現在語篇信息的獲取。使用信息型語料庫中經過信息標注的材料進行閱讀教學,可以針對性地分析學生的閱讀技巧,對閱讀能力進行針對性評價。還可根據語篇信息的特點對學生的閱讀策略進行及時的矯正。語篇信息分析可與語言分析同步進行,因此可同時解決學生在閱讀中的語言困難,如語法結構、詞語搭配、詞義辨析等。陳金詩[21]曾進行了基于“法律信息處理系統語料庫”的語篇信息教學實踐研究,發現在課堂上,學生能充分運用語篇信息分析方法進行法律英語語篇的交互式閱讀認知語篇并建構意義,體現了交互式專門用途英語(English for Special Purposes)閱讀課堂中教師的引領作用和學生的主體作用。
信息型語料庫對于翻譯教學最為適用的是平行語料子庫。在平行語料庫中,源語和譯語語篇都經過信息分析和標注,語篇的宏觀結構、信息之間的關系以及平行語篇之間信息成分的對應關系都可呈現,便于進行原文和譯文間的信息對比分析和語言對比分析。通過教學軟件調用語料庫中的對譯材料,可以幫助學生了解具體的翻譯技巧。例如,軟件抽取材料形成一道翻譯試題,學生回答后即可查閱對應的源語文本中的語句,并能根據語料庫對標注譯文的評價等級對自己的譯文對照評價。除此之外,學生可借助跨語言平行子庫隨時進行翻譯自學和自我評價。
四、法律翻譯研究中的語篇信息分析
在法律翻譯研究領域,截止目前,研究者除了對翻譯的語言層面給予了足夠重視外,尚特別重視對翻譯過程所涉及因素的考慮,如文化因素、翻譯委托者因素、譯作讀者因素、翻譯環境等,但很少研究者從語篇信息角度研究翻譯。信息型語料庫彌補了這一不足,提供了便利工具,供研究者對原文和譯文進行信息對照分析。信息型語料庫平行語料子庫的標注機制基于語篇信息理論中的宏觀和微觀兩種結構模式,即語篇信息結構模式和信息成分模式。對語篇進行信息成分的標注,可以詳盡展示信息內容。
通過對英漢文本差異的比較,可以發現這些差異與信息成分的變化之間的關系,從而找到規律性。田靜靜[22]曾研究過法庭口譯中信息成分改變的原因、改變的方式及信息成分改變對譯者決策的影響。
翻譯研究,尤其是翻譯批評和翻譯評估,總是與譯文質量的評價密切聯系,常以譯文的質量評價為基礎,而質量評價的標準很難確定。語篇信息理論為翻譯質量評價提供了基礎,使翻譯評價趨向客觀化。根據這一理論,以信息型語料庫為工具,翻譯評價以從語篇信息分析開始。這是因為,信息相對穩定,而語言則動態性強,變化十分豐富。原文與譯文所使用的語言不同,不同譯者翻譯時又有很大變化,但是所要傳遞的信息應該是一致的,所以衡量譯文質量的基礎是語篇信息。
利用信息型語料庫可以方便地對譯文的語篇信息傳遞情況進行評估。就法律翻譯而言,由于對譯文的忠實度要求高,原文中的信息要在譯文中盡數表達。因此,可以首先進行譯文中信息的評估,確定與原文中信息的吻合程度,如果吻合程度合乎要求,例如,信息無遺漏,信息的結構層次不紊亂,就可認定譯文已經達到可接受的水平,再結合更高層次的評價,如風格、各種要素的調節、美感等,譯文的質量即可確定。語篇信息分析對比方法可以大幅度提高譯文質量評價的效率。
利用信息型語料庫也可對翻譯的語言層面進行深入研究。語篇信息成分與語言層面關系密切能具體反映語言運用的水平,結合信息成分進行語言分析,可使翻譯研究中的語言分析更具可靠性。
四、結語
以語篇信息理論為指導進行的法律語篇標注是法律語言學界研究者所做的新嘗試。 經過多年的發展,該理論已經比較成熟、自成系統,推進了法律語言研究,尤其是法律語篇分析。語篇信息理論為法律語料庫建設提供了嶄新的思路和技術,同時依據該理論所建的語料庫對傳統型語料庫技術能順利兼容、繼承了傳統語料庫的諸多優點。
從上面的討論可以看到,信息型法律語料庫為語篇分析提供了有效的工具,在法律語言研究中可以得到廣泛應用。可以幫助解決諸多涉及語篇的問題。該語料庫尚在不斷更新、完善。隨著新技術的研發,該語料庫將具有自動處理功能,對語篇信息的分析將更為高質、高效。