1、引言
中文學(xué)術(shù)圖書出版的現(xiàn)狀已經(jīng)無需贅敘,數(shù)量巨大、質(zhì)量混雜是其顯著特征[1]。對于高校圖書館來說,中文社科類學(xué)術(shù)圖書是其采訪工作的重點之一。幾乎所有的高校圖書館都沒有能力將中文社科學(xué)術(shù)圖書全部收錄,只能根據(jù)自身學(xué)科類別和層次需求,篩選高質(zhì)量的圖書進入館藏。如此,源于出版與需求的矛盾,將高質(zhì)量中文社科類學(xué)術(shù)圖書納入館藏就成為當(dāng)前高校圖書館采訪的難點。
盡管當(dāng)前學(xué)界對高校圖書館普遍采用的專職采訪人員采購全館圖書的模式存在爭論[2],但在實踐中,此方式依然是國內(nèi)最常用的一種采訪方式。
為此,從高校采訪工作人員的角度,提供一種有效的快速判別學(xué)術(shù)圖書質(zhì)量的方法來輔助選書,成為高校圖書館提高中文社科類學(xué)術(shù)圖書采訪質(zhì)量和采訪工作速度的一個極具應(yīng)用價值的問題。
問題的核心是快速和有效。有效是方法的必須前提,方法必須能對圖書學(xué)術(shù)價值做出有效判斷,有效的標(biāo)準(zhǔn)可以分為選的準(zhǔn)和選的全;同時也必須能夠?qū)崿F(xiàn)快速判別,否則對于采訪工作人員來說只具備事后評價意義,而無法提高工作人員效率。實現(xiàn)快速有兩種途徑,一個是降低采訪人員面對圖書的閱讀量,對越少的閱讀量做出判斷,速度就越快;另一個是判斷標(biāo)準(zhǔn)的簡化,根據(jù)標(biāo)準(zhǔn)能作出“是”或“否”的決策無疑是最快速的。
基于上述思路,有一定研究并且已應(yīng)用于實踐的是核心出版社輔助判斷法[3]。即基于某類圖書樣本,依據(jù)一定的判斷圖書質(zhì)量的標(biāo)準(zhǔn),或者是引文分析法、或者是用戶使用數(shù)據(jù)分析法,確定某類圖書的核心出版社群。之后則重點采購核心出版社出版的圖書。該方法能夠以相關(guān)關(guān)系的存在證明其有效,但效能,選準(zhǔn)率和選全率如何無法表明。
另外學(xué)界也提出了核心著者輔助判斷法[4]。但是在實證研究中,還少見有構(gòu)建核心著者庫并進行學(xué)術(shù)圖書價值判斷的相關(guān)研究。
根據(jù)經(jīng)驗,當(dāng)采訪人員面對一本學(xué)術(shù)圖書時,首先關(guān)注的是圖書的書名、著作方式、著者、出版社和簡介等信息。其中根據(jù)書名、著作方式、著者和出版社判斷是否采購該圖書,既是最省力和快速的,也是最常見的。但是由于上述信息量化依據(jù)不足,憑借的是采訪人員的主觀經(jīng)驗,因此判斷易出現(xiàn)偏差。
立足當(dāng)前采訪現(xiàn)實,本研究則試圖以上述信息與學(xué)術(shù)圖書價值的關(guān)系,建立學(xué)術(shù)圖書價值輔助判斷模型。由于圖書書名通常涉及圖書的主題,一個學(xué)科的研究主題無數(shù)、很難取得量化規(guī)律,因此在本研究中僅探討著作方式、著者和出版社信息這三個變量與圖書學(xué)術(shù)價值的關(guān)系,分析依據(jù)這三種變量判斷圖書學(xué)術(shù)價值的效能,并形成以這三種變量判斷圖書學(xué)術(shù)價值的可靠模型。
2、樣本的選擇及圖書學(xué)術(shù)價值的編碼
圖書學(xué)術(shù)價值的評價是本研究的起點,是后續(xù)指標(biāo)有效性的依據(jù)。研究以筆者參編的《中國哲學(xué)社會科學(xué)類學(xué)術(shù)圖書基本書目(1995-2005)》(以下簡稱《基本書目》)為參照。
《基本書目》在考慮我國出版業(yè)發(fā)展?fàn)顩r及學(xué)術(shù)圖書被引頻次的積累時間和半衰期等因素,以1995-2005年出版的圖書為目標(biāo)。具體以上海圖書館等圖書館和圖書公司180余萬條MARC數(shù)據(jù)為源,經(jīng)去重處理,得出72萬余條數(shù)據(jù)。經(jīng)過與《全國總書目》進行抽樣比對,采集到的數(shù)據(jù)基本涵蓋了總書目的收錄范圍,進而確定為樣本[5]。
據(jù)此,本研究選取《基本書目》的法律類書目數(shù)據(jù)為樣本,在剔除不含在本研究范圍內(nèi)的譯著類學(xué)術(shù)圖書后,獲得樣本5692本。以書目制定所使用的基于GoogleScholar的引文分析法和帕累托定律,對國內(nèi)出版的法律類學(xué)術(shù)圖書給予二元量化賦值。入選核心書目的為高價值學(xué)術(shù)圖書,賦值1;落選的為低價值學(xué)術(shù)圖書,賦值0.研究中,基于時效性的考慮,對樣本圖書被引頻次進行了更新。更新時間在2015年1月。表1為對書目學(xué)術(shù)價值賦值過程的相關(guān)描述性數(shù)據(jù)。
3、著作方式、出版社和著者信息的編碼
3.1著作方式的編碼
著作方式又稱為著作類型,一般分為:著、編著、編寫、主編、編纂、選編、譯、編譯、注釋、校訂、譯注等。本研究涉及的法律類學(xué)術(shù)圖書的著作方式主要有著、編著和主編三種。
將著作方式按著、編著和主編分別給予1、2、3的類別編碼(見表2),統(tǒng)計發(fā)現(xiàn)著作方式與被引頻次有顯著的負相關(guān)(見表3)。
統(tǒng)計表明,如果將著作方式按類別賦值,著作方式1-3的順序與被引次數(shù)存在顯著的負相關(guān)關(guān)系。即著作方式可以作為判斷圖書學(xué)術(shù)價值的一個參考指標(biāo)。
但是比對各著作方式被引次數(shù)均值(見表2)發(fā)現(xiàn),編著類別的被引次數(shù)均值最低,這與前述負相關(guān)關(guān)系存在矛盾?紤]到其樣本數(shù)較其他兩類低,因此將其與被引次數(shù)較低的一組,即與主編方式歸為一類。重新進行相關(guān)分析(見表3),發(fā)現(xiàn)顯著的相關(guān)關(guān)系存在,并且相關(guān)系數(shù)高于之前。因此,本研究將著作類型分為兩類,著賦值1,其他賦值0。
3.2出版社的編碼
出版社信息的編碼參考學(xué)界關(guān)于核心出版社的研究。以是否屬于核心出版社給予編碼,屬于賦值1,不屬于賦值0.
以圖書的被引頻次為指標(biāo),依據(jù)出版社信息將被引頻次疊加,再根據(jù)帕累托定律,從高到低將占總被引頻次80%左右的出版社列為核心出版社。由于排序可以依據(jù)被引總數(shù)或者是被引平均數(shù)進行,因此,需要比較這兩種情況哪一種與核心圖書具有更高的相關(guān)性。
表4表明,按照平均被引次數(shù)確定的核心出版社相關(guān)系數(shù)大于按照總被引次數(shù)確定的核心出版社。因此,本研究按照出版社圖書平均被引次數(shù)確定核心出版社,并給予賦值1,其他賦值0.表5為出版社編碼及出版圖書情況。
3.3著者信息編碼
著者信息的編碼依據(jù)學(xué)界提出的核心著者概念進行界定。以是否屬于核心著者給予編碼,屬于賦值1,不屬于賦值0.核心著者的界定方法,以圖書的被引頻次為指標(biāo),依據(jù)著者信息將同一著者所著圖書被引頻次疊加,再根據(jù)帕累托定律,從高到低占總被引頻次80%左右的著者作為核心著者。由于排序可以依據(jù)被引總數(shù)或者是被引平均數(shù)進行,因此,需要比較這兩種情況哪一種與核心圖書具有更高的相關(guān)性。
表6表明,按照平均被引次數(shù)確定的核心著者其相關(guān)系數(shù)大于按照總被引次數(shù)確定的核心著者。因此,本研究按照著者出版圖書平均被引次數(shù)確定核心著者,并給予賦值1,其他賦值0.表7為著者編碼及出版圖書情況。
4、三種指標(biāo)的價值判斷效能
4.1三種指標(biāo)與學(xué)術(shù)圖書價值的關(guān)聯(lián)驗證
完成對中文學(xué)術(shù)圖書學(xué)術(shù)價值編碼以及預(yù)設(shè)的三種預(yù)測途徑的編碼后,首先需要驗證新產(chǎn)生的預(yù)測途徑變量與學(xué)術(shù)價值變量存在關(guān)聯(lián)性。在關(guān)聯(lián)性存在的基礎(chǔ)上比較各途徑的各個效能指標(biāo)。
各個途徑變量與圖書學(xué)術(shù)價值變量是否存在關(guān)聯(lián),采用2×2的列聯(lián)表卡方檢驗方法進行驗證。本研究應(yīng)用SPSS19.0版軟件進行統(tǒng)計分析,對著作方式、核心出版社、核心著者分別與圖書學(xué)術(shù)價值進行列聯(lián)表卡方檢驗,結(jié)果參見表8。
結(jié)果表明,三種途徑顯著性系數(shù)均小于0.01,三種途徑與圖書學(xué)術(shù)價值存在極其顯著的關(guān)聯(lián)。因此,通過三種途徑對圖書價值進行判斷可概括為:①圖書著作方式為著的,為核心圖書(高價值學(xué)術(shù)圖書);②圖書出版社為核心出版社的,為核心圖書(高價值學(xué)術(shù)圖書);③圖書著者為核心著者的,為核心圖書(高價值學(xué)術(shù)圖書)。
4.2判斷效能指標(biāo)的界定
依據(jù)某途徑進行圖書學(xué)術(shù)價值判斷,根據(jù)判斷結(jié)論和該書實際價值兩個維度,可以將判斷結(jié)果分為四種類型,即選準(zhǔn)、篩準(zhǔn)、漏選和漏篩。依據(jù)這幾種類型的數(shù)據(jù)進行組合運算可以計算出相關(guān)的效能指標(biāo)。本研究有關(guān)的效能指標(biāo)界定及計算方法如下:
選準(zhǔn)指該圖書屬于核心圖書,同時也判斷其為核心圖書。選全率指的是選準(zhǔn)數(shù)與應(yīng)選數(shù)(核心圖書數(shù))的百分比值,與信息檢索結(jié)果的“查全率”含義相近,表示核心圖書入選的全面性。
篩準(zhǔn)指該圖書不屬于核心圖書,同時也判斷其為非核心圖書。篩全率指篩準(zhǔn)數(shù)與應(yīng)篩數(shù)(非核心圖書數(shù))的百分比值,與信息檢索結(jié)果的“查全率”含義也相近,表示非核心圖書篩除的全面性。
入選率指判斷為核心圖書的數(shù)量與圖書總數(shù)的百分比值,入選率低表明在實際工作中將要采購的數(shù)量少。
總體判斷準(zhǔn)確率指選準(zhǔn)數(shù)與篩準(zhǔn)數(shù)之和與圖書總數(shù)的百分比值,從總體上表明某判斷途徑的效果。
選準(zhǔn)率指判斷為核心圖書數(shù)中確為核心圖書的百分比值,與信息檢索結(jié)果的“查準(zhǔn)率”含義相近,表示核心圖書入選的準(zhǔn)確性。
篩準(zhǔn)率指判斷為非核心圖書數(shù)中確為非核心圖書的百分比值,與信息檢索結(jié)果的“查準(zhǔn)率”含義也相近,表示非核心圖書篩選的準(zhǔn)確性。
判斷效能是總體判斷準(zhǔn)確率與入選率的比值,平衡了入選規(guī)模的影響,更能顯示判斷的準(zhǔn)確性。
4.3三種判斷途徑效能比較
比較三種判斷途徑的各個效能指標(biāo)(參見表9),可以發(fā)現(xiàn)總體判斷準(zhǔn)確率以核心著者最高,達到88.2%,核心出版社居中,達到69.9%,著作方式最低,為50.4%。
依據(jù)帕累托定律,核心圖書僅為20%左右,本研究樣本核心圖書占總數(shù)的19.9%。從入選率也可以看出,通過著作方式入選的圖書達到59.3%,通過出版社途徑入選則達到40.4%,通過著者途徑入選則為25.6%。通過著者途徑判斷入選,總量上最接近核心圖書理論分布情況。在實際采訪工作中,工作人員關(guān)注的是高價值的圖書盡量能夠收全,而剔除的圖書盡量能夠準(zhǔn)確。因此選全率和篩準(zhǔn)率的意義對于實際工作更加重要。
從表9可以看出,三種方法的選全率和篩準(zhǔn)率較高,在選全率上,最低的著作方式途徑也達到了74.1%,而在篩準(zhǔn)率上,最低的著作方式途徑達到87.3%。這表明,這三種途徑用于判斷圖書價值均具有較高的應(yīng)用價值。
比較各途徑的判斷效能,可以發(fā)現(xiàn)三種途徑從著作方式到核心出版社再到核心著者依次接近倍增。因此總體上看,可以作出核心著者途徑判斷效能最佳,核心出版社略低,著作方式較差的結(jié)論。而比較各項明細指標(biāo),也支持此結(jié)論。
總的來說,核心著者途徑入選圖書少,選全率高(84.7%),篩準(zhǔn)率高(95.9%),但由于核心著者數(shù)量較多,判斷較為復(fù)雜;核心出版社途徑入選圖書近2倍于核心圖書,選全率較高(75.6%),篩準(zhǔn)率高(91.8%),核心出版社數(shù)量大幅度少于核心著者且較為穩(wěn)定;著作方式途徑入選圖書近3倍于核心圖書,選全率(74.1%)與核心出版社途徑接近,篩準(zhǔn)率較高(87.3%),著作方式類型簡單,圖書可直接提供該信息。
5、各種預(yù)測途徑組合運用效能
在實際工作中,采訪人員并不是僅依靠一種途徑進行判斷,可以綜合運用三種途徑對圖書學(xué)術(shù)價值作出判斷。根據(jù)三種途徑的不同取值,可以組合為八種判斷途徑,依據(jù)入選圖書中核心圖書占比由高到低排列,可以得到選書途徑優(yōu)先次序,計算其累積選全率和累計入選率,見表10.可以看出,在選書的過程中,可以根據(jù)經(jīng)費或計劃采購數(shù)量,依次根據(jù)各個組合途徑選書,以獲得相對較高的選全率和較低的入選率。
前四種選書途徑匯總起來即核心著者選書途徑,該途徑可以在25.6%的選書率的基礎(chǔ)上達到84.7%的選全率,比較適合經(jīng)費較緊張的情況下采用。
前六種選書途徑匯總起來是核心著者或核心出版社選書途徑,只需兩者滿足其一即可入選,該組合在選書近半數(shù)(47.9%)的情況下達到94.2%的選全率,此途徑組合適合經(jīng)費較為充足且對選全率要求較高的情況下采用。
前七種選書途徑組合匯總起來就是三種途徑任意滿足其一即可入選,該途徑可以在選書74.7%的基礎(chǔ)上達到98.1%的選全率,此途徑組合適合經(jīng)費充足,且極為需要選全率的情況下采用。
6、結(jié)語
綜上所述,中文學(xué)術(shù)圖書的著作方式、核心出版社、核心著者均為有效的判斷圖書學(xué)術(shù)價值的途徑。其判斷效能從高到低依次為核心著者、核心出版社和著作方式。組合運用三種途徑,可以根據(jù)自身經(jīng)費情況和對高價值學(xué)術(shù)圖書選全的需求來確定組合方式。采用核心著者途徑為經(jīng)費優(yōu)先模型,適合經(jīng)費緊張情況下使用。核心著者和核心出版社任一滿足的組合方式為綜合最優(yōu)模型,經(jīng)費較充足單位采用。而核心著者、核心出版社及著作方式三者任一滿足的組合方式則為選全優(yōu)先模型,經(jīng)費十分充足情況下采用。
研究的不足及需進一步研究之處有:第一,樣本方面,由于條件所限,僅選用1995-2005年間出版的法律類圖書5962種為例,相對于每年數(shù)十萬種的圖書出版量來說無論數(shù)量還是種類的代表性上都有不足之處,需后續(xù)擴充中文社科學(xué)術(shù)圖書類別和數(shù)量來對研究結(jié)果進行驗證。第二,本研究核心出版社和核心著者界定的數(shù)據(jù)來源于圖書被引次數(shù),還可以根據(jù)圖書在圖書館的利用情況以及專家評定等進行界定,今后的研究中也可綜合上述因素進行界定。第三、由于著者群體大且需經(jīng)常更新,核心著者庫建立的難度較大,因此還需要對核心著者的界定方法和效果進行進一步的研究。著者核心期刊發(fā)文情況或者其論文被引情況也是需要考慮的變量。原載《圖書館》2016年第3期