南京圖書館歷史文獻部主任陳立詳解—— 古籍的數字化“旅程”
瀏(liu)覽“江蘇省珍貴古籍數(shu)字(zi)資源集成平(ping)臺”,如同漫步(bu)在歷史長卷(juan)中。《投筆(bi)集一(yi)卷(juan)》《憺園文(wen)(wen)集三(san)十六(liu)卷(juan)》等(deng)文(wen)(wen)集有序(xu)排(pai)列在電子書架(jia)上,點開一(yi)看(kan),古樸(pu)厚重的(de)線裝(zhuang)書一(yi)頁一(yi)頁、圖文(wen)(wen)并(bing)茂地呈(cheng)現在眼前。
近(jin)日(ri),南(nan)京圖書館“清人文(wen)集數據(ju)庫”上線。作為“江(jiang)蘇省(sheng)珍貴古籍(ji)全(quan)文(wen)影像數據(ju)庫”項目(mu)第一(yi)期成果,該(gai)平臺(tai)目(mu)前共收(shou)錄清人文(wen)集400部,以(yi)全(quan)本彩色掃描的方式制作成13萬余幅(fu)高像素數字(zi)圖像,并帶有(you)檢索功(gong)能,在全(quan)網發布。
“南(nan)京(jing)(jing)圖(tu)(tu)書館館藏(zang)的清刻本(ben)有(you)7萬多(duo)冊(ce),其(qi)中(zhong)不(bu)少是(shi)清人文(wen)(wen)集(ji)。”南(nan)京(jing)(jing)圖(tu)(tu)書館歷史(shi)文(wen)(wen)獻部(bu)主(zhu)(zhu)任(ren)、江(jiang)蘇(su)省古籍保護中(zhong)心副(fu)主(zhu)(zhu)任(ren)陳立說,本(ben)次南(nan)京(jing)(jing)圖(tu)(tu)書館發布的數據(ju)庫,便是(shi)結合館藏(zang)優勢(shi),以圖(tu)(tu)像(xiang)數據(ju)庫形式,集(ji)中(zhong)公布了(le)一批具(ju)有(you)相同主(zhu)(zhu)題的珍貴(gui)文(wen)(wen)獻。值得一提的是(shi),這其(qi)中(zhong)有(you)許多(duo)“罕見(jian)”文(wen)(wen)獻,甚至有(you)些還是(shi)僅存“孤本(ben)”。陳立介紹,例如嘉慶時期刻本(ben)吳俊《榮性(xing)堂(tang)詩集(ji)》、潘奕雋《三松堂(tang)集(ji)》等,都是(shi)存世較少的清人文(wen)(wen)集(ji)。
這些古籍(ji)是(shi)怎樣從(cong)圖(tu)書館庫(ku)房被“搬”到網絡平(ping)臺的呢?
陳立(li)介紹(shao),古(gu)籍數字化過程(cheng)分為兩步。首(shou)先,要將古(gu)籍進(jin)行(xing)掃描。古(gu)籍掃描使用(yong)專用(yong)非接觸(chu)式掃描儀,通過高像素照相機(ji),盡(jin)量不(bu)按(an)壓古(gu)籍頁(ye)面進(jin)行(xing)拍照;采(cai)用(yong)的光(guang)源(yuan)是防紫(zi)外(wai)線(xian)的LED燈冷光(guang)源(yuan),圖(tu)片顏色不(bu)能失真,要用(yong)色卡比(bi)對。
掃(sao)描完(wan)成后,就要對這些原汁原味(wei)的(de)圖像做數據化處理,做至少(shao)深入到(dao)(dao)第二層級的(de)標引(yin),方便使用者按(an)子目(mu)檢閱相關內容(rong)。記者看到(dao)(dao),每種文獻的(de)序(xu)和跋都進行(xing)了單獨(du)標引(yin),通過檢索可以單獨(du)搜(sou)索出來。“古籍的(de)序(xu)和跋中(zhong)不(bu)乏名家作品,具有較強的(de)文學和研究(jiu)價值,如(ru)《莫愁(chou)湖風(feng)雅集》中(zhong)就有姚(yao)鼐作的(de)序(xu)。”陳立介紹。
平臺(tai)的開(kai)發建設也至關(guan)重要。一方面(mian)(mian),要完整、全面(mian)(mian)地(di)給古(gu)(gu)籍“搬(ban)家”,還要方便、快(kuai)捷地(di)幫助(zhu)使用者找到(dao)相應內容;另一方面(mian)(mian),還要給后續發布的方志、家譜等多(duo)種類型的古(gu)(gu)籍文(wen)獻“搬(ban)家”預留接(jie)口。
古(gu)籍數(shu)字化的(de)最大挑戰,一是專業知(zhi)識,二是技(ji)術。“從事這項(xiang)工作,需(xu)要懂歷史學(xue)(xue)、文獻(xian)學(xue)(xue)、目錄學(xue)(xue)等的(de)復(fu)合型人才,還要有甘坐冷板(ban)凳的(de)精神。”陳立(li)坦(tan)言,南京圖書館(guan)對古(gu)籍文獻(xian)進行掃描的(de)工作從15年前就開始了,數(shu)字標引小組也在(zai)4年前啟動(dong)。正因為有這些基礎準備(bei),“清人文集數(shu)據庫”才能在(zai)近(jin)期與讀者見面。
不過,古籍數(shu)字化到這一步(bu)還沒有結(jie)束。陳立介(jie)紹,古籍數(shu)字化的(de)2.0版,將為(wei)古籍愛好者(zhe)梳理浩如煙海的(de)文(wen)字背后的(de)知識邏輯(ji)順(shun)序,制(zhi)作專(zhuan)題知識圖(tu)譜型數(shu)據(ju)庫,甚(shen)至可將部分書中(zhong)內容制(zhi)作成(cheng)“數(shu)字文(wen)創(chuang)”,讓曾經束之(zhi)高閣的(de)古籍更好走(zou)進千家萬(wan)戶。
- 2023-01-28文學跨界,“格局打開了” 多元傳播中的文學更有力
- 2023-01-28梁曉聲:視文學為動態河流,更在乎影響世道人心
- 2023-01-28社長總編來薦書|江西出版集團副總經理周建森推薦:《蘇軾傳》
- 2023-01-28社長總編來薦書|華文出版社社長包巖推薦:《遼寧傳》
西北角
中國甘(gan)肅網(wang)微信(xin)
微(wei)博甘(gan)肅
學(xue)習強國
今(jin)日頭條(tiao)號(hao)




