從圖書館“搬”到網絡平臺 數字技術讓古籍“觸手可及”
輸入網(wang)址、輕點鼠標,儒家(jia)經典《論語》可逐(zhu)頁在線(xian)閱覽,飄逸(yi)俊(jun)秀的漢隸代表作《曹全碑》書(shu)法躍(yue)然眼前,古(gu)籍還能實現繁體字和(he)簡體字轉換等功能,讓讀者能查詢、會閱讀。專家(jia)認為,中華(hua)古(gu)籍浩(hao)如(ru)煙海,對珍貴古(gu)籍進行保護(hu)、修復(fu)和(he)活用,關乎中華(hua)文脈(mo)的延續(xu)和(he)傳承(cheng)。隨著數字技(ji)術不斷成熟,古(gu)籍正走出“深閨(gui)高(gao)閣(ge)”,資源會得(de)到更有效(xiao)利用。
從圖書館“搬”到網絡平臺
點(dian)擊瀏(liu)覽器,進(jin)入一(yi)個名(ming)為(wei)“識(shi)典古(gu)籍”的網站,記者看到《周易》《左傳(chuan)》《禮記》等典籍陳(chen)列在首頁上(shang)。隨機點(dian)開一(yi)本,左側為(wei)章(zhang)節(jie)目錄,右(you)側為(wei)正文,排版形式既符合現代人的閱(yue)(yue)讀(du)(du)習慣,又還原了古(gu)籍紙(zhi)張的閱(yue)(yue)讀(du)(du)美感(gan)。
這(zhe)是北京大學數字人文(wen)研究中心與(yu)字節跳動合作研發的一個(ge)數字古(gu)籍平臺,自去年10月(yue)發布以(yi)來,已(yi)上線古(gu)籍1200余部,免(mian)費供公眾(zhong)瀏(liu)覽(lan)。
與一些數(shu)字化平(ping)(ping)臺(tai)僅提(ti)供古籍影像不(bu)同,點擊該(gai)(gai)平(ping)(ping)臺(tai)的(de)功能(neng)按鈕(niu),還能(neng)實現簡繁體轉換(huan)、圖文對照、全文檢索、支持移動(dong)端等(deng)服務。北京(jing)大學人(ren)工智能(neng)研(yan)(yan)究(jiu)院副研(yan)(yan)究(jiu)員(yuan)楊(yang)浩介(jie)紹,該(gai)(gai)平(ping)(ping)臺(tai)應(ying)用了文字識別、自(zi)動(dong)標(biao)點等(deng)技術,不(bu)僅將影印本上的(de)文字提(ti)取整理,還可(ke)以標(biao)記文本中的(de)人(ren)名(ming)、地名(ming)等(deng)信息。“我們利用人(ren)工智能(neng)技術,將古籍由以前的(de)圖像加工成可(ke)檢索的(de)文本與數(shu)據(ju),方(fang)便研(yan)(yan)究(jiu)者、用戶直接閱讀。”
隨著數(shu)字技術不斷成(cheng)熟,科技賦(fu)能古(gu)籍(ji)工作取(qu)得可(ke)(ke)喜進展。國家(jia)圖書(shu)(shu)館公布的(de)(de)數(shu)據(ju)顯示,全國已累(lei)計在線發布古(gu)籍(ji)數(shu)字資(zi)源(yuan)13萬部(件)。打開《永樂(le)大(da)(da)(da)典》高清(qing)(qing)影像(xiang)數(shu)據(ju)庫(第一輯),讀者(zhe)能瀏覽到國家(jia)圖書(shu)(shu)館館藏(zang)的(de)(de)《永樂(le)大(da)(da)(da)典》40冊(ce)、75卷的(de)(de)高清(qing)(qing)圖像(xiang)及(ji)相關(guan)知識;浙江大(da)(da)(da)學打造的(de)(de)“智慧古(gu)籍(ji)平臺(tai)”可(ke)(ke)在線查(cha)閱數(shu)萬篇古(gu)籍(ji),還(huan)有著者(zhe)小傳、人物(wu)行跡及(ji)社會(hui)網絡關(guan)系圖等(deng)延伸信息。
這(zhe)些古(gu)籍(ji)是怎樣從(cong)圖(tu)書館(guan)庫(ku)房“搬”到網絡平臺的(de)(de)?楊浩(hao)介紹,古(gu)籍(ji)數字(zi)化(hua)過(guo)程分(fen)為(wei)兩步。首先將古(gu)籍(ji)進(jin)行掃描。古(gu)籍(ji)掃描使(shi)用(yong)(yong)專用(yong)(yong)非(fei)接觸式掃描儀(yi),通(tong)過(guo)高像素(su)照相機,盡量不按壓(ya)古(gu)籍(ji)頁面進(jin)行拍照;采用(yong)(yong)的(de)(de)光(guang)源是防紫外線的(de)(de)LED燈冷光(guang)源,減少對古(gu)籍(ji)的(de)(de)損害。其(qi)次(ci)是對圖(tu)像做數據(ju)化(hua)處(chu)理,利用(yong)(yong)人工智能技術對文字(zi)進(jin)行識別,對標(biao)點、實體(ti)等進(jin)行標(biao)引,方便讀者閱(yue)讀與檢索。
減少人(ren)(ren)工(gong)智能識別(bie)錯誤率也很重(zhong)要。字(zi)節跳(tiao)動公益古籍(ji)(ji)項目相關負責人(ren)(ren)說,具有中(zhong)文、歷史等專業知(zhi)識并(bing)對古籍(ji)(ji)感(gan)興趣(qu)的(de)員工(gong),自發成立(li)2600人(ren)(ren)的(de)志愿(yuan)者團隊(dui),參與古籍(ji)(ji)校對工(gong)作。
方便讀者獲取資源
“作為(wei)再生(sheng)性保(bao)護的(de)(de)(de)重要手段,古(gu)籍(ji)(ji)(ji)數(shu)字化及其平臺(tai)建設意(yi)義重大(da)。”北(bei)京大(da)學數(shu)字人文中心主(zhu)任王軍(jun)認(ren)為(wei),古(gu)籍(ji)(ji)(ji)數(shu)字化可(ke)以很好地解決古(gu)籍(ji)(ji)(ji)保(bao)護與利用之間(jian)的(de)(de)(de)矛盾。傳(chuan)統上,人們要利用古(gu)籍(ji)(ji)(ji),必須直接(jie)(jie)接(jie)(jie)觸(chu)書籍(ji)(ji)(ji),這可(ke)能(neng)導致書籍(ji)(ji)(ji)受到(dao)進一(yi)步磨損(sun),且只能(neng)在特定的(de)(de)(de)圖書館或(huo)機構中閱讀(du)。通過(guo)數(shu)字化,不僅(jin)能(neng)減少(shao)對古(gu)籍(ji)(ji)(ji)的(de)(de)(de)物理損(sun)害,還方便讀(du)者隨時隨地獲取這些資源。
近年來,古(gu)(gu)籍(ji)(ji)(ji)數字(zi)化和平(ping)臺建設進(jin)展(zhan)很快。國家圖(tu)書(shu)館搭建的(de)“中華古(gu)(gu)籍(ji)(ji)(ji)資源(yuan)庫”已成為全國古(gu)(gu)籍(ji)(ji)(ji)資源(yuan)類型(xing)和品(pin)種最(zui)多(duo)(duo)、體(ti)量最(zui)大的(de)綜(zong)合性資源(yuan)共享發布(bu)(bu)平(ping)臺。中華書(shu)局的(de)“中華經典古(gu)(gu)籍(ji)(ji)(ji)庫”已發布(bu)(bu)6000多(duo)(duo)種、15億字(zi)的(de)點校本古(gu)(gu)籍(ji)(ji)(ji)。一些地方還打造了整(zheng)理少數民(min)(min)族古(gu)(gu)籍(ji)(ji)(ji)的(de)數字(zi)平(ping)臺,如“廣西(xi)古(gu)(gu)籍(ji)(ji)(ji)文庫”目(mu)前共收錄(lu)100多(duo)(duo)部古(gu)(gu)壯族文字(zi)古(gu)(gu)籍(ji)(ji)(ji)底本和近千份(fen)民(min)(min)族地區文書(shu)等資源(yuan)。
不過,古籍數(shu)字(zi)化工(gong)作(zuo)依然任(ren)重道遠。業(ye)內人士指出,中(zhong)國現存古籍中(zhong),只有(you)少部(bu)分(fen)被拍攝(she)成圖像資料,而(er)大(da)部(bu)分(fen)未實現文本數(shu)字(zi)化。此外,大(da)量古籍分(fen)散(san)收藏在各個圖書館或(huo)收錄于不同的數(shu)據庫,難以進行(xing)高效(xiao)檢索(suo)、關(guan)聯閱讀和深(shen)度挖掘(jue)與(yu)利用。
如何(he)將這些散落的古籍整合起來?6月初,一個旨在(zai)對2.5萬種古籍進行數字化(hua)整理的古籍智慧圖書館(guan)項(xiang)目啟動。該(gai)項(xiang)目到2025年底(di),將實現國家圖書館(guan)等館(guan)藏古籍數字化(hua),并為人們提供公益性閱讀服(fu)務。
短視頻再現古籍里的美食
“沒想到古籍這(zhe)么‘香’。”在看(kan)完系列短視頻(pin)(pin)《食(shi)(shi)光機(ji)·隨園私房菜(cai)》后,有網友(you)留(liu)言說。該短視頻(pin)(pin)由南(nan)京圖書館歷史文(wen)獻研究館研究員史星宇和韓超制(zhi)作,他們(men)按照清代文(wen)學家袁枚寫的《隨園食(shi)(shi)單(dan)》,再(zai)現(xian)古籍里的美食(shi)(shi),吸引不少(shao)人觀看(kan)。
“為了(le)更好地呈現《隨園食單》中的菜品,我們結合歷史和古代文學等相關學科背景,對(dui)原文文本一起推敲斟酌,在烹飪(ren)上反復試驗,同時(shi)盡(jin)量還(huan)原書(shu)中的烹飪(ren)手法,保證菜品的原汁(zhi)原味。”韓超說。
如何讓數字化(hua)的(de)古籍(ji)和人們更(geng)親(qin)近呢?這考驗著文(wen)保機構(gou)、科研院(yuan)校與互聯網公司等相關從業者的(de)創新(xin)能力。如紀錄(lu)片《古籍(ji)尋(xun)游記》運用(yong)交互技(ji)(ji)術、掃描技(ji)(ji)術等,讓用(yong)戶以更(geng)沉浸的(de)方式體驗甲(jia)骨文(wen)刻字、建造敦煌莫高窟(ku)的(de)過程。
王(wang)軍認為,在古(gu)籍(ji)數(shu)字化(hua)、活化(hua)過程中(zhong),人文社科學(xue)者要積(ji)極介入,并加強(qiang)與(yu)技術(shu)(shu)人員合(he)作(zuo);高校古(gu)典文獻學(xue)等相關(guan)專(zhuan)業應培養兼(jian)具技術(shu)(shu)與(yu)學(xue)術(shu)(shu)能力的復合(he)型(xing)人才,部分(fen)古(gu)籍(ji)內容應向著“數(shu)字文創”轉化(hua),讓(rang)古(gu)籍(ji)更好(hao)地(di)走進千家萬(wan)戶。
彭訓文
- 2023-07-11童年記憶里的小人書如今什么樣
- 2023-07-06為青少年提供更多更好精神食糧
- 2023-07-06以新的視野打量傳統文學經典
- 2023-07-05以“當代之筆”賡續中華文脈






