精品一二三区久久aaa片,无码国产乱人伦偷精品视频,国产成人无码A片V99,精品国内自产拍在线观看视频,毛阿敏性做爰A片免费看

您當前的位置 : 中國甘肅網 >> 書香隴原 >> 熱點資訊

數字化,讓古籍觸手可及

2024-01-11 09:13 來源:人民日報

   原標題:匯集《永樂大典》等2200余部古籍,“識典古籍”平臺——  數字化,讓古籍觸手可及(護文化遺產 彰時代新義)

  以上圖片均為“識典古籍”平臺網頁截圖。制圖:張(zhang)芳曼

    核心閱讀

    我國現(xian)存(cun)古籍(ji)約有20萬種,修復整理現(xian)存(cun)的(de)全(quan)部(bu)古籍(ji),可能需要300余年。古籍(ji)數(shu)字化迫在(zai)眉(mei)睫。一(yi)本古籍(ji),如何從紙頁“搬”到網頁?廣泛(fan)收集(ji)圖像資料、利用現(xian)代技術精細(xi)化處(chu)理……自(zi)2022年10月上線以(yi)來(lai),“識典古籍(ji)”平臺已陸續匯(hui)集(ji)經、史、子、集(ji)等2200余部(bu)古籍(ji),免費面向公眾開放(fang),為解(jie)決古籍(ji)保護和利用矛盾進行了(le)有益嘗試(shi)。

    “青蒿(hao)一握,以水二(er)升漬,絞取汁(zhi),盡服之(zhi)”,屠呦呦從古籍(ji)中(zhong)獲得靈感(gan),由(you)此(ci)發現青蒿(hao)素;在浩瀚古籍(ji)中(zhong)尋幽入(ru)微(wei),竺可(ke)楨繪制(zhi)出一條物候變遷的(de)曲線(xian)——“竺可(ke)楨曲線(xian)”,濃縮出五千年中(zhong)華大地的(de)冷暖變化圖景。

    卷帙(zhi)浩繁的(de)中(zhong)華古籍(ji),凝(ning)結著先人的(de)智慧(hui),記載著璀璨的(de)文化(hua),訴說著綿延(yan)不絕的(de)中(zhong)華文明(ming)。歲月(yue)不居(ju),書闕有間,部(bu)分古籍(ji)正(zheng)慢慢“老(lao)去”,褪色、脆(cui)化(hua)、腐(fu)蝕,甚至稍一(yi)翻閱就會損毀。

    當(dang)古老典籍遇到現代技術(shu),會產生(sheng)什么奇妙反應?

    一種“打開”古籍的全新方式

    “初見”“流(liu)光(guang)”“驚鴻”“珠聯”“綴(zhui)玉”……點擊網頁上的(de)標簽(qian),《永樂大典》的(de)前世今生、編纂方(fang)法、歷史(shi)價值(zhi)等信息,伴(ban)隨著動畫音(yin)效,呈現(xian)于眼前。

    點(dian)擊頁(ye)面右上(shang)角“閱讀大典(dian)”,進入文本閱讀平臺。《永樂大典(dian)》原本影像(xiang)與數字化文本相互對照,繁簡(jian)體文字隨時切換。遇生(sheng)僻詞(ci)句,可選中文本,點(dian)擊“查看引用(yong)”,出處清晰(xi)可考。

    《永樂大(da)(da)典(dian)》是我國古(gu)代規模最(zui)大(da)(da)的(de)類書(shu),匯集先秦至明(ming)初各類典(dian)籍(ji),被譽為“世界有史(shi)以(yi)來(lai)最(zui)大(da)(da)的(de)百(bai)科(ke)全書(shu)”。但幾經(jing)散(san)佚(yi),副本存世不及原書(shu)的(de)4%。對學者而言,《永樂大(da)(da)典(dian)》是進(jin)行學術研(yan)究的(de)重要資料;對普通讀(du)者來(lai)說,古(gu)籍(ji)文(wen)本往(wang)往(wang)艱(jian)澀難(nan)懂,且接觸機會不多。

    如今,《永(yong)樂大典(dian)》高清影像數據庫(第一輯(ji))在古籍(ji)數字化平臺“識(shi)典(dian)古籍(ji)”正式上線,免費面向公眾開放。借助(zhu)現(xian)代數字技術,厚重典(dian)籍(ji)濃(nong)縮在方寸之間,塵(chen)封已久的歷史(shi)畫卷徐徐展開,成為觸手可及的文(wen)化資(zi)源(yuan)。

    “互動(dong)化、可(ke)視化的(de)呈現方式(shi)更加符合當代人的(de)閱讀(du)(du)習慣,沉(chen)浸式(shi)閱讀(du)(du)體驗拉近了古籍與普(pu)通(tong)讀(du)(du)者之(zhi)間的(de)距(ju)離。”“識典(dian)古籍”平臺項目(mu)負責人之(zhi)一(yi)、北京大學信息管理(li)系助理(li)教(jiao)授位通(tong)說(shuo)。

    自(zi)2022年(nian)10月(yue)上線以來,“識典古(gu)籍”平臺已陸續匯集經(jing)、史、子、集等2200余部古(gu)籍,面向海內外讀(du)者(zhe)免費(fei)開放。該平臺由北(bei)京大學與抖音(yin)合作共建,致力(li)于為用戶提(ti)供免費(fei)、公開、穩定、快速(su)、方(fang)便的檢(jian)索和閱讀(du)古(gu)籍服(fu)務。

    “識(shi)典(dian)古(gu)籍(ji)(ji)”平臺(tai)項(xiang)目負責(ze)人、北京大學數字人文研究中心(xin)主任王軍希望(wang),“識(shi)典(dian)古(gu)籍(ji)(ji)”平臺(tai)能(neng)推(tui)動散落海外的中華(hua)古(gu)籍(ji)(ji)回流(liu),促成古(gu)籍(ji)(ji)的開放共(gong)享。

    一次解決保護和利用矛盾的嘗試

    古籍數字化為何迫切?

    王軍算過(guo)一(yi)筆賬:我國現(xian)存古(gu)籍約有20萬種,從(cong)1949年到2019年,共修復(fu)整理出版(ban)了近3.8萬種,修復(fu)整理現(xian)存的全部(bu)古(gu)籍,可能(neng)需要300余年。可以說,古(gu)籍修復(fu)速(su)度趕(gan)不上老化速(su)度。

    修(xiu)復(fu)整理,只(zhi)是(shi)數字化(hua)的(de)第一步。古(gu)籍具(ju)有文(wen)物和文(wen)獻的(de)雙(shuang)重(zhong)屬(shu)性(xing),修(xiu)復(fu)好(hao)的(de)古(gu)籍若只(zhi)被束之高(gao)閣,后續(xu)研究就無法開展,更(geng)無法發揮其文(wen)化(hua)傳承的(de)價值。

    因此,數(shu)字化是一場生產(chan)效率的變(bian)革(ge),也是一次解決(jue)古籍保護(hu)和(he)利(li)用矛盾的嘗試。

    一本古籍,如何從紙頁“搬”到網頁?

    進(jin)入“識典古(gu)籍(ji)(ji)(ji)”平臺,平臺設計者、北京大(da)學人工(gong)智(zhi)能研究院副(fu)研究員楊浩開始(shi)演示:“古(gu)籍(ji)(ji)(ji)的數字(zi)化分為(wei)兩(liang)步。一是圖像化,我們與(yu)海內外古(gu)籍(ji)(ji)(ji)收藏(zang)單位合(he)作,廣泛收集古(gu)籍(ji)(ji)(ji)數字(zi)化圖像資料(liao)。二是文本化,利(li)用人工(gong)智(zhi)能技術對古(gu)籍(ji)(ji)(ji)文字(zi)進(jin)行識別(bie)(bie)、排序、校對、結構整理、標點、實體識別(bie)(bie)等,對內容作精(jing)細(xi)化處理。”

    楊浩上傳了一頁(ye)古(gu)(gu)籍圖(tu)像,不(bu)一會兒,文字自動識別處(chu)理完成。古(gu)(gu)籍圖(tu)像上顯現出不(bu)同顏色的(de)小方框(kuang),“每個方框(kuang)對應一個文字,先(xian)切分再調(diao)整(zheng)順(shun)序。紅色方框(kuang)是提(ti)醒此處(chu)需要(yao)人工(gong)介(jie)入,來進一步判(pan)斷(duan)和處(chu)理。”

    與此同時,古(gu)籍圖(tu)(tu)像旁已自(zi)(zi)動(dong)(dong)識(shi)(shi)(shi)(shi)別(bie)出一段文(wen)字(zi),并可比(bi)照原圖(tu)(tu)像進(jin)行修改調整。楊浩繼(ji)續解釋:“這(zhe)個過程中(zhong)(zhong),主要(yao)使(shi)用(yong)了文(wen)字(zi)識(shi)(shi)(shi)(shi)別(bie)、自(zi)(zi)動(dong)(dong)標(biao)點和(he)命名(ming)實(shi)體識(shi)(shi)(shi)(shi)別(bie)等人工智能技(ji)(ji)術。文(wen)字(zi)識(shi)(shi)(shi)(shi)別(bie)技(ji)(ji)術,是(shi)對古(gu)籍數字(zi)圖(tu)(tu)像中(zhong)(zhong)的(de)文(wen)字(zi)進(jin)行單(dan)個切(qie)分,再進(jin)行文(wen)字(zi)識(shi)(shi)(shi)(shi)別(bie)和(he)順序讀出;自(zi)(zi)動(dong)(dong)標(biao)點技(ji)(ji)術,是(shi)通過序列標(biao)注(zhu)的(de)方式對古(gu)籍自(zi)(zi)動(dong)(dong)進(jin)行現代標(biao)點;命名(ming)實(shi)體識(shi)(shi)(shi)(shi)別(bie)技(ji)(ji)術,則(ze)是(shi)通過序列標(biao)注(zhu)方法識(shi)(shi)(shi)(shi)別(bie)出文(wen)本中(zhong)(zhong)的(de)人名(ming)、地名(ming)、書名(ming)、時間、官職等信(xin)息(xi)。”同時,在機(ji)器自(zi)(zi)動(dong)(dong)識(shi)(shi)(shi)(shi)別(bie)后,會有(you)專(zhuan)人復(fu)查結果(guo),進(jin)一步提(ti)升準確率。

    據悉,“識典古籍”平臺(tai)文字識別(bie)的(de)準(zhun)確率(lv)達到(dao)(dao)96%以上,自動句(ju)讀的(de)準(zhun)確率(lv)達到(dao)(dao)94%,命名實體識別(bie)在(zai)中古史料上的(de)準(zhun)確率(lv)接近98%。

    “大(da)部分古籍閱讀平臺或只提供掃描文稿,或只提供文本內容,有些商業數據庫(ku)收(shou)費(fei)高昂(ang),獲取資源十分不便。”北京(jing)大(da)學(xue)歷(li)史學(xue)系學(xue)生(sheng)劉沐(mu)含說,“識典古籍”平臺有著(zhu)豐富的檢索功(gong)能以及分類(lei)與年(nian)代篩選功(gong)能,可以輔助開展學(xue)術研究(jiu)。

    一個全流程的智能化整理平臺

    集納展示古(gu)籍數字版本,不是“識典古(gu)籍”平臺的(de)(de)(de)全部(bu)。團隊有(you)著更大的(de)(de)(de)設想——在一(yi)個平臺實現古(gu)籍智能整理的(de)(de)(de)全部(bu)環節。

    “‘識典古籍’平臺由(you)兩部(bu)分組(zu)成,前端(duan)是(shi)閱(yue)讀平臺,后(hou)端(duan)是(shi)古籍整理平臺。”王軍(jun)作了一個比(bi)喻,“就像是(shi)餐廳(ting)的前廳(ting)和后(hou)廚。”

    目(mu)前,作為“后(hou)廚”的(de)古籍整理平臺(tai),已經設定了團隊管理員(yuan)(yuan)(yuan)、書目(mu)管理員(yuan)(yuan)(yuan)、審(shen)訂員(yuan)(yuan)(yuan)、整理員(yuan)(yuan)(yuan)等各(ge)(ge)種用戶角色。下一步(bu),將吸引各(ge)(ge)行各(ge)(ge)業的(de)古籍愛好者、研究者,以眾包校對、協同(tong)審(shen)核等形式,推進(jin)古籍整理項目(mu)和數據庫建設,打(da)造“古籍圖像上傳—文(wen)本校對整理—高質量(liang)標記—文(wen)本輸出”的(de)全流(liu)程系統。

    哈(ha)爾濱師范大學(xue)歷(li)史(shi)文化學(xue)院學(xue)生(sheng)劉鈺昕,提前體驗了一回“整理(li)員”角色。

    “希望能為損毀(hui)嚴重的古籍(ji)做點力所能及的事情。”2022年(nian)4月,看到北大數字人文(wen)研究中心的招募信息,劉鈺昕第(di)一(yi)時間(jian)報(bao)名,成為“識典古籍(ji)”平臺的一(yi)名志愿者。

    “我參與了《春秋左傳注(zhu)》《史記(ji)》《漢書》等古籍的校(xiao)對工作。”談及志(zhi)愿(yuan)工作,劉鈺昕的熱愛之情溢于言表,“印象最深的就是,為了制定魏晉(jin)南北(bei)朝官職標注(zhu)規則,我查(cha)閱(yue)了大量的文獻,還詳細翻(fan)閱(yue)了《文獻通考》的‘職官考’二十一(yi)考。”

    “新時代(dai)古(gu)籍事業發展(zhan),需要(yao)一批(pi)對古(gu)典文獻學(xue)、古(gu)籍保護、信息技術(shu)以(yi)及數字化流程(cheng)都(dou)比較熟悉,又能將各方面有(you)機融合的(de)復合型人(ren)才(cai)。”北京大學(xue)中文系教授楊(yang)海崢建(jian)議,應加強(qiang)古(gu)籍學(xue)科理論構建(jian)和課程(cheng)體(ti)系建(jian)設,編寫適合新時代(dai)古(gu)籍工作(zuo)需要(yao)的(de)專業教材,并多為學(xue)生提供(gong)實踐(jian)機會,以(yi)推進新時代(dai)古(gu)籍人(ren)才(cai)隊伍建(jian)設。

    “古(gu)籍(ji)是中(zhong)(zhong)華文明(ming)延續數(shu)千年未曾中(zhong)(zhong)斷的有力證明(ming),希望通過‘識典古(gu)籍(ji)’平臺以及暑期工作(zuo)坊、學術(shu)研討(tao)等活動(dong),推動(dong)中(zhong)(zhong)華文明(ming)傳承(cheng)發(fa)展,向世界(jie)展示和(he)傳播我們的文化之美。”王軍說。

    新(xin)年(nian)伊始,楊浩寫(xie)下(xia)了(le)新(xin)的展望(wang):

    “泱(yang)泱(yang)中華,歷(li)史何(he)其悠(you)久,文(wen)明何(he)其博大。2024年,希(xi)望能收集(ji)更(geng)多古(gu)籍(ji)(ji)、提升整理質量,更(geng)好(hao)守護(hu)古(gu)籍(ji)(ji)這個(ge)文(wen)明之根!”

    (厲 燁參與采寫)

版權聲明:凡注有稿件來源為“中國甘肅網”的稿件,均為中國甘肅網版權稿件,轉載必須注明來源為“中國甘肅網”。

西北角西北角
中國甘肅網微信中(zhong)國甘肅網微信
中國甘肅網微博中國甘肅網微博
微博甘肅微博甘肅
學習強國學(xue)習強國
今日頭條號今日(ri)頭(tou)條號

  • 01/10
  • 01/03
  • 12/29
  • 12/29
  • 12/28

分享到