中華經典資源庫、古漢語大語言模型等成果涌現 生僻字更易輸入
中(zhong)華經典資源庫(ku)、古漢語(yu)大語(yu)言模型等成(cheng)果涌(yong)現
生僻(pi)字更易輸入(ru) 文(wen)言文(wen)更快釋讀
“頔”寓意美好、“燊”表(biao)示(shi)熾(chi)盛、“鋆”意為(wei)金子(zi)……古(gu)籍里的這些生僻(pi)字,曾因無法輸入電腦,給文(wen)化傳承、學術研究,乃至人們日(ri)常生活(huo)帶(dai)來(lai)不便。數字時代,如何讓(rang)漢(han)語(yu)言文(wen)字更完整地活(huo)躍在“云”端?
日前,教育部圍(wei)繞推進語言文字(zi)(zi)信息化(hua)發(fa)展舉辦新聞發(fa)布會(hui)。“從‘鉛與(yu)火’到(dao)‘光與(yu)電(dian)’,中文信息處理技術不斷創新發(fa)展。”北京大(da)學王選研(yan)(yan)究(jiu)所(suo)所(suo)長(chang)湯(tang)幟介紹,北京大(da)學作為國家(jia)語委中文文字(zi)(zi)字(zi)(zi)體(ti)設(she)(she)計與(yu)研(yan)(yan)究(jiu)中心的依(yi)托單位(wei),設(she)(she)計開發(fa)國家(jia)重大(da)基礎(chu)性規范《通用規范漢字(zi)(zi)表》的配(pei)套字(zi)(zi)庫,研(yan)(yan)制(zhi)人口信息生(sheng)僻字(zi)(zi)超大(da)字(zi)(zi)庫解決方(fang)案,在第二代居民身份證、護照上應(ying)用,協(xie)助解決銀行、稅務等(deng)社會(hui)應(ying)用系統的人名(ming)、地名(ming)缺(que)字(zi)(zi)問(wen)題。
語(yu)(yu)(yu)言(yan)文(wen)字(zi)(zi)信息化(hua)是經濟社會信息化(hua)的重要組成部(bu)分,是數字(zi)(zi)中(zhong)國建(jian)(jian)設(she)的基(ji)礎(chu)性工作(zuo)。記者(zhe)了解到,近年(nian)來,教育部(bu)聯合有關部(bu)門發布了國家(jia)通用語(yu)(yu)(yu)言(yan)文(wen)字(zi)(zi)和民族語(yu)(yu)(yu)言(yan)文(wen)字(zi)(zi)信息化(hua)規范標準(zhun)100多項(xiang),推動建(jian)(jian)成國家(jia)語(yu)(yu)(yu)委(wei)媒體語(yu)(yu)(yu)言(yan)語(yu)(yu)(yu)料(liao)庫、冬奧(ao)會多語(yu)(yu)(yu)言(yan)術語(yu)(yu)(yu)庫等(deng),上線國家(jia)語(yu)(yu)(yu)言(yan)資(zi)源服務平臺、中(zhong)國語(yu)(yu)(yu)言(yan)文(wen)字(zi)(zi)數字(zi)(zi)博物館等(deng),持續推動語(yu)(yu)(yu)言(yan)文(wen)化(hua)資(zi)源共(gong)(gong)建(jian)(jian)共(gong)(gong)享。
隨著(zhu)智(zhi)慧化(hua)學(xue)習的廣泛開展,語(yu)(yu)言(yan)文化(hua)優質資(zi)(zi)源惠及更多(duo)人(ren)。教(jiao)(jiao)育部(bu)語(yu)(yu)言(yan)文字信(xin)息管理(li)司司長劉培俊介紹,為推進語(yu)(yu)教(jiao)(jiao)融合,教(jiao)(jiao)育部(bu)打造(zao)“中(zhong)華經典資(zi)(zi)源庫”,總瀏覽量超6000萬;打造(zao)“中(zhong)小學(xue)語(yu)(yu)文示范(fan)誦讀庫”,惠及全國約1.6億(yi)中(zhong)小學(xue)生和(he)上千萬教(jiao)(jiao)師(shi)及社會大眾(zhong);上線中(zhong)國語(yu)(yu)言(yan)文字數字博物(wu)館,收納海量資(zi)(zi)源,構建全民學(xue)習新課堂。
此外,數智賦能也讓國(guo)家通(tong)用語言文字推廣(guang)普(pu)(pu)及效率不斷提升。目前,普(pu)(pu)通(tong)話(hua)測(ce)試(shi)(shi)方(fang)式已實現從(cong)人(ren)工到(dao)智能的轉變,機(ji)輔(fu)測(ce)試(shi)(shi)已服務(wu)超過9200萬人(ren)次。廣(guang)東省教育(yu)廳副廳長(chang)朱(zhu)建(jian)華介紹:“我(wo)們支持研發(fa)普(pu)(pu)通(tong)話(hua)水平智能測(ce)試(shi)(shi)艙、聲紋分析系統等,打造了全國(guo)首個以智能化為(wei)核心的普(pu)(pu)通(tong)話(hua)水平測(ce)試(shi)(shi)智慧考場,能夠做到(dao)‘隨到(dao)隨考’。”
語言(yan)文字信息化讓古(gu)籍里的文字展現出(chu)(chu)新的活力。打開(kai)“AI太炎(yan)”古(gu)漢(han)語大(da)語言(yan)模型,輸入待分(fen)析的古(gu)籍文本,系統便能根據用戶選擇進(jin)行釋讀,包括字詞釋義、文白翻譯、句讀標點、用典分(fen)析等(deng)。北京師范大(da)學(xue)黨委常委、副校長康(kang)震介紹(shao),“‘AI太炎(yan)’依(yi)靠自主可(ke)控、安(an)全可(ke)信的技術(shu)(shu)路線,理解(jie)力強、準確率高,能夠高質(zhi)量完成多種文言(yan)文理解(jie)任(ren)務,目(mu)前已廣泛(fan)應(ying)用于學(xue)術(shu)(shu)科研、基礎教育、編輯出(chu)(chu)版等(deng)多個領域。”
近日,教育(yu)部、國(guo)家語委、中(zhong)央網信(xin)辦共(gong)同印發《關(guan)于加強數字中(zhong)文建設推進語言(yan)文字信(xin)息化(hua)發展的意見》。意見提(ti)出(chu)創新應用自然語言(yan)處理(li)、大語言(yan)模(mo)型(xing)、多模(mo)態信(xin)息處理(li)、知(zhi)識(shi)圖譜、語料(liao)加工等(deng)5項前沿技術。
“我們要將數字(zi)中文(wen)建設作(zuo)為全(quan)面推進語(yu)言(yan)(yan)文(wen)字(zi)信息化發展(zhan)的突出重點,服務(wu)大語(yu)言(yan)(yan)模型(xing)等人工(gong)智能技(ji)術創新應用‘制高點’,夯實(shi)國家關鍵語(yu)料基礎設施‘新基建’,全(quan)方位(wei)釋放語(yu)言(yan)(yan)文(wen)字(zi)在經濟(ji)社會發展(zhan)中的數據要素價(jia)值。”劉培俊說(shuo)。(人民日報記(ji)者 丁雅誦(song))
- 2025-04-11走入《洛神賦圖》的數字畫境
- 2025-04-11《華夏日常生活史》:走進古人生活的世界
- 2025-04-09《功名訣:左宗棠鏡像》:還原左宗棠的功名本色
- 2025-04-09《種子的隱秘之美》:在微距鏡頭下,播種希望與驚奇






