【学灯论坛&山东大学博士生高端论坛】中华书局古籍数字化与知识服务体系

发布时间:2019-07-10文章来源: 浏览次数:

【学灯论坛&山东大学博士生高端论坛】

中华书局古籍数字化与知识服务体系

 

本站讯 2019751930分,由学灯论坛组委会、517888九五至尊线路测主办的山东大学博士高端论坛“中华书局古籍数字化与知识服务体系”在电子楼404室成功举办。本次讲座主讲人为中华书局古联(北京)数字传媒科技有限公司文献编纂部主任、副编审朱翠萍。山东大学517888九五至尊线路测芮欣老师主持了讲座,山东大学517888九五至尊线路测唐鹏举老师、于京一老师、杨慧老师参与了此次活动。

首先,朱翠萍老师对中华书局的建立及其发展进行了历史性的回顾。1912年,中华民国诞生之时,近代中国教育思想家、出版家陆费逵先生抓住了时代机遇以编订新式教科书的形式和文化普及读物,在传播科学文化知识、推行新式教育方面起到了积极作用。而后中华书局迅速崛起,到 1949 年,已发展成为一家大型综合性出版社。在发展历程中,中华书局始终秉承“开启明智”的宗旨,并在时代潮流中不断探索古籍整理与应用的新形式。从1958年点校“二十四史”的古籍整理到2003年开始古籍数字化的探索,中华书局又一次在新世纪的开端紧扣住了时代的脉搏。经过十年沉淀,《中华经典古籍库》镜像版、微信版相继发布。此外,为了实现“集合所有古籍”的最高目标,中华书局于2015年成立古联(北京)数字传媒科技有限公司,在整理中华书局原有古籍的同时,也将凤凰出版社、齐鲁出版社、辽海出版社等在古籍方面有所建树的出版社的古籍集中收录起来。仅一年时间,2016年中华书局又申报了古籍数字化与知识工程重点实验室。随着产品和技术的不断成熟,2018年“籍合网”的上线,标志着中华书局古籍数字化迈向了新的阶段。

IMG_7050

接下来,朱翠萍老师向在场的同学系统介绍了古籍数字化与知识工程重点实验室的研究方向,即知识挖掘与服务。古籍的知识挖掘首先从“语料”入手,将收集的图书语料、字语料、专名语料进行整合,再经由高速扫描、OCR自动识别、人工校对、Xml编辑器、重新编修标引等古籍数字化的基本流程,最终将其发布于数据库中。流程中最为关键的是对古籍语料进行加工,古籍整理者借助WPAI文字处理与输入平台系统,对古籍语料明悉体例、审查文意、辨析字形、考证本字,然后再选定具体处理方式。由此,中华书局不断地探索知识服务的新形式,使沉默的古籍数据库焕发生机为一个大型的“活的图书馆”。

“籍合网”作为中华书局古籍数字化的门户网站,承担着古籍整理与古籍发布的双重任务,它以颇具创新的方式将国内外的文史爱好者聚集起来,形成一个古籍圈,并通过籍合网的“古籍整理众包”板块进行整理工作的发布与认领,使人才聚合起来共同致力于古籍整理。除此之外,籍合网以用户为导向,对古籍资源进行了系统化的管理。此外,朱翠平老师还着重介绍了目前中华书局已经研发完成的若干可供学术征引的数据库,如:《中华古籍书目数据库》、《中华文史工具书数据库》、《西南联大专题数据库》、《民国期刊全文数据库》、《宋代墓志铭数据库》等,这些重要的数据库资源为学术研究提供了基本、重要、坚实的文献资料基础,使专业研究者可以充分借助现代技术进行有目的性的资料检索与收集。除此之外,朱翠平老师还介绍:针对广大传统文化的爱好者,中华书局还发布了《籍合文库》等普及性数据库,并开发了以文化休闲为导向的《句读》、《北京好诗词》、《老北京旅游指南》等微信小程序,这些资源也从知识普泛性的角度对专业人文研究者提出了更高的要求。

IMG_7059

在对各类数据库进行了具体翔实的介绍之后,朱翠萍老师对籍合网资源的应用价值进行了说明。首先,与传统古籍数据库相比,中华经典古籍库拥有对古籍整理本的分析预判,并且在复制时引文出处信息将自动生成,这大幅度地提升了文献检索的效率。其次,籍合网资源具有高质量、完整性等特点,而明确的版本信息、翔实的前言说明、以及专家学者的权威注释与校勘,都为具体规范的学术研究带来了内容上的增益。最后,籍合网古籍整理与发布的双重功能为研究者提供了一站式的综合检索。

在最后的提问环节,朱翠萍老师针对同学们提出的如何参与古籍整理的问题进行了具体的操作演示,并为现当代文学专业同学的研究方向推荐了与之相关的资源库。两个多小时的讲座中,朱翠萍老师以缜密的逻辑和翔实的内容向在场同学清晰展示了中华书局古籍数字化与知识服务体系的发展之路,更让同学们感受到网络时代下数据库资源建设背后人文学者整理、研究文献的艰辛与严谨。

 

 

                                          文:邓福燕    图:崔佳雯

【关闭】 【打印】    责任编辑:曲敏         作者:;