探访文溯阁《四库全书》数字化影印出版工程(人民眼·让文物活起来③)

发布时间:2024-06-19 02:04:53 来源: sp20240619

  图①:读者古籍数字科技中心工作人员对文溯阁《四库全书》数字化文件进行质检。   本报记者 王锦涛摄   图②:甘肃省图书馆依托文溯阁《四库全书》开发的文创产品。   图③:甘肃省图书馆文溯阁《四库全书》藏书馆工作人员巡查书库。   图②③均为甘肃省图书馆提供   图④:甘肃省图书馆文溯阁《四库全书》藏书馆主楼。   本报记者 王锦涛摄

  引 子

  登临兰州北山九州台,甘肃省图书馆文溯阁《四库全书》藏书馆跃入眼帘——馆楼飞檐翘角,踞北山而瞰黄河。

  自正门入楼,穿鞋套,做登记,进书库。书库恒温恒湿,1128个香樟木书箱层层叠叠,收录典籍6141函、3474种、36315册的文溯阁《四库全书》就安放于箱中。

  2023年6月,习近平总书记在中国国家版本馆中央总馆考察调研时,详细听取《四库全书》版本源流、纸张印刷、保护收藏等介绍,叮嘱工作人员:“我最关心的就是中华文明历经沧桑留下的最宝贵的东西。中华民族的一些典籍在岁月侵蚀中已经失去了不少,留下来的这些瑰宝一定要千方百计呵护好、珍惜好,把我们这个世界上唯一没有中断的文明继续传承下去。”

  《四库全书》编纂于清代乾隆年间,是我国历史上规模最大的丛书,修成后誊抄7部,分藏于紫禁城文渊阁、圆明园文源阁、盛京(今沈阳)文溯阁、承德避暑山庄文津阁、杭州文澜阁等地。目前存世三部半,分别为文渊阁本、文溯阁本、文津阁本,以及被称为“半部”的文澜阁残本。其中,文溯阁本辗转多地,于2006年入藏现在的藏书馆,也是“三部半”中唯一尚未完整影印出版的一部。

  为了让书写在古籍里的文字活起来,经过长期缜密的筹划论证,2021年8月,甘肃省正式启动文溯阁《四库全书》数字化影印出版工程。

  目前,文溯阁《四库全书》数字采集工作已全部完成,数据处理工作完成70%。从现在起至2028年,文溯阁《四库全书》将按经、史、子、集四部,分期分批推出全套影印版本。

  

  数字采集

  采集方案、流程规范和相关作业标准周密完善

  约8亿字的文溯阁《四库全书》共有多少页?数字化之前鲜有人知。

  “换算为现代书籍页码,共488万多页。”文溯阁《四库全书》数字化影印出版专职工作组组长宋学娟说。

  作为读者出版集团有限公司所属的读者古籍数字科技中心总经理,宋学娟过去两年多时间带领团队把文溯阁《四库全书》从纸上“搬进”了电脑——逐页扫描、存入,数据资源总量逾700TB(太字节)。“如果用常见的容量32GB的U盘存储,需要2.2万多个才能装下。”宋学娟说。

  文溯阁《四库全书》既是历史典籍,又是珍贵文物。若藏于高阁,难以活化利用;若活化利用,又有损坏之虞。如何破解“藏”“用”两难?2021年8月,甘肃省委宣传部制定《文溯阁〈四库全书〉数字化影印出版工作重启方案》,力求在保护的同时“唤醒”古籍。

  古籍真本由甘肃省图书馆提供,数据采集处理、影印出版等工作由读者出版集团有限公司具体实施。数字化影印出版工程分为“数字采集—数据处理—影印出版及数据库建设”3个阶段。所需经费,部分由中央文化产业发展专项资金、甘肃省财政资助,部分由读者出版集团有限公司自筹。

  数字采集,免不了要接触古籍真本,如何确保其安全无损?甘肃省图书馆和读者出版集团有限公司制定了周密完善的采集方案、流程规范和相关作业标准,“54条数字化工作流程规定,涵盖前期准备、文献出库、数据处理等全部流程。”宋学娟介绍。

  为保古籍安全万无一失,文溯阁《四库全书》藏书馆二楼会议室被改造成了数字采集室,做到原书“出库不出馆”。而从书库到采集室,平常不到一分钟的路程,藏书馆90后馆员魏乔波却要走好几分钟:戴上白色手套,细查一遍即将出库的古籍,再轻轻捧起,就像捧着一碗不能洒出的水,慢慢往楼上“移”,“就怕脚下不稳”。

  “古籍出库,要填报11类表格,层层审批。归还时,所有细节都要对得上。”魏乔波说,以其中的《提书登记表》为例,提取古籍需详细填报当日采集计划、提取数量,然后与书库管理员共同清点每一函、每一册书,包括函盒、夹板、束带、铜扣的存缺程度,每一册古籍的题名、卷数、页数,以及有无破损、污迹或霉斑等情况,“这些都要一一记录在案。一送一回路上、数据采集期间,古籍若有半点闪失,都会被及时发现。”

  数字采集作业班班长杨旭勇告诉记者,采集时必须使用古籍专用非接触式扫描仪高清扫描,且光源必须是冷光源。对采集人员,甘肃省图书馆的古籍专家也开展了多轮培训演练,“既要保证扫描精度与进度,还要避免伤害古籍,翻书的力道不能轻也不能重,要稳而有力。”杨旭勇说。

  准备周密,工作前期进展顺利,意料不到的问题还是出现了。“古籍开本大小相同,厚薄却不一样。”宋学娟翻开一本书,拿到一台扫描仪前比划道,“超3厘米厚的古籍,用这种平板扫描仪扫描,靠近订口的部分内容很难被有效采集。”

  为啥?不按压,无法扫描;按压,古籍易损,且采集到的内容会变形。怎么办?“为保证采集质量,我们追加预算,在已采购10台古籍专用平板扫描仪的基础上,又购置了两台V型古籍扫描仪。”宋学娟说,使用这种扫描仪,只需将书翻开到90度,即可完成扫描采集,问题迎刃而解。

  2021年12月23日,开机扫描;2022年5月23日,采集告竣。“整整5个月,经过人员倒班,实现每天工作16个小时、一天未休。古籍没有丝毫受损,函盒没有增加一道划痕。”阳光透过窗口