You are on page 1of 3

DOI : 10. 13366 /j . di k. 2000. 04.

018
2000年第 4期 图书情报知识 2000年 12月

我国古籍数字化的现状及展望
王桂平
(武汉大学传播与信息学院 , 430072)

[摘 要 ] 简要叙述了我国古籍数字化的进展情况 ,并对古籍数字化的前景作了
展望。
[关 键词 ] 古籍数字化 书目数字化 善本数字化 古籍加工
[中 图法分类号 ] G255. 1  [文献标识 码 ] C  [文章编号 ] 1003-2797( 2000) 04-0050-02

  所谓古籍数字化 ,就是采用计算机技术 , 年 6月 ,在北京召开了“古籍机读目录的统一


对古籍文献进行加工、处理 ,制成古籍文献书 格式及其使用说明”研讨会 ,就诸多技术问题
目数据库和古籍全文数据库 ,用以揭示古籍 作了相应的规 范。 目前 , 《中 国古籍机 读格
文献中所蕴涵的极其丰富的信息资源 ,为古 式》正在论证 ,即将出台。在具体的实践中 ,四
籍的深度开发打下良好的基础。 川大学图书馆摸索出一套较有特色的古籍目
1 古籍数字化的现状 录的计算机处理方法—— 古籍机读目录格式
近些年来 ,我国积极进行古籍数字化的 GJM ARC 的设计 ,对一些古籍文献目录的著
尝试 ,取得了许多成果 ,主要表现在以下几个 录条款作了比较详细的说明 ,可供正在制作
方面。 自己书目数据库的图书馆参考。
1. 1 古籍书目数字化 1. 2 古籍善本数字化
计算机技术在我国图书馆的应用 ,是从 1996年上海图书馆与长 江计算机集团
90年代开始的。国内一些大型图书馆如南京 合作 ,采用引进与开发并举的方式 ,建立了一
图书馆、辽宁图书馆和浙江图书馆等 ,先后进 套“古籍影像光盘制作及检索系统”。 该系统
行了古籍书目数据库建设的探索和尝试。 南 将古籍善本以图像形式扫描 ,全文录入 ,并研
京图书馆已率先建立了自己的古籍数据库 , 制了古籍善本的查阅系统。该工程于 1997年
初步建立了 40多万条中文古籍书目数据库 , 10月正式立项 ,到 1999年 4月 ,已完成古籍
为读者检索古籍书目信息提供极大方便。 该 善本 1000多种 60万页的扫描与标引任务 ,
库设有书名目录、著者目录、分类目录及索引 从而使古籍数字化 ,特别是善本古籍数字化
目录等 ,读者只需用模糊检索的方法 ,以繁体 从计算机的书目服务走向了全文服务 ,开了
字输入某书书名的关键词 ,就能找到该馆所 古籍善本全文光盘制作与服务的先河。
藏该书的不同版本 ; 如果在著者目录下输入 上海图书馆收藏包括古籍图书、碑贴、拓
某著者的名字 ,那么该馆所藏该著者的所有 片、名人手扎、专人档案资料等在内的 170余
作品目录都会在计算机屏幕上显现。此外 ,辽 万册古籍文献 ,其数量之多、藏品之精 ,在海
宁、浙江等省馆也正在研制自己的书目数据 内外图书馆中名列前茅。 在古籍善本数字化
库。在此基础上 ,图书馆界开展了建立古籍书 处理方面 ,该馆研制了古籍影像光盘制作及
目数据库的讨论 ,李致忠所撰《再论建立中国 检索系统 ,揭开了古籍善本的神秘面纱。当读
古籍书目数据库》是具有代表性的文章。1998 者置身于该馆古籍善本阅览室时 , 在它的 4
50
台 IBM 计算机上 ,就可以看到世上罕见的古 并确定它们的关系及链接。第二步 ,将古籍文
籍善本 ,有的黑白相间 ,有的五彩互映 ,文字 献原文及知识信息单元变成计算机文件。 第
清晰 ,图像逼真。 读者调阅一种古籍善本 ,从 三步 ,按超文本结构建立各文件的超链接。
书目检索到全文阅览 ,整个过程不到 1分钟 ; ( 2) 实 现古籍 数字化 的标准 化和规 范
且阅读方便 自如 ,可前后 翻阅 ,也可跳 跃查 化。 可由中国图书馆学会古籍整理专业委员
找 ; 或整幅显示 ,或局部放大 ,或黑白反转 ,或 会牵头 ,以国家图书馆、上海图书馆、南京图
位置颠倒 ,只要按动鼠标 ,即可马上实现 ; 如 书馆为龙头 ,在深入研究的基础上 ,确立古籍
果需要有关资料 ,可随即原样打印。该馆计划 数字化的统一著录格式和标引方法。 古籍数
用 5~ 10年时间 ,将馆藏善本全部录入光盘 , 字化后 ,要研制与用户要求相匹配的系统 ,以
逐步实现古籍善本的全文数字化。目前 ,该馆 确保数据库的使用性能。
已有 20种善本进入国际互联网 ,为中国典籍 ( 3) 网络化是古籍数字化 ,特别是古籍
走向世界、让世界了解中国开了一个好头。上 善本数字化的发展趋势。 当古籍数字化在全
海人民出版社与 香港迪志文化有限公 司合 国各主要图书馆实现后 ,就可以以网络为纽
作 ,完成了“国家`九五’ 光盘重点项目—— 文 带 ,建立古籍数字化地区联合数据库和全国
渊阁《四库全书》电子版”的制作任务 ,这是中 性数据库。随着网络的发展 ,中国丰富的古籍
华典籍数字化的重大突破。 此外 ,据《光明日 资源将会在网上传输 ,供国际互联网的用户
报》 1998年 1月 13日报道 ,“中国基本数据 共享。
库光 盘工程”已经启动 , 计划从传世的 大约 ( 4) 普本古籍数字化将最终实现。 古籍
13万种古籍中 ,筛选出 1万多种 ,每种确定 数字化在我国已开始了书目数字化和古籍善
一个通行版本和一至三个重要版本 ,制成光 本数字化的尝试 ,将来 ,随着这两项工程在全
盘。 国各主要图书馆的完成及数字化技术的进一
我国台湾历史语言研究所在 1984年开 步发展 ,将会有古籍普本数字化之举。
发出了“汉籍文献电子数据库” ,将历史正史 ( 5) 制作善本古籍数字化的辅助软件和
中的《食货志》数字化 ,制成数据库。 此后 ,又 电子工具书。在古籍数字化的过程中 ,需要制
将《二十五史》、《十三经》、《文心雕龙》等制成 作利用善本古籍专门软件 ,如有学术价值的
数据库。 书目解题、古籍专家对善本书的简短评介等
2 古籍数字化的展望 导读鉴赏资料 ;此外 ,还需要阅读古籍的各种
在古籍数字化的过程中 ,以下几项技术 工具书 ,如《汉语大词典》、人物生卒年考证等
和目标将会逐步采用和实现。 书。只有解决阅读中的“拦路虎” ,才能增加读
( 1) 超文本技术将得到广泛应用。 超文 者阅读古籍的兴趣 ,从而达到对读者进行传
本系统为组织知识信息提供了非线性的表达 统文化教育的目的。
方式 ,它利用计算机将文件分成文件单元 ,并 ( 6) 数字式照相将成为古籍数字化的主
建立相关文件单元的内部链接 ,读者使用时 , 要方式。 由于扫描速度较慢 ,且受幅面的限
可“点击”超链接 ,查询相关信息。古籍文献的 制 ,采用 A4幅面的扫描仪 ,往往扫不下一些
正文、校勘、参考文献等部分之间的关系是典 古籍完整的幅面 ,只得把两个半面单独扫描
型的非线性结构 ,超文本系统可以很好地表 再拼接成整页 ,而拼接和调整的工程量太大 ,
达它们之间的关系。 古籍文献的超文本标注 半页单独成页又使页码的标识只能以“一上”
可分为三个步骤。第一步 ,进行古籍文献超文 “一下”或“一左”“一右”的方式来表示 ,因而
本文件的结构设计。 这部分工作主要是将古 不能保持古籍的原貌。 A3扫描仪售价要比
籍文献原文分解成有意义的知识信息单元 , 一般数字照相机贵 ,且只能 (下转第 54页 )
51
( 3)信息加工分析综合能力。图书馆员对 (如证券公司等 )联接 ,以保证数据能及时更
于来源不同的信息要能进行统一的标准化贮 新。同时 ,图书馆还要有相应的线路与合作馆
存 ,要探讨更贴近自然语言的信息加工语言 , 或商业公司相联接 ,以保证合作建库时数据
并能对信息进行深加工 ,形成有特色的信息 能安全传输。
产品。 3. 6 提供多种形式的电子商务信息服务
( 4)信息产品的营销能力。要吸引用户使 除了建立数据库提供查询之外 ,图书馆
用和购买图书馆生产的信息产品 ,就需要有 可采取多种方式 ,向用户提供电子商务信息
好的营销创意和一整套可行的营销方案 ,因 服务。 主要有: ①图书馆可接受用户委托 ,进
而要对馆员进行营销知识培训 ,使其具备良 行市场调研、新产品调研以及竞争对手调研。
好的网上营销能力 ,在竞争中取胜。 ②图书馆可以邀请投资专家、股评专家等进
( 5)灰色文献与网络信息资源的开发能 行线上咨询 ,也可以利用专家系统提供 24小
力。许多商务信息都存在于公司广告、产品展 时咨询服务 ,还可以提供线上翻译服务。③图
示、内部资料和各类宣传资料中 ,这些灰色文 书馆可与网上书店合作 ,列出新书排行榜 ,向
献不是正式出版物 ,但其信息价值不可忽视。 读者推荐优秀图书 ;可以在主页上刊登广告 ,
图书馆员应努力探索其收集方法 ,使这些文 宣传自己的产品 ; 可以开辟电子论坛、电子沙
献发挥作用。另外 ,许多图书馆员对网络信息 龙 ,供用户交流 ; 还可以利用自身人才和资源
资源的开发还比较陌生 ,需要进行培训。 优势 ,进行网上教育和培训。
3. 5 增加与电子商务有关的软硬件设施 参考文献

图书馆向用户提供电子商务信息服务 , 1  张润 彤 ,朱晓 敏 . 电子 商 务 . 北京: 北 京 出版 社 ,


1999.
需要有相应的配套设施。 电子商务信息多为
2 王健 .电子商务 .北京: 学苑出版社 , 1999.
事实型、数字型的信息 ,不能像文本信息那样
3  王 方 华 等 . 网 络营 销 . 太原: 山西 经 济 出 版 社 ,
显示出来就完事了 ,还需要进行分析和整理 ,
1998.
制成表格或报表。因此 ,需要购买或开发一些 4, 5 同 1
软件 ,如财务分析软件、股票分析软件等。 对 6 马费成 ,陈锐 .面向 高速信 息网络 的信息 资源管
一些收费的数据 库还要购买相应的管 理软 理 (一 )—— 从技 术角 度的 分析 .中 国图 书 馆学
件 ,以实现自动计费功能。 此外 ,为保证数据 报 , 1998( 1)
不被破坏或被人窃取 ,安全软件也是必须的。 7 钱 刚 ,毕强 .集成 管理: 21世纪 图书馆 追求 卓越
在硬件 设施方面 , 除计算机、网络设 施 管理的新方法 .中国图书馆学报 , 1998( 6)

外 ,图书馆应有网络专线与实时信息提供者 (收稿日期: 2000-03-30)

( 上接第 51页 )解 决约 90% 古籍 善本的 录 2 陈秉仁 .古籍 善本数 字化的 尝试 . 现代图 书情报

入 ; 一些特殊规格的古籍 ,如特大开本或卷轴 技术 , 1998( 1)


3 孙继林 .关于 古籍善 本的数 字化问 题 .图 书馆杂
装的古籍 ,只能通过其他技术处理后再转换
志 , 2000( 7)
扫描。 而数字照相机的拍摄不受幅面限制 , 4 李致忠 .再论 建立中 国古籍 书目数 据库 . 北京图
1280、 960像素的数字照相机 ,将能满足古籍 书馆馆刊 , 1995( 3~ 4)
拍摄的要求。所以 ,古籍数字化将会以数字照 5 李心福 ,郭宝兰 .古籍资料库自动超文本 标注 .情
相为主。 报学报 , 1999( 3)
参考文献 (编者注: 此文作者系武汉大学传播与信
1 杨仪 ,林兴国 .古籍目录的计算机处理 .四川大学 息学院博士生 )
学报 (哲学社会科学版 ) , 1998( 3) (收稿日期: 2000-09-25)
54

You might also like