古籍文献数据库存在的问题与突破的方向――试论计算机技术在古典文献研究中的若干问题
还须补充的是,我国的古典文献中有大量表格与图片,而由于技术原因,目前所有古典文献数据库都没有导入原著的表格与图片,极个别数据库有少量图片也是不能检索,这是目前众多古典文献数据库的重大失误之一。其实只要真正化力气去探索,这个问题是不难解决的。因为笔者曾作过设计并反复试验,只要设计合理,图片与表格不但可以导入数据库,而且都是可以在数据库中进行检索。
其三,加速确定字库方案,以利数据库健康发展。当然,要真正解决公共古典文献数据库问题,还必须解决字库问题。目前,国家虽然组织专家在论证有关字库问题,然而由于进程不快,远远落后于当今计算机技术发展的需要。按照笔者的看法,应该建立一个以Unicode字库为基础的、适应汉语古籍需要的、并与国际接轨的真正有中国特色的字库。这就需要抓紧工作,迅速落实扩展字库B的内码。同时根据我国汉字的具体特点,对自定义区域的6400字的内码配置也应该有所规范,这样才能使汉语字库统一问题落实到实处。如果真能做到如此,那么就能真正解决目前古典文献数据库之间字库互不兼容问题。
与字库相关联的是字体问题。古典文献数据库应该考虑到古代文献对文字的特殊需要,笔者以为凡是古代文献数据库中的文本应该保留繁体字,以防繁简不分而导致文义偏差。就目前计算机技术来说,解决这一问题是毫无困难的。其实用繁体字输入文本早已不是问题,而扫描古籍文本再转换成文字的技术也十分成熟,如北京书同文公司的“数码翰林”OCR识别系统,应该说是极有价值的识别软件,对绝大多数繁体文字能够正确识别。如果能再进一步加以改进,使扩充字库数量并与Unicode字库兼容,那么古代文献的文字识别问题是可以得到解决的。应该强调的是,古代文献以繁体字导入数据库,但应该允许在数据库中自由进行繁简转换,换句话说,若需要使用繁体字时,文本可以保留繁体字,而需要简体时,可以十分方便地转换成简体,这样就适应用户对繁简体的不同需要了。
其四,彻底解决古典文献版权问题。这是困挠计算机古典文献数据库建设的重要难题之一。自然,这一问题要真正得到落实确实存在相当困难的,因为版权保护工作任重道远!不过,即使困难再大,古籍文献数据化的发展的潮流是不可能停止的。笔者以为,有关出版社在维护自身法定的版权权益的前提下,应该从大局出发,在收取一定数量的报酬前提下,允许制作有关古典文献的数据库,以利学术研究的发展。至于报酬多少可以也应该实事求是地酌情商定,国家有关部门应该主动与那些出版社协调,亦可将目前大量分散投入到各课题中的资金中抽出部分来补偿有关出版社,双赢互利,以求突破版权瓶颈,早日解决这一棘手的问题。
与此相关的是古典文献电子文本的版权问题,这也是个极难处理的问题。因为用户若贪图小利,版权意识不强,不愿化费代价使用电子文本,就容易产生“盗版”问题,如此就使得制作古典文献电子文本者的正当利益大受损失。按笔者设想,如果真正能够由国家有关部门主管古典文献数据库建设工作,那么就可以设想建立公共古典文献数据库规定导入数据库的文献文本都给予一个“统一编号”,没有统一编号的文献就不能直接导入公共古典文献数据库和个人使用的文献检索服务系统中,也就是说,个人使用古典文献电子文献必须化费一定的代价才能取得使用权,这样就可以保证制作古典文献电子文本者的一定收益,防止版权意识不强者侵权使用。同时由于古典文献电子文本都有了统一编号,那么也就可以防止某一具体文献文本重复录入的问题。即使有部分重复,古典文献电子文本也可以在用户选择过程中优胜劣汰。
其五,建立公平的交易平台。建立庞大的公共古典文献数据库当然需要投入巨大的资金,而这种古典文献数据库自然不是每一个普通研究者购买得起的。在笔者看来,大专院校、科研机构应该在经济允许的前提下购买有关数据库,以供教学、研究之需。当然也应该允许个人在交纳一定数量的经费后,自由上网使用这一数据库,并允许购买(下载)一定数量的古典文献文本,自行导入各自的文献检索服务系统,以利建立个性化的有实用价值的数据库。如果真能做到这样的话,那么就将会促进学术研究的迅速发展。
鉴于此,笔者以为就有必要建立一个公平的交易交流平台,既不是“就此一家,别无分店”的垄断式的高价出售,又不是无论你需要不需要而进行的“一揽子交易”式的硬性搭售。在笔者看来,应该允许研究者自己输入的文本在交易平台上自由交易或交换。当然,学者将自行输入文本无偿赠送给同行应该予以鼓励,事实上,在网上已经可以看到一些学者将自己输入的文本无偿提供的例证。学术是公器,没有必要象守财奴那样守住这一私产。笔者不反对从网上下载一些有价值的文献文本或其它资料作为自己研究所用,但反对下载文献文本或资料后,通过各种方式去“变钱”,成为牟利的手段。
其六,发展新兴学科,培养专业人才。就目前来说,数据库开发主要由计算机专业的人才来进行,由于专业的局限,对文献数据库尤其是古典文献数据库的建设肯定有相当的隔阂,作为统筹解决这一问题,应该考虑在有条件的学校中打破原有招生专业,设计一个文理交叉学科:古典文献与计算机技术(古典文献现代化)专业。这个专业以培养古典文献素养较好,计算机技术出色的社会急需的专门人才为目的。其实培养这样的人才并非是很难的事。在现有的国内一些招古典文献学本科专业中增加有关计算机技术课程,化上一两年时间让学生专门学习计算机技术,就可以培养出一些有用之才来。当然,还可以以历史文献或古典文献专业与计算机专业联合招收硕士研究生,以应急需。我想,这种适应于现代社会需要的新型专业人才是肯定会受到社会欢迎的。
Tags:
作者:佚名评论内容只代表网友观点,与本站立场无关!
评论摘要(共 0 条,得分 0 分,平均 0 分)
查看完整评论