首页 -> 2008年第5期
现代编辑出版业的第二次历史性跨越:编辑自动化
作者:田胜立
是非专业性阅读需要得到的结果。面对非专业阅读需求随社会分工越来越细而变得越来越普遍和强盛的数字化阅读时代,对非专业阅读需求像传统阅读时那样把词典和百科全书搬到网上或装进手机就能解决问题吗?数字传媒时代必须沿用传统媒体时代检索知识的方式吗?
为方便读者查阅文献,图书馆、资料室工作人员要先对文献加工,包括分类编目,编制主题词/关键词、作者/译者、出版者、类别、年代等诸项索引供检索使用。这些数据是文献的标示,在文献为全文数据库时是文献的元数据。现有的数字图书馆、期刊全文数据库承袭图书馆管理书刊文献的思路,发挥全文数据库和网络的优势,以空前的速度和储存规模为读者提供检索服务。一旦建成大规模全文数据库还可开发更多的服务功能。例如同方出版社在构筑知网时就设置了多种揭示文献内容关联的方法,除了通常寻找特定文献用的书名篇名、关键词、主题词、作者、出版者、出版时间等,还设计有参考文献、共引文献、相关文献作者、相关研究机构、相关期刊、相似文献、引证文献、同被引文献、读者推荐文献、二次参考文献、二次引证文献以及分类导航等多角度多关联的文献数据网络体系。这种多维的节点文献关联能提示许多字面之外的知识。然而,为便于文献的检索而作的上述工作需要大量人力物力和时间,如果在文献发表时就能做好这些工作将会大大提高社会的工作效率。这样就提出一个新问题:出版单位能在加工待出版的作品时,一并作好为文献检索服务的文献标示加工吗?能一并做好为知识检索服务的知识标示加工吗?
在工业时代传统出版把作品加工成一篇篇论文或一本本著作向社会提供。这些文献经图书馆(室)整理编目、录编提要、分类收藏,供人借阅,从这些工作实践中升华出图书馆学。这些著作作为商品流通消费时还孕育出图书发行学。进入信息时代(后工业时代),随着网络的普及应用,在海量信息中查找指定信息的需求。催生出搜索引擎。随着搜索引擎的广泛应用,网民面对现有搜索引擎给出的、信息冗余度很大的搜索结果。不满意的呼声越来越高。从图书馆学和搜索引擎的发展历程,可以见到在文献资料中迅速查找到特定内容历来是社会的基本需求和工作量很大的难事。如有突破,则会使整个社会前进一大步。
此外,以作品为单位的文献保存方式,会产生文献检索使用时不可避免的信息冗余。因为不同作者各自涉及同一话题时无法避免在各自的作品中使用同样的论据材料甚至相同的逻辑,于是许多篇文献可能论述了同一个观点并且用了相同的材料,尤其是提升职称的压力促成大批缺乏独创性的相似文献,于是当你浏览完数百篇文献后才发现其实原本只要研读其中几篇就够了,何况经常遇到搜索引擎交给你的是多达数千篇的文献篇目集,在这种情况下你有时间和兴趣把它们全都看一遍吗?
如果深入到作品内部,以知识块为单位来标示和检索。结果会大不一样,相同的知识块只取其一就能有效避免信息冗余。知识块的划分可大可小,最小的知识块是不能再分的知识点,称为知识元。针对不同的读者,可以设立不同的知识元体系,例如以义务教育标准教材的概念、知识为知识元可以建立最基础的知识库:以通过基础教育培养的读者通识水平设立知识元体系可以建立广泛适用的科普知识库;以某类职业基本知识设立知识元体系可以建立该类职业知识数据库。
如果对专业作品在编辑加工过程中加上对知识的结构化加工。则在出版传统作品的同时还可出版带知识标引的作品,后者则可进入相应的知识数据库进行按需知识服务。以知识块为单位向读者提供按需服务,是出版业发展的新领域和新业态。出版单位无论在专业(学术)出版还是在教育出版方面,都适合推行作品的结构化加工,产生跨传统出版物和新型出版物的系列化的产品以及基于知识数据库的新型的知识服务。
数字传媒时代产生的对作品加工方式的新要求,不仅使数字图书馆不必重复对文献作标示加工,更重要的是允许读者深入到文献内部就知识块进行检索,这能大大降低检索结果的信息冗余度,从而大大提高检索效率,降低检索成本,减少读者在查找和阅读文献时的时间与精力耗费。它对专业性阅读带来的方便是显而易见的。
对非专业性阅读它提供的服务是革命性的。对读者用自然语言提出的知识需求,服务系统能识别其类型并响应读者的需求,调用知识元数据库和需要的知识资源数据库,在专家系统支持下,直接向读者展示适当的带有可展开的多层次解释说明的知识内容请读者阅读并进行交互。这种个性化的知识服务能有效地推进知识普及从而加快知识创新和创新型社会的建设。
对作品进行结构化加工分两个层面,一是用软件工具在作者的表述体系上按其逻辑自动细分内容,自动对每一个自然段提取并标示关键词,同各级标题的关键词按原逻辑关系关联起来,供系统按知识块调用。二是用软件工具扫描分析作品并在指定的语境范围内,自动地或半自动地识别概念、术语、时间、地点、人物、机构、组织、事件等元素且做出标引,把作品阐述的知识分析成若干知识块,这种更深入地加工可能产生出新的知识。这些知识是作者没有表达,或者没有表达清楚,或者没有表达完整的知识,是通过深入加工挖掘发展出来的新的知识。在这种情况下,编辑加工性质变化为新知识的发现,于是,出版不仅传播了已有知识还具有新知识生产功能。总之。编辑加工自动化在极大提高编辑加工的工作效率的同时,还将产生以上这些原来意想不到的却更具重要意义的作用。
(作者单位:中国编辑学会)
[1]