首页 -> 2006年第16期

机读目录与USMARC格式

作者:钟梦姣




  一、机读目录的涵义、特点及其意义
  
  何谓机读目录?机读目录(Machine—Readable Catalog—MARC)即以代码形式和特定格式结构记录在计算机存储载体上,能够被计算机识别并编辑输出书目信息的目录形式。何谓计算机编目?指的是利用计算机根据文献编目规则编辑机读目录的过程。
  机读目录与传统目录相比,具有显著的优点。其一,载体信息密度高,体积小,易于保存,节省空间;其二,一次输入,多次输出;其三,检索速度快,查全率和查准率高;其四,能自动排序;其五,修改、维护方便。
  机读目录的产生和广泛应用给图书馆的各项业务的开展带来了极大便利。它用途广泛,可以用于采访、编目、检索、流通阅览及行政管理等。
  随着USMARC格式的推广应用、计算机技术的普及与网络技术的迅猛发展,图书馆的编目工作已发生了翻天覆地的变化,以往的手工操作已经消失,而完全进入网上联机编目阶段。联机的合作编目使得编目数据的共享成为现实。以黄冈师范学院图书馆为例,该馆使用的是CALIS系统,从CALIS联合目录数据库中获得率可达该馆购书量的80%。联机合作编目与传统手工编目相比,工作效率高,编目速度快,质量稳定,可以说,实现编目数据的规范化和标准化是我国图书馆事业自动化发展的必然趋势。
  
  二、USMARC记录的结构
  
  MARC书目记录的结构主要分三个部分:记录头标、目次区和可变长字段。
  1.记录头标。头标区位于每一个记录起始部分,是为处理记录提供信息的数据元素。这些元素包含有数字和代码值并且通过相应的字符位来加以区分。长度固定为24个字符(00-23)。
  2.目次区。目次区包含字段标识符、字段起始字符位置以及每个字段的长度。可变字段的目次项按字段号的数字升序排列在前面,可变数据字段的目次项按字段号的第一个数升序排列在后面,记录中的可变长字段顺序不需要与目次区款目的顺序一致。但重复字段的排列顺序应与记录内相应的重复字段的排列顺序一致。它的长度在头标20-23字符位定义。
  3.可变长字段。USMARC记录数据组成可变字段,每个可变字段又通过这个字段存储在目次项中3个字符长的数字字段号加以识别,每个可变字段用一个字段终止符结束。可变字段分可变长控制字段和可变长数据字段。可变长控制字段指以OOX作为字段标识号,它包含一系列按字符位置识别的数据元素(由数字或字母组成),字段中无指示符和子字段代码。可变长数据字段它指01X—8XX字段。可变长数据由指示符、子字段代码和长度不固定的子字段数据元素组成。
  
  三、USMARC的著录规则
  
  (一)字段和子字段的重复性和必备性。
  1.重复性。从理论上来讲,除了001控制号字段和005最近一次处理记录的时间和日期字段,其它字段均可重复。但是数据的特点常常排除了重复的可能性,如:一个书目记录中只可能有一个093字段,也只可能有一个中图分类号出现。USMARC格式中字段和子字段的重复性与不可重复性在字段和子字段后面分别用(R)和(NR)来表示。
  2.必备性。字段和子字段有必备字段、有则必备字段和可选用字段等级别。必备字段指每条MARC记录必须具备的字段,例如完全级记录008定长数据元素字段,245字段。有则必备字段指当文献中包含某种信息时,MARC记录里必须具备反映相应信息的字段。
  (二)显示常量。USMARC可以存储和编写用来显示或打印不同字段的区分标识符。这些区分标识符就是显示常量,它们可以是一个短语、术语和/或空格,或者是被定义的标点符号。显示常量的作用即是使记录中的数据进行直观显示,使得数据对读者更加有用,这样的显示内容并不需要保留在记录中,只要在字段中保存一个用来显示内容的指标,这个指标建立在字段标识符、指示符、子字段代码及代码值的基础上。在每一种USMARC格式中提供有推荐的显示常量和显示事例,这些常量是由各自的系统所决定的。
  (三)统一编排符号。在西文编目中“0”在字段标识符、指示符位置上和固定字符位置上表示阿拉伯数字0,这个字符跟用在文本中的大写字母“O”显然不同。“井”字符表示空格(其ASCⅡ值为32)。“$”为分隔符,比如,在文档中将子字段标识表示为“子字段”“$a”。用“/”和字符所在的位置数来表示固定长度数据元素的一些特殊字符位置,如008/39#。
  (四)多版本记录。一个USMARC记录可以包含多种版本的数据,尽管其它的版本也可以用作数据内容,但要以一个版本作为这个记录数据内容的最初版本,对多版本数据的图表模式,在每种格式的“多版本记录”块中描述。
  (五)责任界定。当数据元素是由一个指定机构或权威机构提供时,这个数据元素的内容应由该指定机构负责。a.责任块。在088/39和/或040$a(原始编目机构)中,标著的原始编目源的机构对记录的数据内容负责。对于修改的记录,转录字段040字段$a(原始编目代理商)和$d(修改商)中的机构共同对记录数据内容负责,040字段$c和$d中的转录或修改代理商对数据内容标识和数据转录负责。b.指定代理的数据元素。它的内容是由指定代理商决定,如字段222(识别题名)由ISSN中心负责,通常由一个指定的代理机构输入,可以被另外的机构进行转录。c.受控的名录数据元素。一些数据元素是由指定代理商提供受控列表中的数据,如书目数据格式中的043(地理区域代码)字段中地区MARC代码表。这些元素在USMARC的字段或子字段层被指定,只有指定列表中的值可以用,如果要改变或增加一个名单,就必须和这个制表的代理机构进行协商。只有明确USMARC的记录结构和著录规则,才能实现目录数据的规范与统一,从而促进国际间和国内书目机构、各图书馆、情报部门之间的资源共享和交流,才能满足图书馆自动化发展的需要,实现真正意义上的文献传递与资源共享。
  
  参考文献:
  1.肖珑·元数据格式在数字化图书馆中的应用·大学图书馆学报,1999,4。
  2.林海青·数字化图书馆的元数据体系·中国图书馆学报,2000,4。
  3.王松林·USMARC 的新版本新内容·图书馆学刊,2002(4)。
  4.James H.·Billington,“The Library of Congress National Digital Library Program”,Digital Libraries research and technology advances:selected papers New York:Springer,1996。
  
  钟梦姣,女,湖北黄冈师范学院图书馆副研究馆员。已发表论文三十多篇。