简化图书元数据工作流程
2010/1/4 点击数:1891
[作者] 编目精灵II
[单位] 编目精灵II
[摘要] 2009年3月18-19日,OCLC举办“出版者与馆员会议”(SymposiumforPublishersandLibrarians),讨论图书元数据问题。美国信息标准化组织(NISO)和OCLC委托InformedStrategies总裁JudyLuther就此撰写白皮书,于会后出版,名《简化图书元数据工作流程》:StreamliningBookMetadataWorkflow/JudyLuther.Baltimore,MD:NISO,2009.ISBN:978-1-880124-82-6(PDF,22p)。
2009年3月18-19日,OCLC举办“出版者与馆员会议”(SymposiumforPublishersandLibrarians),讨论图书元数据问题。美国信息标准化组织(NISO)和OCLC委托InformedStrategies总裁JudyLuther就此撰写白皮书,于会后出版,名《简化图书元数据工作流程》:
StreamliningBookMetadataWorkflow/JudyLuther.Baltimore,MD:NISO,2009.ISBN:978-1-880124-82-6(PDF,22p)
白皮书分析了图书供应链中,元数据创建、交换与使用的现状,以及未来的机会:
StakeholderPerspectives
图书供应链中元数据的利益相关人,也就是拥有图书元数据的机构,包括出版社、元数据供应商、批发商、书商、国家图书馆、本地图书馆与Google。
·出版社:由于按需印刷技术的发展,出版社需要数字化其出版书目。大社提供XML化的ONIX数据,小社可能就是EXCEL表。
·元数据供应商:包括图书登记机构(如Bowker和NielsenBook)、编目服务机构(如英国的BDS)、成员组织(如OCLC和CrossRef)。
Bowker年增加30万条记录,50%是ONIX,45%是EXCEL或其他电子格式,5%仍来自提交的纸质信息。
英国的BDS外包了大英图书馆的CIP业务,每年提供7.5万记录,并提供ONIX到MARC21的对照。
OCLC在美加两国有70个元数据专家与编目员,为特藏及出版社、书商创建记录。
另外主要拥有期刊元数据的CrossRef有160万图书DOI,SerialsSolution有100万电子图书记录。
·批发商:最大的批发商Baker&Taylor和Ingram数据库年增长10%以上。虽然年出版新书约20万种,但新记录估计达70万,因为不同格式与版本要有独立的记录。
·国家图书馆:LC专业编目员创建或升级了其35万记录中的80%,BL则为26万记录中的55%。据估计,WorldCat记录的65%是简编记录(难怪OCLC要开放“专家社区”,让更多编目专家帮助提升WorldCat的质量)。
·Google:Google数字化成百上万图书,在ONIX与MARC中取质量高的记录。有不少图书馆员在Google工作,Google也与OCLC合作。Google还在开发区分相关作品的算法。
MetadataWorkflow
元数据工作流程,包括ONIX及MARC标准,以及书业与图书馆界在元数据质量控制方面的努力。
Opportunities
未来的机会,包括标识符、主题表及最佳实践
·标识符:包括作者、个别作品、丛编与相关作品,相当于编目界的名称规范、丛编题名规范,以及FRBR中的作品概念。
唯一标识文本作品的“国际标准文本码”ISTC-InternationalStandardTextCode已是国际标准ISO21047。
作者标识符目前有“国际标准名称标识符”ISNI-InternationalStandardNameIdentifier,还是草案(DraftISO27729)。
·主题表:美国书业采用BISAC,50大类3000多小类;英国书业采用BIC;图书馆界采用LCSH、Sears及MeSH。
·最佳实践:14项建议,特别注意的是:
第一条:使用ONIX与MARC的对照,方便创建CIP,并向出版社提供XML的MARC数据。最后一条:探索把目前的ISTC和未来的ISNI标准集成到当前工作流程的方法,促进其被采纳。前者可用于创建作品间关联,后者可提供作者的规范控制。(或许未来的MARC书目记录中会加入ISTC,规范记录中会加入ISNI)
集中同一作品的不同内容表达、载体表现,对于出版发行者来说,可能比图书馆更为重视。因为多卷书(整套或各单册)、不同载体(如电子或纸质)、甚至不同装帧形式(如精装或平装),由于销售方式、销售价格不同,对书商来说需要使用不同的记录。这是以前没有想到过的ONIX数据与MARC数据的一个重要差别。
无论如何,充分利用供应链上游的数据,将会是未来图书馆编目工作的发展方向。LC对书目控制未来工作组报告的回应,表明LC计划继续参与ONIX开发,并将关注从ONIX中抓取数据的机会。而OCLC的出版社ONIX元数据强化服务,从形式上看是为出版社提供服务,实质上也为WorldCat取得了大量由ONIX元数据转换而来的MARC数据。
白皮书正文末是JudyLuther与30位业内代表交谈后,绘出的图书元数据交换图(p.17),反映图书供应链中各方及与ONIX、MARC、DOI三种元数据的关系,标示出对数据进行质量控制的部分。
参见:OCLCNewsReleases,7July2009
Streamlining Book Metadata Workflow - NISO and OCLC Publish White Paper that Reveals Opportunities in the Book Supply Chain