元数据设计、实施和最佳实践方面的创新

Dublin Core™元数据的互操作性级别

创造者: 米凯尔尼尔森
KMR集团,NADA,瑞典皇家理工学院
汤克贝克
DCMI
皮特约翰斯顿
Eduserv基金会、英国
发行日期: 2009-05-01
最新版本: //www.voudr.com/specifications/dublin-core/interoperability-levels/
发布历史: //www.voudr.com/specifications/dublin-core/interoperability-levels/release_history/
描述: 本文档讨论了为不同类型的互操作性设计应用程序时涉及的设计选择。在第1级,应用程序使用具有共享自然语言定义的数据组件。在第2级,数据基于W3C资源描述框架的形式语义模型。在Level 3,数据被构造为Description Sets(记录)。在第4级,数据内容受制于一组共享的约束(在描述集概要文件中描述)。每个级别都提供了一致性测试和示例。作者希望这份文件随着不同层次的互操作性的权衡和利益而发展,并欢迎读者的反馈。

表的内容

  1. 介绍
  2. 级别1:共享术语定义
  3. 第2级:正式语义互操作性
  4. 级别3:描述集语法互操作性
  5. 等级:描述设置配置文件互操作性
  6. 参考文献
  7. 致谢

介绍

在过去十年中,从十五个元素[RFC2413]的不断发展的假设将在Dublin Core™应用程序配置文件[DCAP]的新加坡框架中,可以在互操作性的分层模型中捕获。这里提出的水平模型解决了许多社区中的需求,以将各种项目与都柏林核心™的各种互操作性定位,但缺乏适当的术语。

其目的是提供一个“互操作性阶梯”,详细说明为提高互操作性级别而设计应用程序所涉及的选择、成本和好处。本文档描述了与规范(或应用程序)的Dublin Core™元数据可能的互操作性级别。这些级别有助于确定希望“都柏林核心兼容”的项目的范围,并为“都柏林核心兼容”规范的用户设定期望。

该级别具有简单的LITMUS测试,该测试用作确定互操作性水平的指导。级别彼此构建,因此等级-3符合规范自动符合第1级和第2级,并且符合第三级符合要求的规范符合前三个。此时,这些层面没有更广泛的共识。作者希望这份文件随着不同层次的互操作性的权衡和利益而发展,并欢迎读者的反馈。

互操作性水平

级别1:共享术语定义

十五元素Dublin Core™(如NISO,ISO和IETF标准)提供了具有自然语言定义的概念的词汇。撇开机器可加工性的注意事项(“正式的”语义),这种词汇表提供了人群内部和人群之间的分享含义的基础 - 这是一个“非正式”互操作性,这些互操作性不需要使用URI参考术语,正式指定的域名和范围,或更高阶构造,如DCMI摘要模型[摘要模型]。例如,可以将DCMI术语定义和映射的重用用于IEEE学习对象元数据提供的DCMI术语,可以看到具有简单的Dublin Core™的“非正式符合”。

这个级别对应于使用Dublin Core™术语的自然语言定义。

  • 使用术语URI的使用不是要求 - 术语可以以任何方式引用。
  • 符合指定的域和范围的条款不是要求。
  • 与DCMI抽象模型的一致性不是一个需求。
  • 从历史上讲,“Dublin Core™”的非正式互操作性意味着使用15个元素,尽管非正式互操作性的概念原则上适用于任何用自然语言定义的元数据术语。

测试

  • 是否存在与Simple Dublin Core(定义为“遗留的15个元素,可重复,使用文字字符串”)的部分映射?如果是,则该规范与Dublin Core™元数据可以非正式地互操作。

例子

  • IEEE LOM重用了DC术语定义,并提供了到Simple Dublin Core™的映射。

第2级:正式的语义互操作性

“语义”互操作性基于在RDF图数据模型中体现的正式RDF语义和基于RDF的词汇表,例如DCMI元数据项。在这个意义上的“语义”并没有提到成本良好的自然语言定义(这是如何在Dublin Core™社区中使用“语义”的方式)。相反,它是指使用此类陈述以绘制自动结论(逻辑推断)之间的术语和规则之间正式规定的关系。这包括URI的使用(或可逆性)和与正式指定的域,范围和子属性关系的符合性。无论其本机编码格式如何,如果要通过GRDDL变换提供完整的映射,则可以说明规范是“语义可互操作的”。

此级别对应于隐式或显式使用RDF语义基础DCMI术语。因此,这些术语的任何使用需要精确地与RDF模型和域名和域名和术语范围。

  • 虽然规范/应用程序不需要使用URI明确地编码数据,但必须可以推断术语URI。
  • 与指定的域和范围的术语保持一致是一个要求。
  • 与所使用属性的子属性语义的一致性。
  • 与DCMI抽象模型的一致性不是一个需求。

测试

  • 是否存在与所使用术语的指定域和范围一致的“完整”RDF映射?如果是,则该规范在语义上可与Dublin Core™元数据互操作。

例子

  • 根据定义,所有RDF数据都可以与Dublin Core™元数据在语义上互操作。
  • 所有将GRDDL转换为RDF的数据都可以与Dublin Core™元数据在语义上互操作。
  • 使用2008规范“在XHTML和HTML元标记中表达Dublin Core™元数据”的数据与Dublin Core™元数据在语义上可互操作。

级别3:描述设置语法互操作性

在RDF指定的无界图中,DCMI摘要模型层将有界描述和描述集的概念层,为Metadata记录的验证和交换提供了基础[Abstract-Model]。根据DCMI抽象模型构造的元数据 - 例如,可以说是使用DCMI的最新语法指南的数据 - 可以说是“DCMI摘要模型可互操作”。在RDF摘要语法上以上,DCMI摘要模型提供:

  • “描述集”的概念是具有特定身份的有界实体——就像在库和存储库社区中可以管理的“记录”的概念一样。
  • “描述”的概念是具有特定身份的有界实体,即使描述被嵌入到记录中。
  • “语句”的扩展模型作为使用价值URI,值字符串和词汇编码方案URI的各种组合的图表。(词汇​​编码方案的正式概念特定于DCMI摘要模型。)
  • 使用URI区分所描述资源的“表示”和该资源的“标识”的约定。
  • 用多个值字符串“表示”一个值资源的约定。

此级别对应于元数据中明确使用DCMI抽象模型。

  • 元数据必须使用描述和描述集的DCMI抽象模型概念进行结构化。
  • 描述中的语句必须使用DCMI抽象模型定义的结构。

测试

  • 有没有完整的映射到DC-TEXT ?如果是,则该规范与DCMI抽象模型兼容。

例子

  • 使用DCMI发布的DCMI抽象模型兼容的元数据表达式的所有数据。

级别4:描述设置概要文件互操作性

规范“描述设置配置文件:Dublin Core™应用程序配置文件的约束语言”[DC-DSP]提供了描述集上结构约束的信息模型和XML表达式。如果它在与描述设置配置文件规范中兼容的描述集中提供正式约束,则可以说是“描述设置的配置文件可互操作性”的应用程序等应用程序。

一个相关的规范,新加坡都柏林核心应用程序概要文件(Singapore Framework for Dublin Core™Application Profiles [DCAP]),概述了为实现最大的互操作性和可重用性而提出元数据应用程序所需的一套文档元素——元素如功能需求、域模型、以及覆盖完整元数据集的描述集概要文件。

测试

  • 是否有一个“完成”描述设置配置文件?如果是,则该规范在描述设置概要规范的级别上是可互操作的。

例子

  • 学术著作申请简介[SWAP]

参考文献

(抽象模型)鲍威尔,A. M.尼尔森,A. Naeve, P. Johnston, T. Baker。DCMI抽象模型。DCMI推荐。//www.voudr.com/specifications/dublin-core/abstract-model/2007-06-04/

[DC-DSP]尼尔森,M。描述设置概要文件:都柏林核心™应用程序概要文件的约束语言。DCMI工作草案。//www.voudr.com/specifications/dublin-core/dc-dsp/2008-03-31//dc-dsp/2008-03-31/

[dc-text]约翰斯顿,P。使用DC-Text格式表达Dublin Core™元数据DCMI推荐资源。//www.voudr.com/specifications/dublin-core/dc-text/2007-12-03/

[dcap]尼尔森,贝克,约翰斯顿。都柏林核心应用程序概要文件的新加坡框架。DCMI推荐资源。//www.voudr.com/specifications/dublin-core/singapore-framework/2008-01-14//

[RFC2413]Weibel,S.,J. Kunze,C. Lagoze,M. Wolf。Dublin Core™元数据用于资源发现。IETF征求意见。<http://www.ietf.org/rfc/rfc2413.txt>

[交换]学术工作申请档案。http://www.ukoln.ac.uk/repositories/digirep/index/SWAP