元数据设计、实现和最佳实践的创新

DCMI抽象模型

创造者: 安迪•鲍威尔
Eduserv基金会,英国
创造者: 米凯尔尼尔森
KMR集团,CID, NADA, KTH(皇家理工学院),瑞典
创造者: Ambjorn Naeve
KMR集团,CID, NADA, KTH(皇家理工学院),瑞典
创造者: 皮特·约翰斯顿
Eduserv基金会,英国
创造者: 托马斯•贝克
DCMI
发行日期: 2007-02-05
标识符: //www.voudr.com/specifications/dublin-core/abstract-model/2007-02-05/
替换: //www.voudr.com/specifications/dublin-core/abstract-model/2005-03-07/
替换为: 不适用
最新版本: //www.voudr.com/specifications/dublin-core/abstract-model/
文件状态: 这是一个DCMI提出了建议
文件描述: 本文档描述了Dublin Core™元数据的抽象模型。

目录

  1. 简介
  2. DCMI抽象模型
  3. 描述、描述集和记录
  4. DCMI抽象模型语义
  5. 编码指南
  6. 术语
    附录A -与传统DCMI语法原则的关系
    参考文献
    确认

1.简介

本文档指定Dublin Core™元数据的抽象模型。本文档的主要目的是指定Dublin Core™元数据中使用的组件和结构。它定义了所使用组件的性质,并描述了如何组合这些组件来创建信息结构。它提供了一个独立于任何特定编码语法的参考模型。这样的参考模型允许我们更好地理解我们试图编码的描述类型,并促进更好的映射和跨语法翻译的开发。

本文档主要针对支持Dublin Core™元数据的软件应用程序的开发人员、参与为Dublin Core™元数据开发新语法编码指南的人员以及基于DCMI词汇表或其他兼容词汇表开发元数据应用程序概要文件的人员。

DCMI抽象模型建立在万维网联盟(W3C)关于资源描述框架(RDF) [RDF, RDFS]的工作之上。RDF概念的使用在下面关于DCMI抽象模型语义的第5节中进行了总结。

DCMI抽象模型在这里使用UML类图表示。不熟悉UML类图的读者应该注意,以块箭头结尾的行应该被理解为“is”或“is a”(例如,“a”)价值是一个资源),并且以方块菱形开头的行应该读作“包含a”或“有a”(例如,“a”)声明包含一个URI属性”)。其他关系被适当地标记。注意,这里使用的UML建模显示了抽象模型,但并不打算为软件应用程序的开发形成合适的基础。在本文档中,斜体字体的单词和短语在第7节术语中定义。

2.DCMI抽象模型

的抽象模型资源所描述的描述具体如下:

  • 每一个资源描述可以用一个或多个来描述属性-值

  • 每一个属性对是由一个组成的吗财产和一个价值

  • 每一个价值是一个资源-与…相关的物理或概念实体财产当一个属性对是用来描述资源

图1 - DCMI资源模型图1 - DCMI资源模型

DC元数据的抽象模型描述具体如下:

  • 一个描述组一套是一个还是多个描述,每一个都描述了一个资源

  • 一个描述是由一个或多个组成的语句(大约一个,而且只有一个,资源描述)和0或1资源URI(一个URI它确定了资源描述).

  • 每一个声明实例化一个属性对它由一个URI属性(一个URI它确定了财产), 0或1URI值(一个URI它确定了价值财产), 0或1词汇表编码方案URI(一个URI它确定了词汇编码方案其中价值是成员),和零或更多值表示

  • 值表示可以采取一种值字符串或者一个丰富的表示

  • 每一个值字符串是表示资源值的字符串旨在让人类可读。

  • 每一个值字符串可能有一个相关的语法编码方案URI它确定了语法编码方案或相关的值字符串语言这是一个ISO语言标签(例如en-GB),但不是两者都有。

  • 每一个丰富的表示是表示价值(一个资源) -例如,一些有标记的文本、一幅图像、一段视频、一段音频或它们的组合。

  • 每一个丰富的表示必须有关联的媒体类型(MIME媒体类型)。

图2 - DCMI描述模型图2 - DCMI描述模型

DC元数据中使用的词汇表的抽象模型描述具体如下:

  • 每一个财产可能与一个或多个有关由一个有域的关系。在这里,a财产有这样的关系和一个资源描述价值财产,由此可知资源描述这是一个例子吗

  • 每一个财产可能与一个或多个有关由一个有范围的关系。在这里,a财产有这样的关系和一个资源描述价值财产,由此可知价值这是一个例子吗

  • 每一个资源可能是的实例一个或多个

  • 每一个资源可能是的成员一个或多个词汇表编码方案

  • 每一个可能与一个或多个其他有关由一个子类的关系(其中两个都是这样定义的资源子类的实例也是相关类的实例).

  • 每一个财产可能与一个或多个其他有关属性由一个sub-property的的关系。在说明存在这样一种关系的地方,两者属性都定义为每当a资源价值根据子属性,它遵循资源也和那件事有关吗价值财产

  • 每一个语法编码方案是一个(字符串)。

  • 一个词汇表一套是一个还是多个条款.每一个术语是一个或多个的成员吗词汇表

图3 - DCMI词汇表模型图3 - DCMI词汇表模型

关于这个模型有很多值得注意的地方:

  • 每一个价值可能是资源描述在一个单独的描述在同一描述集内——例如,单独的描述可以提供关于的创建者的元数据资源描述

  • 描述模型没有提供显式的机制来指示资源描述或者是任何给定的价值资源描述是否可以使用一个或多个显式指示语句描述或者从属性用于描述任何给定的价值是否可以使用一个或多个显式指示语句在一个单独的描述关于这个价值或者从范围财产

3.描述、描述集和记录

上面提出的抽象模型表示每个DC元数据描述描述了一个,且只描述了一个,资源描述.这通常被称为一对一原则。

然而,实际的元数据应用程序往往基于松散分组的集合描述(资源描述通常都有某种关联),在这里被称为描述集.例如,描述组可能包括描述一幅画和一位艺术家。此外,经常发生的情况是描述组也将包含描述关于描述组本身(有时称为“管理元数据”或“元元数据”)。

描述集为了软件应用程序之间交换的目的,是否以元数据的形式实例化记录,根据DCMI编码准则之一(例如,XHTML元标记、XML和RDF/XML) [DCMI-ENCODINGS]。

4.值

A DC元数据价值是与a相关的物理实体或概念实体吗财产当一个属性对是用来描述资源.例如,价值与都柏林核心™Creator相关财产是一个人、组织或服务——一个物理实体。一个价值与都柏林核心™日期相关财产是时间上的一个点(或范围)——一个概念实体。一个价值与都柏林核心™覆盖相关财产是一个地理区域或国家——一个物理实体。一个价值与都柏林核心™科目相关财产是一个概念(一个概念实体)或一个物理对象或人(一个物理实体)。每一个实体都是a资源

价值可以用URI值.的价值可以由一个或多个代表值的字符串和/或丰富的表示.的价值May用单独的描述.在每种情况下,价值是一个资源

5.DCMI抽象模型语义

DCMI抽象模型中的一些概念来自资源描述框架(RDF)和RDF模式(RDFS),如下所示:

DCMI抽象模型 RDF / RDFS
资源 类:http://www.w3.org/2000/01/rdf-schema#Resource
财产元素 类:http://www.w3.org/1999/02/22-rdf-syntax-ns#Property
类:http://www.w3.org/2000/01/rdf-schema#Class
语法编码方案 类:http://www.w3.org/2000/01/rdf-schema#Datatype
有域的关系 属性:http://www.w3.org/2000/01/rdf-schema#domain
有范围的关系 属性:http://www.w3.org/2000/01/rdf-schema#range
sub-property的的关系 属性:http://www.w3.org/2000/01/rdf-schema#subPropertyOf
子类的的关系 属性:http://www.w3.org/2000/01/rdf-schema#subClassOf

表1 - DCMI抽象模型语义

6.编码指南

特定编码准则(HTML元标签、XML、RDF/XML等)[DCMI-ENCODINGS]不需要对上述抽象模型的所有方面进行编码。然而,它们应该参考DCMI抽象模型,并指出模型的哪些部分被编码了,哪些部分没有。

编码准则应该说明如何价值可以被视为资源描述在一个单独的描述在那些没有URI值

7.术语

本文档使用了以下术语:

http://www.w3.org/2000/01/rdf-schema#Class)
一个由具有共同属性、行为、关系或语义的成员组成的组;一种分类。
资源描述
一个资源它被描述为描述
描述资源URI
一个URI它确定了资源描述
描述
一个或多个语句大约有一个,而且只有一个,资源描述
描述组
一个或多个的集合描述
元素http://www.w3.org/1999/02/22-rdf-syntax-ns#Property)
的同义词财产.应该注意的是,元素这个词通常也用于指XML文档中的结构标记组件。
有域http://www.w3.org/2000/01/rdf-schema#domain)
两者之间的关系财产和一个这表明如果a资源描述价值财产,那么可以得出资源描述这是一个例子吗
有范围http://www.w3.org/2000/01/rdf-schema#range)
两者之间的关系财产和一个这表明如果a资源描述价值财产,那么可以得出价值这是一个例子吗
的实例
两者之间的关系资源和一个这表明其中资源是一个实例。
媒体类型
MIME媒体类型(由rfc2045定义)[MIME-1]及rfc2046 [MIME-2]。
的成员提出了URI:http://purl.org/dc/dcam/memberOf)
两者之间的关系资源和一个词汇编码方案这表明资源是集合的一个成员。
财产http://www.w3.org/1999/02/22-rdf-syntax-ns#Property)
用于描述的特定方面、特征、属性或关系资源
URI属性
一个URI识别出一个财产
属性/值对
a的组合财产和一个价值,用来描述资源
记录
的实例化描述组,根据DCMI编码准则之一创建(例如,XHTML元标记、XML和RDF/XML)。
资源http://www.w3.org/2000/01/rdf-schema#Resource)
任何可以识别的东西。熟悉的例子包括电子文档、图像、服务(例如,“洛杉矶今天的天气预报”)和其他的集合资源.并不是所有的资源网络是否“可检索”;例如,人、公司、概念和图书馆的装订书籍也可以被考虑在内资源
丰富的表示
的八字节序列价值——例如,一些有标记的文本、一幅图像、一段视频、一些音频或它们的组合。
声明
的实例化属性对由一个URI属性(一个URI它确定了财产), 0或1URI值(一个URI它确定了价值财产), 0或1词汇表编码方案URI(一个URI它确定了词汇编码方案其中价值是成员),和零或更多值表示价值
子类的http://www.w3.org/2000/01/rdf-schema#subClassOf)
两者之间的关系这说明这两个都是这样定义的资源那是子的实例也是相关的实例吗).
sub-property的http://www.w3.org/2000/01/rdf-schema#SubPropertyOf)
两者之间的关系属性这说明这两个属性都定义为每当a资源价值由子-财产,由此可知资源也和那件事有关吗价值财产
语法编码方案http://www.w3.org/2000/01/rdf-schema#Datatype)
一组字符串和一组相关的规则,这些规则描述了该字符串集和一组资源.映射规则可以定义字符串的结构(例如DCMI Box),也可以简单地枚举所有字符串和相应的资源(例如ISO 3166)。
语法编码方案URI
一个URI它确定了语法编码方案
术语
一个财产元素),词汇编码方案,或语法编码方案
URI
统一资源标识符[URI]或国际化资源标识符[IRI]。
价值
实体:物理的或概念上的实体资源)财产当一个属性对是用来描述资源
URI值
一个URI它确定了价值
值表示
的代替物(即代表物)价值
值字符串
一个字符串,可选地与任意一个A关联语法编码方案URI或者一个值字符串语言,表示价值
值字符串语言
文件的语言值字符串
词汇表
一个或多个的集合条款
词汇编码方案提出了URI:http://purl.org/dc/dcam/VocabularyEncodingScheme)
的枚举集资源
词汇表编码方案URI
一个URI它确定了词汇编码方案

附录A -与传统DCMI语法原则的关系

Dublin Core™元数据的底层模型自20世纪90年代末首次提出形式主义以来一直在发展。下表给出了DCMI早期版本之间的粗略等价术语语法原则[DCMI- gram - prin]和当前的DCMI抽象模型。

语法原则 DCMI抽象模型
词汇词 资源
元素 财产元素
元素细化 财产sub-property的关系
编码方案 语法编码方案词汇编码方案
语法编码方案 语法编码方案
限定符 财产sub-property的关系,语法编码方案,或词汇编码方案
词汇编码方案 词汇编码方案

表2 - DCMI语法原则和DCMI抽象模型

参考文献

(DCMI)
Dublin Core™元数据计划
<//www.voudr.com/>

(DCMI-GRAM-PRIN)
DCMI使用委员会。DCMI语法原则。2003年11月。
<//www.voudr.com/specifications/dublin-core/grammatical-principles/>

(DCMI-ENCODINGS)
DCMI编码指南
<//www.voudr.com/schemas/>

(IRI)
Duerst, M., M. Suignard。RFC 3987:国际化资源标识符(IRIs)。互联网工程任务小组(IETF)。2005年1月。
<http://www.ietf.org/rfc/rfc3987.txt>

(MIME-1)
弗里德,N.和N.博伦斯坦。RFC 2045:多用途因特网邮件扩展(MIME)第一部分:因特网消息体的格式。互联网工程任务小组(IETF)。1996年11月。
<http://www.ietf.org/rfc/rfc2045.txt>

(MIME-2)
弗里德,N.和N.博伦斯坦。RFC 2045:多用途互联网邮件扩展(MIME)第二部分:媒体类型。互联网工程任务小组(IETF)。1996年11月。
<http://www.ietf.org/rfc/rfc2046.txt>

(RDF)
克莱恩,格雷厄姆和杰里米·卡罗尔,编辑。资源描述框架:概念和抽象语法。W3C推荐标准。2004年2月10日。
<http://www.w3.org/TR/rdf-concepts/>

(RDFS)
布里克利,丹和r·v·古哈,编辑。RDF词汇描述语言1.0:RDF模式。W3C推荐标准。2004年2月10日。
<http://www.w3.org/TR/rdf-schema/>

(UML)
Booch, Grady, James Rumbaugh和Ivar Jacobson。统一建模语言用户指南。addison - wesley, 1998年。

(URI)
伯纳斯-李,T., R.菲尔丁,L.马斯特。统一资源标识符(URI):通用语法。互联网工程任务小组(IETF)。2005年1月。
<http://www.ietf.org/rfc/rfc3986.txt>

确认

感谢Dan Brickley, Rachel Heery, Alistair Miles, Sarah Pulis, DC用法委员会成员和DCMI架构社区成员对本文档先前版本的评论。