元数据设计、实施和最佳实践方面的创新

DCMI抽象模型

创造者: 安迪•鲍威尔
Eduserv基金会、英国
米凯尔尼尔森
KMR集团,CID, NADA, KTH(皇家理工学院),瑞典
Ambjorn Naeve
KMR集团,CID, NADA, KTH(皇家理工学院),瑞典
皮特·约翰斯顿
Eduserv基金会、英国
汤姆贝克
DCMI
发行日期: 2007-06-04
最新版本: //www.voudr.com/specifications/dublin-core/abstract-model/
发布历史: //www.voudr.com/specifications/dublin-core/abstract-model/release_history/
描述: 该文档为DCMI元数据描述指定了一个抽象模型。

表的内容

  1. 介绍
  2. DCMI抽象模型
  3. 描述、描述集和记录
  4. DCMI抽象模型语义
  5. 编码指南
  6. 术语
    附录A -与传统DCMI语法原则的关系
    参考文献
    确认

1.介绍

本文档为Dublin Core™元数据指定了一个抽象模型。本文档的主要目的是指定Dublin Core™元数据中使用的组件和构造。它定义了所使用组件的性质,并描述了如何组合这些组件来创建信息结构。它提供了一个独立于任何特定编码语法的信息模型。这样的信息模型使我们能够更好地理解我们正在编码的各种描述,并促进更好的映射和交叉语法翻译的开发。

本文档主要面向支持Dublin Core™元数据的软件应用程序开发人员、参与为Dublin Core™元数据开发新的语法编码指南的人员以及基于DCMI词汇表或其他兼容词汇表开发元数据应用程序概要文件的人员。

DCMI抽象模型建立在万维网联盟(W3C)在资源描述框架(RDF) [RDF, RDFS]上进行的工作之上。下面的第5节总结了RDF概念的使用。

这里使用UML类图[UML]表示DCMI抽象模型。不熟悉UML类图的读者应该注意,以块箭头结尾的行应该被理解为“is”或“is a”(例如,“a”价值是一个资源”),以方块菱形开头的行应该读为“contains a”或“has a”(例如,“a声明包含一个URI属性").其他关系被适当地标记。在本文档中,斜体字的单词和短语的定义见第7节,术语。

2.DCMI抽象模型

2.1 DCMI资源模型

的抽象模型资源所描述的描述如下:

  • 每一个资源描述使用一个或多个属性-值

  • 每一个属性对是由一个人组成的财产和一个价值

  • 每一个价值是一个资源-物理的、数字的或概念的实体或文字它和a有关财产当一个属性对是用来描述一个资源.因此,每个价值要么是一个文字值或者一个non-literal价值

    • 一个文字值是一个价值这是一个文字

    • 一个non-literal价值是一个价值它是一个物理的、数字的或概念性的实体。

  • 一个文字是一个实体,它使用Unicode字符串作为词法形式,以及可选的语言标记或数据类型,以表示一个资源(即。“文字的”,由RDF [RDF]定义。

图1 - DCMI资源模型图1 - DCMI资源模型

2.2 DCMI描述集型号

DC元数据的抽象模型描述集如下:

  • 一个描述组一组是一个还是多个描述,每个都描述一个单一的资源

  • 一个描述是由一个或多个组成的语句(大约一个,也只有一个,资源)和0或1描述资源URI(一个URI标识的资源描述).

  • 每一个声明实例化一个属性对,是由一个URI属性(一个URI确定一个财产)和一个价值的代理

  • 一个价值的代理要么是一个文字值替代或者一个non-literal值替代

    • 一个文字值替代是一个价值的代理对于一个文字值,而且恰好是由一根杆子组成的值字符串.的值字符串是一个文字的编码文字值

    • 一个non-literal值替代是一个价值的代理对于一个non-literal价值,由0或1组成URI值(一个URI标识的non-literal价值相关的财产), 0或1词汇编码方案URI(一个URI标识的词汇编码方案non-literal价值是成员),零或更多值的字符串.每一个值字符串是一个文字代表了non-literal价值

  • 一个值字符串要么是一个普通的字符串值或者一个输入值的字符串

    • 一个普通的字符串值可能有相关的值字符串的语言这是一个ISO语言标记(例如en-GB)。普通的字符串值都是人类可读的。

    • 一个输入值的字符串都有一个关联的语法编码方案URI确定一个语法编码方案

图2 - DCMI描述集模型图2 - DCMI描述集模型

2.3 DCMI词汇模型

的抽象模型词汇表用于DC元数据描述如下:

  • 一个词汇表一组是一个还是多个条款.每一个术语成员是一个还是多个词汇表

  • 一个术语是一个财产元素),词汇编码方案,或语法编码方案

  • 每一个财产可能与一个或多个相关由一个有域的关系。这里写着a财产有这样的关系吗财产是一个属性/值对,由此可知资源描述这是一个例子吗

  • 每一个财产可能与一个或多个相关由一个有范围的关系。这里写着a财产有这样的关系吗财产是一个属性/值对,由此可知价值这是一个例子吗

  • 每一个资源可能是一个的实例一个或多个

  • 每一个资源可能是一个的成员一个或多个词汇编码方案

  • 每一个可能与一个或多个其他相关由一个子类的关系(二都是这样定义的吗资源子类的实例也是相关类的实例).

  • 每一个财产可能与一个或多个其他相关属性由一个sub-property的的关系。在哪里说存在这样的关系,两个属性是这样定义的,每当sub-property是一个属性/值对描述一个资源,由此可知资源也可以用second属性/值对由…组成财产价值

  • 每一个语法编码方案是一个(文字).

注意“词汇表”这个词在这里是专门指一组条款,其中成员为属性元素),词汇编码方案和/或语法编码方案

图3 - DCMI词汇表模型图3 - DCMI词汇表模型

2.4笔记

关于这个模型有很多值得注意的地方:

  • 每一个non-literal价值可能是资源描述在一个单独的描述在相同的描述集内-例如,一个单独的描述可以提供关于?的创建者的元数据资源描述.一个文字值不可能是资源描述在一个单独的描述

  • DCMI描述集模型没有提供明确的机制来指示资源描述资源描述是否可以使用一个或多个显式指示语句描述或从属性中使用的描述

  • DCMI描述集模型表明了两者之间的区别文字值non-literal值通过在一个声明文字值替代或者一个non-literal值替代.对于一个non-literal价值, DCMI描述集模型没有提供明确的机制来进一步指示价值.任意给定的类non-literal价值是否可以使用一个或多个显式指示语句在一个单独的描述关于这个价值或从范围财产.对于一个文字值,价值是否可以使用语法编码方案值字符串或从范围财产

  • 的XML内容值字符串是用输入值的字符串与一个语法编码方案URI的<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral.

3.描述、描述集和记录

上面提出的抽象模型指出了每个DC元数据描述描述了一个,而且只有一个,资源.这通常被称为一对一原则。

然而,真实的元数据应用程序往往基于松散分组的集合描述(资源描述在某种程度上通常是相关的),在这里被称为描述集.例如,一个描述组可能包括描述一幅画和一个艺术家。此外,经常有这样的情况描述组也包含描述关于描述组本身(有时被称为“管理元数据”或“元数据”)。

描述集是否以元数据的形式实例化,以便在软件应用程序之间进行交换记录,根据DCMI编码准则之一(例如,XHTML元标记、XML和RDF/XML) [DCMI- encodings]。

4.值

DC元数据价值是物理实体、数字实体还是概念实体文字它和a有关财产当一个属性对是用来描述一个资源.例如,一个价值与Dublin Core™Creator相关财产是一个人、组织或服务——一个物理实体。一个价值与Dublin Core™日期相关财产是时间上的一个点(或范围)-一个概念实体。一个价值与Dublin Core™覆盖相关财产是一个地理区域或国家-一个物理实体。一个价值与Dublin Core™主题相关财产是一个概念(一个概念性实体)或一个物理对象或人(一个物理实体)。一个价值与FOAF名称相关联财产是一个文字.每个实体都是a资源

5.DCMI抽象模型语义

注意,本建议没有明确定义DCMI抽象模型的正式语义。其目的是通过引用RDF和RDF Schema语义来定义形式语义,如[RDFMT]中定义的那样。下表给出了DCMI抽象模型中的一些概念与相应的RDF概念之间的等价性:

DCMI抽象模型 RDF / RDFS
资源 类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Resource
财产元素 类:<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#Property
类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Class
语法编码方案 类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype
有域的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain
有范围的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range
sub-property的的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subPropertyOf
子类的的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subClassOf
普通的字符串值 纯文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/#dfn-plain-literal
输入值的字符串 输入的文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/#dfn-typed-literal

表1 - DCMI抽象模型语义

与DCMI推荐“使用资源描述框架(RDF)表达都柏林核心™”一起[DCRDF],这些等价构成了DCMI抽象模型形式语义的基础。但是,此类语义的细节超出了本建议的范围。

6.编码指南

特定编码准则(HTML元标签、XML、RDF/XML等)[<一个href="//www.voudr.com/schemas/">DCMI-ENCODINGS不需要对上面描述的抽象模型的所有方面进行编码。但是,它们应该引用DCMI抽象模型,并指出模型的哪些部分编码了,哪些没有编码。

编码准则应指明如何non-literal价值可以视为资源描述在一个单独的描述在这些情况下non-literal值替代不包括URI值

7.术语

本文档使用的术语如下:

(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Class)
包含具有共同属性、行为、关系或语义的成员的组;一种类别。
资源描述
一个资源用a来描述描述
描述资源URI
一个URI标识的资源描述
描述
一个或多个语句大约有一个,只有一个,资源
描述组
一个或多个的集合描述,每个都描述一个单一的资源
元素(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#Property)
的同义词财产.应该注意的是,word element也通常用于指XML文档中的结构化标记组件。
有域(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain)
一种关系财产和一个这表明如果财产是一个属性/值对,那么接下来就是资源描述这是一个例子吗
有范围(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range)
一种关系财产和一个这表明如果财产是一个属性/值对,那么接下来就是价值这是一个例子吗
的实例
一种关系资源和一个这表明一个资源是一个实例。
文字
一种实体,它使用Unicode字符串作为词法形式,以及可选的语言标记或数据类型来表示资源(即。RDF定义的“文字”[<一个href="#RDF">RDF].
文字值
一个价值这是一个文字
文字值替代
一个价值的代理对于一个文字值,正好由一个人组成值字符串(一个文字这个编码价值).
的成员(<一个href="http://purl.org/dc/dcam/memberOf">http://purl.org/dc/dcam/memberOf)
一种关系资源和一个词汇编码方案这表明资源是集合中的一个元素。
non-literal价值
一个价值它是一个物理的、数字的或概念性的实体。
non-literal值替代
一个价值的代理对于一个non-literal价值,由…组成URI属性(一个URI确定一个财产), 0或1URI值(一个URI标识的non-literal价值相关的财产), 0或1词汇编码方案URI(一个URI标识的词汇编码方案价值是成员),零或更多值的字符串文字这代表了价值).
普通的字符串值
一个值字符串没有一个相关的语法编码方案URI
财产(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#Property)
用于描述的特定方面、特征、属性或关系资源
URI属性
一个URI它确定了一个财产
属性/值对
a的组合财产和一个价值的特征资源
记录
的实例化描述组,根据DCMI编码准则之一创建(例如,XHTML元标记、XML和RDF/XML)。
资源(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Resource)
任何可能被识别的东西。熟悉的例子包括电子文档、图像、服务(例如,“洛杉矶今天的天气报告”)和其他集合资源.并不是所有的资源网络“复原”;例如,人、公司、概念和图书馆中的装订书也可以考虑资源
声明
的实例化属性对由…组成URI属性(一个URI确定一个财产)和一个价值的代理
子类的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subClassOf)
两者之间的关系这表明这两个都是这样定义的吗资源是子的实例还有相关的实例吗).
sub-property的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#SubPropertyOf)
两者之间的关系属性这表明这两个属性是这样定义的的sub-property是一个属性/值对描述一个资源,则该资源也使用第二个属性/值对由…组成财产价值
语法编码方案(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype)
一组字符串和一组相关联的规则,用于描述该字符串集和一组的映射资源.映射规则可以定义字符串的结构(例如DCMI Box),也可以简单地枚举所有字符串和相应的资源(例如ISO 3166)。
语法编码方案URI
一个URI确定一个语法编码方案
术语
一个财产元素),词汇编码方案,或语法编码方案
输入值的字符串
一个值字符串有一个关联的语法编码方案URI
URI
统一资源标识符[<一个href="#URI">URI或国际化资源标识符[<一个href="#IRI">IRI].从DCMI抽象模型的角度,uri的等价定义为RDF [<一个href="#RDF">RDF].
价值
物理实体,概念实体或文字(一个资源),它与a有关财产当一个属性对是用来描述一个资源
URI值
一个URI标识的价值
值字符串
一个文字,可选地与a关联语法编码方案URI或者一个值字符串的语言.在一个文字值替代一个值字符串编码价值;在一个non-literal值替代一个值字符串代表了价值
值字符串的语言
ISO语言标签,表示文件的语言值字符串
价值的代理
一个文字值替代或者一个non-literal值替代
词汇表
一个或多个的集合条款
词汇编码方案(<一个href="http://purl.org/dc/dcam/VocabularyEncodingScheme">http://purl.org/dc/dcam/VocabularyEncodingScheme)
的枚举集资源
词汇编码方案URI
一个URI确定一个词汇编码方案

附录A -与传统DCMI语法原则的关系

自从20世纪90年代末提出第一个形式主义以来,Dublin Core™元数据的基础模型已经发展了。下表给出了DCMI早期版本之间的大致术语等价语法原则[DCMI- gram - prin]和当前的DCMI抽象模型。

DCMI语法原则 DCMI抽象模型
词汇词 资源
元素 财产元素
元素细化 财产sub-property的关系
编码方案 语法编码方案词汇编码方案
语法编码方案 语法编码方案
限定符 财产sub-property的关系,语法编码方案,或词汇编码方案
词汇编码方案 词汇编码方案

表2 - DCMI语法原则和DCMI抽象模型

参考文献

(DCMI)
Dublin Core™元数据计划
<<一个href="//www.voudr.com/">//www.voudr.com/>

(DCMI-GRAM-PRIN)
DCMI的使用。DCMI语法原则。2003年11月。
<<一个href="//www.voudr.com/specifications/dublin-core/grammatical-principles/">//www.voudr.com/specifications/dublin-core/grammatical-principles/>

(DCMI-ENCODINGS)
DCMI编码指南
<<一个href="//www.voudr.com/schemas/">//www.voudr.com/schemas/>

(DCRDF)
尼尔森,迈克尔,安迪·鲍威尔,皮特·约翰斯顿,Ambjörn纳伊夫。使用资源描述框架(RDF)表达Dublin Core™元数据。DCMI提出建议。2007年4月。
<<一个href="//www.voudr.com/specifications/dublin-core/dc-rdf/">//www.voudr.com/specifications/dublin-core/dc-rdf/>

(IRI)
杜斯特,苏伊格纳德。RFC 3987:国际化资源标识符(IRIs)。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3987.txt">http://www.ietf.org/rfc/rfc3987.txt>

(RDF)
克莱恩、格雷厄姆和杰里米·卡罗尔,编辑。资源描述框架:概念和抽象语法。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/>

(RDFMT)
海斯,帕特里克,编辑器。RDF语义。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-mt/">http://www.w3.org/TR/rdf-mt/>

(RDFS)
布里克利,丹和R.V.古哈,编辑。RDF词汇描述语言1.0:RDF模式。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-schema/">http://www.w3.org/TR/rdf-schema/>

(UML)
Booch, Grady, James Rumbaugh和Ivar Jacobson。统一建模语言用户指南。addison - wesley, 1998年。

(URI)
Berners-Lee, T., R. Fielding, L. Masinter。统一资源标识符(URI):通用语法。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3986.txt">http://www.ietf.org/rfc/rfc3986.txt>

确认

感谢Dan Brickley, Rachel Heery, Alistair Miles, Sarah Pulis, DC使用委员会的成员和DCMI架构社区的成员对本文档以前版本的评论。

勘误表2007-09-24:排印错误——在两次“which is is”中删除了额外的“is”。

勘误表2013-02-11:修正了dcm - gram - prin的URL。