元数据设计,实施和最佳实践的创新

DCMI抽象模型

创造者: 安迪•鲍威尔
Eduserv基金会、英国
创造者: Mikael Nilsson.
KMR集团,CID,NADA,Kth(皇家理工学院),瑞典
创造者: Ambjörnnaeve.
KMR集团,CID,NADA,Kth(皇家理工学院),瑞典
创造者: 皮特约翰斯顿
Eduserv基金会、英国
创造者: 托马斯贝克
DCMI.
发行日期: 2007-06-04
标识符: //www.voudr.com/specifications/dublin-core/abstract-model/2007-06-04/
取代: //www.voudr.com/specifications/dublin-core/abstract-model/2005-03-07/
取代: //www.voudr.com/specifications/dublin-core/abstract-model/2007-04-02/
被替换为: 不适用
最新版本: //www.voudr.com/specifications/dublin-core/abstract-model/
文件的状态: 这是一个dcmi<一个href="//www.voudr.com/www/specifications/dublin-core/">建议
文件描述: 本文档描述了Dublin Core™元数据的一个抽象模型。

表的内容

  1. 介绍
  2. DCMI抽象模型
  3. 描述、描述集和记录
  4. DCMI抽象模型语义
  5. 编码指南
  6. 术语
    附录A - 与遗产DCMI语法原则的关系
    参考
    致谢

1.介绍

本文档为Dublin Core™元数据指定了一个抽象模型。本文档的主要目的是指定Dublin Core™元数据中使用的组件和构造。它定义了所使用组件的性质,并描述了如何组合这些组件来创建信息结构。它提供了一个独立于任何特定编码语法的信息模型。这样的信息模型使我们能够更好地理解我们正在编码的各种描述,并促进更好的映射和交叉语法翻译的开发。

本文档主要面向支持Dublin Core™元数据的软件应用程序开发人员、参与为Dublin Core™元数据开发新的语法编码指南的人员以及基于DCMI词汇表或其他兼容词汇表开发元数据应用程序概要文件的人员。

DCMI抽象模型建立在万维网联盟(W3C)在资源描述框架(RDF) [RDF, RDFS]上进行的工作之上。下面的第5节总结了RDF概念的使用。

使用UML类图[UML]在此表示DCMI摘要模型。不熟悉UML类图的读者应注意,块箭头中结尾的行应读为“是”或“是”(例如,“a价值是一个资源“)并且与块钻石开始的线应该被读为”包含'或'具有'(例如,“a声明包含A.URI属性”)。其他关系被适当地标记。在本文档中,斜体字的单词和短语的定义见第7节,术语。

2. DCMI抽象模型

2.1 DCMI资源模型

的抽象模型资源由此描述描述如下:

  • 每个资源描述使用一个或多个描述属性-值

  • 每个属性对是由一个人组成的财产和一个价值

  • 每个价值是一个资源- 物理,数字或概念实体或文字与a相关联财产当一个属性对是用来描述一个资源.因此,每个价值要么是一个字面价值或者non-literal价值

    • 一个字面价值是一个价值这是一个文字

    • 一个non-literal价值是一个价值它是一个物理的、数字的或概念性的实体。

  • 一个文字是一个实体,它使用Unicode字符串作为词法形式,以及可选的语言标记或数据类型,以表示一个资源(即RDF定义的“文字”[RDF]).

图1 - DCMI资源模型图1 - DCMI资源模型

2.2 DCMI描述集型号

DC元数据的抽象模型描述集如下:

  • 一个描述组一组是一个还是多个描述,每个都描述一个单一的资源

  • 一个描述由一个或多个组成陈述(大约一个,也只有一个,资源)和零或一个描述资源URI(一个Uri.标识的资源描述).

  • 每个声明实例化一个属性对,是由一个URI属性(一个Uri.确定一个财产)和一个价值代理

  • 一个价值代理要么是一个字面价值替代或者非文字价值代理

    • 一个字面价值替代是一个价值代理对于一个字面价值,而且恰好是由一根杆子组成的值字符串.这值字符串是一个文字哪个编码字面价值

    • 一个非文字价值代理是一个价值代理对于一个non-literal价值,由0或1组成URI值(一个Uri.标识的non-literal价值相关的财产), 0或1词汇编码方案URI(一个Uri.标识的词汇编码方案其中,其中non-literal价值是成员),零或更多价值字符串.每个值字符串是一个文字这代表了这一点non-literal价值

  • 一个值字符串要么是一个普通的字符串值或者输入值的字符串

    • 一个普通的字符串值可能有相关的值字符串的语言这是一个ISO语言标记(例如en-GB)。普通值字符串都是人类可读的。

    • 一个输入值的字符串都有一个关联的语法编码方案URI确定一个语法编码方案

图2 - DCMI描述集模型**图2 - DCMI描述设置模型**

2.3 DCMI词汇模型

的抽象模型词汇表用于DC元数据描述如下:

  • 一个词汇表一组是一个还是多个条款.每个术语是一个或多个成员词汇表

  • 一个术语是一个财产元素),词汇编码方案, 要么语法编码方案

  • 每个财产可能与一个或多个相关由一个有域的关系。这里写着a财产有这样的关系吗财产是一个属性/值对,由此可知资源描述这是一个例子吗

  • 每个财产可能与一个或多个相关由一个有范围的关系。这里写着a财产有这样的关系吗财产是一个属性/值对,由此可知价值这是一个例子吗

  • 每个资源可能是一个实例一个或多个

  • 每个资源可能是一个的成员一个或多个词汇编码方案

  • 每个可能与一个或多个其他人有关由一个子类的关系(两者的位置都是这样定义的吗资源这是子类的实例也是相关的实例).

  • 每个财产可能与一个或多个其他人有关特性由一个sub-property的的关系。在说明这样的关系存在的情况下,两者特性是这样定义的,每当sub-property是一个属性/值对描述A.资源,由此可知资源也可以用second属性/值对由…组成财产价值

  • 每个语法编码方案是一个(的文字).

请注意,这里使用“词汇”一词专门引用一组条款,其中成员为特性元素),词汇编码方案和/或语法编码方案

图3 - DCMI词汇表模型图3 - DCMI词汇表模型

2.4笔记

关于这个模型有很多值得注意的地方:

  • 每个non-literal价值可能是资源描述在一个单独的描述在同一描述中设置 - 例如,单独的描述可以提供关于作为创造者的人的元数据资源描述.一个字面价值不可能是资源描述在一个单独的描述

  • DCMI描述集模型不提供指示的明确机制资源描述班级资源描述是否可以使用一个或多个显式指示陈述在里面描述或被推断出来域名特性在这方面使用描述

  • DCMI描述集模型表明了两者之间的区别文字值非文字价值通过在一个声明字面价值替代或者非文字价值代理.对于一个non-literal价值, DCMI描述集模型没有提供明确的机制来进一步指示价值.任何给定的课程non-literal价值是否可以使用一个或多个显式指示陈述在一个单独的描述关于这个价值或被推断出来范围财产.对于一个字面价值,价值是否可以使用语法编码方案值字符串或被推断出来范围财产

  • XML内容在一个值字符串是用输入值的字符串与A.语法编码方案URI的<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral.

3.描述、描述集和记录

上面提出的抽象模型指出了每个DC元数据描述描述一个,只有一个,资源.这通常被称为一对一原则。

然而,现实世界的元数据应用倾向于基于松散分组的组描述(资源描述在某种程度上通常是相关的),在这里被称为描述集.例如,一个描述组可能包括描述绘画和艺术家。此外,通常情况是描述组也包含描述有关描述组本身(有时被称为“管理元数据”或“元数据”)。

描述集是否以元数据的形式实例化,以便在软件应用程序之间进行交换记录,根据DCMI编码指南之一(例如,XHTML元标签,XML和RDF / XML)[DCMI编码]。

4.值

DC元数据价值是物理实体、数字实体还是概念实体文字与a相关联财产当一个属性对是用来描述一个资源.例如,一个价值与Dublin Core™Creator相关联财产是一个人、组织或服务——一个物理实体。一个价值与Dublin Core™日期相关财产是一个点(或范围)及时 - 一个概念实体。一个价值与Dublin Core™覆盖范围有关财产是一个地理区域或国家-一个物理实体。一个价值与Dublin Core™主题相关财产是一个概念(一个概念性实体)或一个物理对象或人(一个物理实体)。一个价值与FOAF名称相关联财产是一个文字.每个实体都是a资源

5.DCMI抽象模型语义

注意,本建议没有明确定义DCMI抽象模型的正式语义。其目的是通过引用RDF和RDF Schema语义来定义形式语义,如[RDFMT]中定义的那样。下表给出了DCMI抽象模型中的一些概念与相应的RDF概念之间的等价性:

DCMI抽象模型 RDF / RDFS.
资源 班级:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#resource.
财产要么元素 班级:<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#Property
班级:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Class
语法编码方案 班级:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype
有域关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain
有范围关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range.
sub-property的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subPropertyOf
子类的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subClassOf
普通的字符串值 纯文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/#dfn-plain-literal
输入值的字符串 输入的文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/tr/rdf-concepts/#dfn-typed-literal.

表1 - DCMI抽象模型语义

与DCMI推荐“使用资源描述框架(RDF)表达都柏林核心™”一起[DCRDF],这些等价构成了DCMI抽象模型形式语义的基础。但是,此类语义的细节超出了本建议的范围。

6.编码指南

特定编码准则(HTML元标签、XML、RDF/XML等)[<一个href="//www.voudr.com/www/schemas/">DCMI编码不需要编码上述抽象模型的所有方面。但是,它们应该参考DCMI抽象模型,并指出模型的哪些部分被编码,并且不是。

编码指南应说明如何non-literal价值可以视为资源描述在一个单独的描述在那些案件中非文字价值代理不包括URI值

7.术语

本文档使用以下术语:

(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Class)
包含具有共同属性、行为、关系或语义的成员的组;一种类别。
资源描述
一个资源用a来描述描述
描述资源URI
一个Uri.标识的资源描述
描述
一个或多个陈述大约有一个,只有一个,资源
描述组
一个或多个的集合描述,每个都描述一个单一的资源
元素(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#Property)
的同义词财产.应当注意,单词元素也通常用于在XML文档中引用结构标记组件。
有域(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain)
a之间的关系财产A.这表明如果是财产是一个属性/值对,那么接下来就是资源描述这是一个例子吗
有范围(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range.)
a之间的关系财产A.这表明如果是财产是一个属性/值对,那么接下来就是价值这是一个例子吗
实例
a之间的关系资源A.这表明一个其中,其中资源是一个实例。
文字
使用Unicode字符串作为词形式的实体以及可选的语言标签或数据类型,以表示a资源(即RDF定义的“文字”[<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-06-04/#RDF">RDF]。
字面价值
一个价值这是一个文字
字面价值替代
一个价值代理对于一个字面价值,由恰好组成值字符串(一个文字这个编码价值).
的成员(<一个href="http://purl.org/dc/dcam/memberOf">http://purl.org/dc/dcam/memberOf)
a之间的关系资源A.词汇编码方案这表明资源是集合中的一个元素。
non-literal价值
一个价值它是一个物理的、数字的或概念性的实体。
非文字价值代理
一个价值代理对于一个non-literal价值,由a组成URI属性(一个Uri.确定一个财产), 0或1URI值(一个Uri.标识的non-literal价值相关的财产), 0或1词汇编码方案URI(一个Uri.标识的词汇编码方案其中,其中价值是成员),零或更多价值字符串文字这代表了价值).
普通的字符串值
一个值字符串没有一个相关的语法编码方案URI
财产(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#Property)
用于描述的特定方面、特征、属性或关系资源
URI属性
一个Uri.这是一个单一的财产
属性/值对
a的组合财产A.价值,用于描述一个特征资源
记录
一个实例化描述组,根据DCMI编码准则之一创建(例如,XHTML元标记、XML和RDF/XML)。
资源(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#resource.)
任何可能被识别的东西。熟悉的例子包括电子文档、图像、服务(例如,“洛杉矶今天的天气报告”)和其他集合资源.并不是所有的资源网络“复原”;例如,人、公司、概念和图书馆中的装订书也可以考虑资源
声明
一个实例化属性对由一个人组成URI属性(一个Uri.确定一个财产)和一个价值代理
子类的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subClassOf)
两者之间的关系这表明这两个都是这样定义的吗资源这是子的实例还有相关的实例吗).
sub-property的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#SubPropertyOf)
两者之间的关系特性这表明这两个特性定义了这样的时间的sub-property是一个属性/值对描述A.资源,请遵循使用第二个资源属性/值对由…组成财产价值
语法编码方案(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype)
一组字符串和关联的规则集描述了该组字符串和一组之间的映射资源.映射规则可以定义字符串的结构(例如DCMI框),或者它们可以简单地枚举所有字符串和相应的资源(例如ISO 3166)。
语法编码方案URI
一个Uri.确定一个语法编码方案
术语
一个财产元素),词汇编码方案, 要么语法编码方案
输入值的字符串
一个值字符串有一个关联的语法编码方案URI
Uri.
统一资源标识符[<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-06-04/#URI">Uri.或国际化资源标识符[<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-06-04/#IRI">IRI]。从DCMI抽象模型的角度来看,URI的等价定义为RDF [<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-06-04/#RDF">RDF]。
价值
物理实体,概念实体或文字(一个资源),它与a有关财产当一个属性对是用来描述一个资源
URI值
一个Uri.标识的价值
值字符串
一个文字,可选地与a关联语法编码方案URI或者值字符串的语言.在一个字面价值替代一个值字符串编码价值;在一个非文字价值代理一个值字符串代表价值
值字符串的语言
ISO语言标签,表示文件的语言值字符串
价值代理
一个字面价值替代或者非文字价值代理
词汇表
一个或多个的集合条款
词汇编码方案(<一个href="http://purl.org/dc/dcam/VocabularyEncodingScheme">http://purl.org/dc/dcam/VocabularyEncodingScheme)
的枚举集资源
词汇编码方案URI
一个Uri.确定一个词汇编码方案

附录A - 与遗产DCMI语法原则的关系

自从20世纪90年代末提出第一个形式主义以来,Dublin Core™元数据的基础模型已经发展了。下表给出了DCMI早期版本之间的大致术语等价语法原则[DCMI-GRAM-PRIN]和当前DCMI抽象模型。

DCMI语法原则 DCMI抽象模型
词汇术语 资源
元素 财产要么元素
元素细化 财产sub-property的关系
编码方案 语法编码方案要么词汇编码方案
语法编码方案 语法编码方案
限定符 财产sub-property的关系,语法编码方案, 要么词汇编码方案
词汇编码方案 词汇编码方案

表2 - DCMI语法原则和DCMI抽象模型

参考

(DCMI)
都柏林酷睿™元数据主动
<<一个href="//www.voudr.com/www/">//www.voudr.com/>

[DCMI-GRAM-PRIN]
DCMI使用董事会。DCMI语法原则。2003年11月。
<<一个href="//www.voudr.com/www/specifications/dublin-core/grammatical-principles/">//www.voudr.com/specifications/dublin-core/grammial-principles/>

(DCMI-ENCODINGS)
DCMI编码指南
<<一个href="//www.voudr.com/www/schemas/">//www.voudr.com/schemas/>

[dcrdf]
Nilsson,Mikael,Andy Powell,Pete Johnston和Ambjörnnaeve。使用资源描述框架(RDF)表达Dublin Core™元数据。DCMI拟议的建议。2007年4月。
<<一个href="//www.voudr.com/www/specifications/dublin-core/dc-rdf/">//www.voudr.com/specifications/dublin-core/dc-rdf/>

[Iri]
杜斯,M.,M. Suignard。RFC 3987:国际化资源标识符(IRIS)。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3987.txt">http://www.ietf.org/rfc/rfc3987.txt>

(RDF)
克莱恩、格雷厄姆和杰里米·卡罗尔,编辑。资源描述框架:概念和抽象语法。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/>

(RDFMT)
海斯,帕特里克,编辑器。RDF语义。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-mt/">http://www.w3.org/TR/rdf-mt/>

[RDFS]
砖利,丹和r.v.古河,编辑。RDF词汇描述语言1.0:RDF架构。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-schema/">http://www.w3.org/TR/rdf-schema/>

(UML)
Booch, Grady, James Rumbaugh和Ivar Jacobson。统一建模语言用户指南。addison - wesley, 1998年。

[Uri]
Berners-Lee, T., R. Fielding, L. Masinter。统一资源标识符(URI):通用语法。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3986.txt">http://www.ietf.org/rfc/rfc3986.txt>

致谢

感谢Dan Brickley, Rachel Heery, Alistair Miles, Sarah Pulis, DC使用委员会的成员和DCMI架构社区的成员对本文档以前版本的评论。

errata 2007-09-24:固定的印刷错误 - 删除额外的“是”在“它是”的两个实例中。

勘误表2013-02-11:修正了dcm - gram - prin的URL。