元数据设计,实施和最佳实践的创新

DCMI抽象模型

创造者: 安迪•鲍威尔
Eduserv基金会、英国
创造者: Mikael Nilsson.
KMR集团,CID, NADA, KTH(皇家理工学院),瑞典
创造者: Ambjörnnaeve.
KMR集团,CID, NADA, KTH(皇家理工学院),瑞典
创造者: 皮特约翰斯顿
Eduserv基金会、英国
创造者: 托马斯•贝克
DCMI.
发行日期: 2007-04-02
标识符: //www.voudr.com/specifications/dublin-core/abstract-model/2007-04-02/
替换: //www.voudr.com/specifications/dublin-core/abstract-model/2007-02-05/
被替换为: //www.voudr.com/specifications/dublin-core/abstract-model/2007-06-04/
最新版本: //www.voudr.com/specifications/dublin-core/abstract-model/
文件的状态: 这是一个DCMI<一个href="//www.voudr.com/www/specifications/dublin-core/">提出了建议
文件描述: 本文档描述了Dublin Core™元数据的一个抽象模型。

表的内容

  1. 介绍
  2. DCMI抽象模型
  3. 描述、描述集和记录
  4. DCMI抽象模型语义
  5. 编码指南
  6. 术语
    附录A -与传统DCMI语法原则的关系
    参考文献
    致谢

1.介绍

本文档为Dublin Core™元数据指定了一个抽象模型。本文档的主要目的是指定Dublin Core™元数据中使用的组件和构造。它定义了所使用组件的性质,并描述了如何组合这些组件来创建信息结构。它提供了一个独立于任何特定编码语法的信息模型。这样的信息模型使我们能够更好地理解我们正在编码的各种描述,并促进更好的映射和交叉语法翻译的开发。

本文档主要面向支持Dublin Core™元数据的软件应用程序开发人员、参与为Dublin Core™元数据开发新的语法编码指南的人员以及基于DCMI词汇表或其他兼容词汇表开发元数据应用程序概要文件的人员。

DCMI抽象模型建立在万维网联盟(W3C)在资源描述框架(RDF) [RDF, RDFS]上进行的工作之上。下面的第5节总结了RDF概念的使用。

使用UML类图[UML]在此处表示DCMI摘要模型。不熟悉UML类图的读者应该注意,以块箭头中结尾的行应读为“是”或“是”(例如,“a价值是一个资源”),以方块菱形开头的行应该读为“contains a”或“has a”(例如,“a声明包含A.URI属性“)。其他关系是适当标记的。在本文档中,斜体中的单词和短语在第7节中定义,术语。

2. DCMI抽象模型

2.1 DCMI资源模型

的抽象模型资源描述如下:

  • 每个资源描述使用一个或多个描述属性-值

  • 每个属性对是由一个人组成的财产和一个价值

  • 每个价值是一个资源- 物理,数字或概念实体或文字与a相关联财产当一个属性对是用来描述一个资源.因此,每个价值要么是一个字面价值或者一个non-literal价值

    • 一个字面价值是一个价值这是一个文字(由RDF [RDF]定义)。

    • 一个non-literal价值是一个价值这不是一个字面价值

图1 - DCMI资源模型**图1 - DCMI资源模型**

2.2 DCMI描述集型号

DC元数据的抽象模型描述集如下:

  • 一个描述组一组是一个还是多个描述,每个都描述一个单一的资源

  • 一个描述由一个或多个组成语句(大约一个,也只有一个,资源)和0或1描述资源URI(一个URI标识的资源描述).

  • 每个声明实例化A.属性对,是由一个URI属性(一个URI确定一个财产)和一个价值代理

  • 一个价值代理要么是一个字面价值代理人或者一个非文字价值代理

    • 一个字面价值代理人是一个价值代理对于一个字面价值,而且恰好是由一根杆子组成的值字符串.的值字符串是一个文字哪个编码字面价值

    • 一个非文字价值代理是一个价值代理对于一个non-literal价值,由0或1组成URI值(一个URI标识的non-literal价值相关的财产), 0或1词汇编码方案URI(一个URI标识的词汇编码方案其中non-literal价值是成员),零或更多价值字符串.每个值字符串是一个文字代表了non-literal价值

  • 一个值字符串要么是一个普通的字符串值或者一个输入值的字符串

    • 一个普通的字符串值可能有相关的值字符串的语言这是一个ISO语言标记(例如en-GB)。普通值字符串都是人类可读的。

    • 一个输入值的字符串都有一个关联的语法编码方案URI确定一个语法编码方案

图2 - DCMI描述集模型图2 - DCMI描述集模型

2.3 DCMI词汇模型

的抽象模型词汇表用于DC元数据描述如下:

  • 每个财产可能与一个或多个相关由一个有领域的关系。说明了一个财产有这样的关系吗财产是一个属性/值对,由此可知资源描述这是一个例子吗

  • 每个财产可能与一个或多个相关由一个有范围关系。说明了一个财产有这样的关系吗财产是一个属性/值对,由此可知价值这是一个例子吗

  • 每个资源可能是一个的实例一个或多个

  • 每个资源可能是一个的成员一个或多个词汇编码方案

  • 每个可能与一个或多个其他人有关由一个子类的关系(两者的位置都是这样定义的吗资源这是子类的实例也是相关的实例).

  • 每个财产可能与一个或多个其他人有关特性由一个sub-property的关系。在那里说明这样的关系存在,这两个人特性是这样定义的:当a资源与a有关价值由子属性,所以资源也与此相关吗价值财产

  • 每个语法编码方案是一个(文字).

  • 一个词汇表一组是一个还是多个条款.每个术语是一个或多个的成员词汇表

注意“词汇表”这个词在这里是专门指一组条款,其中成员为特性元素),词汇编码方案和/或语法编码方案

图3 - DCMI词汇表模型图3 - DCMI词汇表模型

2.4笔记

关于这个模型有很多值得注意的地方:

  • 每个non-literal价值可能是资源描述在一个单独的描述在同一描述中设置 - 例如,单独的描述可以提供关于那个是创造者的人的元数据资源描述.一个字面价值不可能是资源描述在一个单独的描述

  • DCMI描述集模型不提供明确的机制来指示资源描述课堂资源描述是否可以使用一个或多个显式指示语句描述或被推断出来域名特性在这方面使用描述

  • DCMI描述集模型表明了两者之间的区别文字值非文字价值通过在一个声明字面价值代理人或者一个非文字价值代理.对于一个non-literal价值, DCMI描述集模型没有提供明确的机制来进一步指示价值.任何给定的课程non-literal价值是否可以使用一个或多个显式指示语句在一个单独的描述关于这个价值或被推断出来范围财产.对于一个字面价值,价值是否可以使用语法编码字符串值字符串或被推断出来范围财产

3.描述、描述集和记录

上面提出的抽象模型指出了每个DC元数据描述描述一个,只有一个,资源.这通常被称为一对一原则。

然而,真实的元数据应用程序往往基于松散分组的集合描述(描述了资源在某种程度上通常是相关的),在这里被称为描述集.例如,一个描述组可能包括描述绘画和艺术家。此外,通常情况是描述组还将包含一个描述关于描述组本身(有时被称为“管理元数据”或“元数据”)。

描述集是否以元数据的形式实例化,以便在软件应用程序之间进行交换记录,根据DCMI编码指南之一(例如,XHTML元标签,XML和RDF / XML)[DCMI-engodings]。

4.值

DC元数据价值是物理实体、数字实体还是概念实体文字与a相关联财产当一个属性对是用来描述一个资源.例如,一个价值与Dublin Core™Creator相关联财产是一个人、组织或服务——一个物理实体。一个价值与Dublin Core™日期相关财产是时间(或范围)及时 - 概念实体。一个价值与Dublin Core™覆盖范围有关财产是一个地理区域或国家-一个物理实体。一个价值与Dublin Core™主题相关财产是一个概念(概念实体)或物理对象或人(物理实体)。一个价值与FOAF名称相关联财产是一个文字.每个实体都是a资源

5.DCMI抽象模型语义

注意,本建议没有明确定义DCMI抽象模型的正式语义。其目的是通过引用RDF和RDF Schema语义来定义形式语义,如[RDFMT]中定义的那样。下表给出了DCMI抽象模型中的一些概念与相应的RDF概念之间的等价性:

DCMI抽象模型 RDF / RDFS.
资源 班级:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#resource.
财产或者元素 班级:<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#property.
班级:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Class
语法编码方案 班级:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype
有领域的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain
有范围关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range.
sub-property的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subPropertyOf
子类的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subClassOf

表1 - DCMI抽象模型语义

与DCMI推荐“使用资源描述框架(RDF)表达都柏林核心™”一起[DCRDF],这些等价构成了DCMI抽象模型形式语义的基础。但是,此类语义的细节超出了本建议的范围。

6.编码指南

特定编码准则(HTML元标签、XML、RDF/XML等)[<一个href="//www.voudr.com/www/schemas/">DCMI编码不需要编码上述抽象模型的所有方面。但是,它们应该参考DCMI摘要模型,并指出模型的哪些部分被编码并且不是。

编码指南应说明如何non-literal价值可以视为资源描述在一个单独的描述在那些案件中非文字价值代理不包括URI值

7.术语

本文档使用以下术语:

(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Class)
包含具有共同属性、行为、关系或语义的成员的组;一种类别。
资源描述
一个资源用a来描述描述
描述资源URI
一个URI标识的资源描述
描述
一个或多个语句大约有一个,只有一个,资源
描述组
一个或多个的集合描述,每个都描述一个单一的资源
元素(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#property.)
的同义词财产.应当注意,单词元素也通常用于在XML文档中引用结构标记组件。
有领域的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain)
一种关系财产A.这表明如果是财产是一个属性/值对,那么接下来就是资源描述这是一个例子吗
有范围(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range.)
一种关系财产A.这表明如果是财产是一个属性/值对,那么接下来就是价值这是一个例子吗
的实例
一种关系资源A.这表明一个其中资源是一个实例。
文字
由RDF定义的文字[<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-04-02/#RDF">RDF].
字面价值
一个价值这是一个文字
字面价值代理人
一个价值代理对于一个字面价值,由恰好组成值字符串(一个文字这个编码价值).
的成员提出了URI:<一个href="http://purl.org/dc/dcam/memberOf">http://purl.org/dc/dcam/memberOf
一种关系资源A.词汇编码方案这表明资源是集合中的一个元素。
non-literal价值
一个价值这不是一个字面价值
非文字价值代理
一个价值代理对于一个non-literal价值,由…组成URI属性(一个URI确定一个财产), 0或1URI值(一个URI标识的non-literal价值相关的财产), 0或1词汇编码方案URI(一个URI标识的词汇编码方案其中价值是成员),零或更多价值字符串文字这代表了价值).
普通的字符串值
一个值字符串没有任何关联语法编码方案URI
财产(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#property.)
用于描述的特定方面、特征、属性或关系资源
URI属性
一个URI这识别一个单一的财产
属性/值对
a的组合财产A.价值,用于描述a的特征资源
记录
一个实例化描述组,根据DCMI编码准则之一创建(例如,XHTML元标记、XML和RDF/XML)。
资源(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#resource.)
任何可能被识别的东西。熟悉的例子包括电子文档、图像、服务(例如,“洛杉矶今天的天气报告”)和其他集合资源.不是所有的资源网络“复原”;例如,人、公司、概念和图书馆中的装订书也可以考虑资源
声明
一个实例化属性对由一个组成URI属性(一个URI确定一个财产)和一个价值代理
子类的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subClassOf)
两个之间的关系这表明这两个都是这样定义的吗资源这是子的情况还有相关的实例吗).
sub-property的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#SubPropertyOf)
两个之间的关系特性这表明这两个特性是这样定义的:当a资源与a有关价值由子财产,由此可知资源也与此相关吗价值财产
语法编码方案(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype)
一组字符串和一组相关联的规则,用于描述该字符串集和一组的映射资源.映射规则可以定义字符串的结构(例如DCMI框),或者它们可以简单地枚举所有字符串和相应的资源(例如ISO 3166)。
语法编码方案URI
一个URI确定一个语法编码方案
术语
一个财产元素),词汇编码方案, 或者语法编码方案
输入值的字符串
一个值字符串与关联语法编码方案URI
URI
统一资源标识符[<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-04-02/#URI">URI或国际化资源标识符[<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-04-02/#IRI">IRI].从DCMI抽象模型的角度,uri的等价定义为RDF [<一个href="//www.voudr.com/www/specifications/dublin-core/abstract-model/2007-04-02/#RDF">RDF].
价值
物理实体,概念实体或文字(一个资源),它与a有关财产当一个属性对是用来描述一个资源
URI值
一个URI标识的价值
值字符串
一个文字,可选地与a关联语法编码方案URI或者一个值字符串的语言.在一个字面价值代理人一个值字符串编码价值;在一个非文字价值代理一个值字符串代表这一点价值
值字符串的语言
ISO语言标签,表示文件的语言值字符串
价值代理
一个字面价值代理人或者一个非文字价值代理
词汇表
一个或多个的集合条款
词汇编码方案提出了URI:<一个href="http://purl.org/dc/dcam/VocabularyEncodingScheme">http://purl.org/dc/dcam/VocabularyEncodingScheme
的枚举集资源
词汇编码方案URI
一个URI确定一个词汇编码方案

附录A -与传统DCMI语法原则的关系

自从20世纪90年代末提出第一个形式主义以来,Dublin Core™元数据的基础模型已经发展了。下表给出了DCMI早期版本之间的大致术语等价语法原则[DCMI-GRAM-PRIN]和当前DCMI抽象模型。

DCMI语法原则 DCMI抽象模型
词汇术语 资源
元素 财产或者元素
元素细化 财产sub-property的关系
编码方案 语法编码方案或者词汇编码方案
语法编码方案 语法编码方案
限定符 财产sub-property的关系,语法编码方案, 或者词汇编码方案
词汇编码方案 词汇编码方案

表2 - DCMI语法原则和DCMI抽象模型

参考文献

(DCMI)
Dublin Core™元数据主动
<<一个href="//www.voudr.com/www/">//www.voudr.com/>

[DCMI-GRAM-PRIN]
DCMI使用董事会。DCMI语法原则。2003年11月。
<<一个href="//www.voudr.com/www/specifications/dublin-core/grammatical-principles/">//www.voudr.com/specifications/dublin-core/grammational-principles/>

[DCMI-编码]
DCMI编码指南
<<一个href="//www.voudr.com/www/schemas/">//www.voudr.com/schemas/>

[DCRDF]
Nilsson,Mikael,Andy Powell,Pete Johnston和Ambjörnnaeve。使用资源描述框架(RDF)表达Dublin Core™元数据。DCMI拟议的建议。2007年4月。
<<一个href="//www.voudr.com/www/specifications/dublin-core/dc-rdf/">//www.voudr.com/specifications/dublin-core/dc-rdf/>

(IRI)
杜斯,M.,M. Suignard。RFC 3987:国际化资源标识符(IRIS)。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3987.txt">http://www.ietf.org/rfc/rfc3987.txt>

(RDF)
克莱恩、格雷厄姆和杰里米·卡罗尔,编辑。资源描述框架:概念和抽象语法。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/>

(RDFMT)
海斯,帕特里克,编辑器。RDF语义。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-mt/">http://www.w3.org/TR/rdf-mt/>

[RDFS]
砖利,丹和r.v.古河,编辑。RDF词汇描述语言1.0:RDF架构。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-schema/">http://www.w3.org/TR/rdf-schema/>

(UML)
Booch, Grady, James Rumbaugh和Ivar Jacobson。统一建模语言用户指南。addison - wesley, 1998年。

[Uri]
Berners-Lee, T., R. Fielding, L. Masinter。统一资源标识符(URI):通用语法。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3986.txt">http://www.ietf.org/rfc/rfc3986.txt>

致谢

感谢Dan Brickley, Rachel Heery, Alistair Miles, Sarah Pulis, DC使用委员会的成员和DCMI架构社区的成员对本文档以前版本的评论。