元数据设计、实施和最佳实践方面的创新

DCMI抽象模型

创造者: 安迪鲍威尔
英国Eduserv基金会
创造者: 米凯尔尼尔森
KMR集团,CID,NADA,Kth(皇家理工学院),瑞典
创造者: Ambjorn Naeve
KMR集团,CID,NADA,Kth(皇家理工学院),瑞典
创造者: 皮特·约翰斯顿
英国Eduserv基金会
创造者: 托马斯贝克
DCMI
发行日期: 2007-06-04
标识符: //www.voudr.com/specifications/dublin-core/abstract-model/2007-06-04/
取代: //www.voudr.com/specifications/dublin-core/abstract-model/2005-03-07//2005-03-07/
取代: //www.voudr.com/specifications/dublin-core/abstract-model/2007-04-02/
取而代之的是: 不适用
最新版本: //www.voudr.com/specifications/dublin-core/abstract-model/
文档的状态: 这是一个dcmi<一个href="//www.voudr.com/specifications/dublin-core/">建议
描述文档: 本文档描述了Dublin Core™元数据的抽象模型。

目录

  1. 介绍
  2. DCMI抽象模型
  3. 描述、描述集和记录
  4. DCMI抽象模型语义
  5. 编码指南
  6. 术语
    附录A - 与遗产DCMI语法原则的关系
    参考
    确认

1.介绍

本文档指定了Dublin Core™元数据的抽象模型。本文档的主要目的是指定Dublin Core™元数据中使用的组件和构造。它定义了所用组件的性质,并描述这些组件如何组合以创建信息结构。它提供了一种独立于任何特定编码语法的信息模型。这样的信息模型允许我们更好地理解我们正在编码的这些描述,并促进更好的映射和跨语法翻译的发展。

本文档主要面向支持Dublin Core™元数据的软件应用程序开发人员、参与为Dublin Core™元数据开发新的语法编码指南的人员以及基于DCMI词汇表或其他兼容词汇表开发元数据应用程序概要文件的人员。

DCMI摘要模型在资源描述框架(RDF)[RDF,RDFS]上的世界范围内联盟(W3C)开展的工作构建。从RDF的使用情况总结在第5节中。

这里使用UML类图[UML]表示DCMI抽象模型。不熟悉UML类图的读者应该注意,以块箭头结尾的行应该被理解为“is”或“is a”(例如,“a”价值是A.资源“)并且与块钻石开始的线应该被读为”包含'或'具有'(例如,“a陈述包含一个URI属性“)。其他关系是适当标记的。在本文档中,斜体中的单词和短语在第7节中定义,术语。

2.DCMI抽象模型

2.1 DCMI资源模型

抽象模型资源所描述的描述如下:

  • 每一个描述资源使用一个或多个物业 - 价值对

  • 每一个属性对是由一个人组成的财产和一个价值

  • 每一个价值是A.资源-物理的、数字的或概念的实体或文字它和a有关财产当一个属性对是用来描述一个资源.因此,每个价值要么是一个文字值或者一个非文字价值

    • 一个文字值是A.价值这是A.文字

    • 一个非文字价值是A.价值这是一种物理,数字或概念实体。

  • 一个文字是一个实体,它使用Unicode字符串作为词法形式,以及可选的语言标记或数据类型,以表示一个资源(即“文字”由RDF [RDF]所定义)。

图1 - DCMI资源模型**图1 - DCMI资源模型**

2.2 DCMI描述集型号

DC元数据的抽象模型描述集如下:

  • 一个描述组是一组一个或多个描述,每个都描述一个单一的资源

  • 一个描述是由一个或多个组成的陈述(大约一个,也只有一个,资源)和零或一个描述资源URI.(aURI标识的描述资源).

  • 每一个陈述实例化A.属性对,并由一个组成URI属性(aURI确定一个财产)和一个价值的代理

  • 一个价值的代理要么是一个文字值替代或者一个non-literal值替代

    • 一个文字值替代是A.价值的代理为一个文字值,而且恰好是由一根杆子组成的值字符串.这值字符串是A.文字的编码文字值

    • 一个non-literal值替代是A.价值的代理为一个非文字价值,由0或1组成URI值(aURI标识的非文字价值与之相关财产),零或一个词汇编码方案URI(aURI标识的词汇编码方案非文字价值是一个成员),零或更多值的字符串.每一个值字符串是A.文字这代表了这一点非文字价值

  • 一个值字符串要么是一个普通的字符串值或者一个输入值的字符串

    • 一个普通的字符串值可能有一个关联的value字符串语言这是一个ISO语言标记(例如en-GB)。普通的字符串值旨在是人类可读的。

    • 一个输入值的字符串有一个相关的语法编码方案URI确定一个语法编码方案

图2 - DCMI描述集模型**图2 - DCMI描述设置模型**

2.3 DCMI词汇模型

抽象模型词汇表用于DC元数据描述如下:

  • 一个词汇表是一组一个或多个术语.每一个术语成员是一个还是多个词汇表

  • 一个术语是A.财产元素),词汇编码方案,或语法编码方案

  • 每一个财产可能与一个或多个有关班级由A.有领域的的关系。在那里说明了一个财产有这样的关系吗财产是一个属性/价值对,它遵循描述资源是一个实例

  • 每一个财产可能与一个或多个有关班级由A.有范围的关系。在那里说明了一个财产有这样的关系吗财产是一个属性/价值对,它遵循价值是一个实例

  • 每一个资源可能是一个实例一个或多个班级

  • 每一个资源可能是A.成员一个或多个词汇编码方案

  • 每一个可能与一个或多个其他相关班级由A.子类的关系(二班级定义了这一切资源子类的实例也是相关类的实例).

  • 每一个财产可能与一个或多个其他相关属性由A.sub的关系。在哪里说存在这样的关系,两个属性定义了,使得每当sub-property是一个属性/价值对描述A.资源,它遵循资源也可以用second属性/价值对由此组成财产价值

  • 每一个语法编码方案是A.(的文字).

注意“词汇表”这个词在这里是专门指一组术语,成员所在的集合属性元素),班级词汇编码方案和/或语法编码方案

图3  -  DCMI词汇模型**图3 - DCMI词汇模型**

2.4笔记

关于这个模型有很多值得注意的地方:

  • 每一个非文字价值可能是描述资源在一个单独的描述在相同的描述集内-例如,一个单独的描述可以提供关于?的创建者的元数据描述资源.一个文字值不能是描述资源在一个单独的描述

  • DCMI描述集模型没有提供明确的机制来指示班级描述资源描述资源是否可以使用一个或多个显式指示陈述在里面描述或从属性中使用的描述

  • DCMI描述集模型表明了两者之间的区别文字值non-literal值通过在一个陈述文字值替代或者一个non-literal值替代.对于一个非文字价值, DCMI描述集模型没有提供明确的机制来进一步指示班级价值.任意给定的类非文字价值是否可以使用一个或多个显式指示陈述在一个单独的描述关于那个价值或从范围财产.对于一个文字值,班级价值是否可以使用语法编码方案值字符串或从范围财产

  • 的XML内容值字符串用a表示输入值的字符串与一个语法编码方案URI的<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#xmlliteral..

3.描述,描述集和记录

上面呈现的抽象模型表示每个DC元数据描述描述了一个,而且只有一个,资源.这通常被称为一对一原则。

然而,现实世界的元数据应用倾向于基于松散分组的组描述(其中描述了资源在某种程度上通常是相关的),在这里被称为描述集.例如,一个描述组可能包括描述一幅画和一个艺术家。此外,经常有这样的情况描述组还将包含一个描述关于描述组本身(有时被称为“管理元数据”或“元数据”)。

描述集是否以元数据的形式实例化,以便在软件应用程序之间进行交换记录,根据DCMI编码准则之一(例如,XHTML元标记、XML和RDF/XML) [DCMI- encodings]。

4.值

一个直流元数据价值是物理,数字或概念实体或文字它和a有关财产当一个属性对是用来描述一个资源.例如,一个价值与Dublin Core™Creator相关财产是一个人,组织或服务 - 物理实体。一个价值与Dublin Core™日期相关财产是时间上的一个点(或范围)-一个概念实体。一个价值与Dublin Core™覆盖相关财产是一个地理区域或国家-一个物理实体。一个价值与Dublin Core™主题相关财产是一个概念(概念实体)或物理对象或人(物理实体)。一个价值与FOAF名称相关联财产是A.文字.这些实体中的每一个都是一个资源

5.DCMI抽象模型语义

注意,本建议没有明确定义DCMI抽象模型的正式语义。其目的是通过引用RDF和RDF Schema语义来定义形式语义,如[RDFMT]中定义的那样。下表给出了DCMI抽象模型中的一些概念与相应的RDF概念之间的等价性:

DCMI抽象模型 RDF / RDFS
资源 类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Resource
财产元素 类:<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#property.
类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#class.
语法编码方案 类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype
有领域的的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain.
有范围的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range
sub的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subPropertyOf
子类的的关系 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subclassof.
普通的字符串值 纯文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/tr/rdf-concepts/#dfn-plain-literal.
输入值的字符串 输入的文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/#dfn-typed-literal

表1 - DCMI抽象模型语义

与DCMI推荐“使用资源描述框架(RDF)表达都柏林核心™”一起[DCRDF],这些等价构成了DCMI抽象模型形式语义的基础。但是,此类语义的细节超出了本建议的范围。

6.编码指南

特定编码指南(HTML元标签,XML,RDF / XML等)[<一个href="//www.voudr.com/schemas/">DCMI-ENCODINGS不需要对上面描述的抽象模型的所有方面进行编码。但是,它们应该引用DCMI抽象模型,并指出模型的哪些部分编码了,哪些没有编码。

编码准则应指明如何非文字价值可以视为描述资源在一个单独的描述在这些情况下non-literal值替代不包括URI值

7.术语

本文档使用的术语如下:

(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#class.)
包含具有共同属性、行为、关系或语义的成员的组;一种类别。
描述资源
一个资源用a来描述描述
描述资源URI.
一个URI标识的描述资源
描述
一个或多个陈述大约有一个,只有一个,资源
描述组
一组或多次描述,每个都描述一个单一的资源
元素(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#property.)
一个同义词财产.应该注意的是,word element也通常用于指XML文档中的结构化标记组件。
有领域的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain.)
a之间的关系财产和一个这表明如果财产是一个属性/价值对,那么接下来就是描述资源是一个实例
有范围(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range)
a之间的关系财产和一个这表明如果财产是一个属性/价值对,那么接下来就是价值是一个实例
实例
a之间的关系资源和一个这表明一个资源是一个实例。
文字
一种实体,它使用Unicode字符串作为词法形式,以及可选的语言标记或数据类型来表示资源(即。RDF定义的“文字”[<一个href="#RDF">RDF].
文字值
一个价值这是A.文字
文字值替代
一个价值的代理为一个文字值,正好由一个人组成值字符串(a文字这个编码价值).
成员(<一个href="http://purl.org/dc/dcam/memberOf">http://purl.org/dc/dcam/memberOf)
a之间的关系资源和一个词汇编码方案这表明资源是集合中的一个元素。
非文字价值
一个价值这是一种物理,数字或概念实体。
non-literal值替代
一个价值的代理为一个非文字价值,由a组成URI属性(aURI确定一个财产),零或一个URI值(aURI标识的非文字价值与之相关财产),零或一个词汇编码方案URI(aURI标识的词汇编码方案价值是一个成员),零或更多值的字符串文字这代表了价值).
普通的字符串值
一个值字符串没有相关的语法编码方案URI
财产(<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#property.)
用于描述的特定方面、特征、属性或关系资源
URI属性
一个URI它确定了一个财产
属性/价值对
a的组合财产和一个价值的特征资源
记录
的实例化描述组,根据DCMI编码指南之一(例如,XHTML元标签,XML和RDF / XML)创建。
资源(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Resource)
任何可能被识别的东西。熟悉的例子包括电子文档,图像,服务(例如,“洛杉矶的天气预报),以及其他其他的集合资源.不是所有的资源网络“复原”;例如,人、公司、概念和图书馆中的装订书也可以考虑资源
陈述
的实例化属性对由…组成URI属性(aURI确定一个财产)和一个价值的代理
子类的(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subclassof.)
两者之间的关系班级这表明这两个班级定义了这一切资源是子的实例还有相关的实例吗).
sub(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#SubPropertyOf)
两者之间的关系属性这表明这两个属性是这样定义的的sub-property是一个属性/价值对描述A.资源,则该资源也使用第二个属性/价值对由此组成财产价值
语法编码方案(<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype)
一组字符串和关联的规则集描述了该组字符串和一组之间的映射资源.映射规则可以定义字符串的结构(例如DCMI Box),也可以简单地枚举所有字符串和相应的资源(例如ISO 3166)。
语法编码方案URI
一个URI确定一个语法编码方案
术语
一个财产元素),词汇编码方案,或语法编码方案
输入值的字符串
一个值字符串有一个关联的语法编码方案URI
URI
统一资源标识符[<一个href="#URI">URI或国际化资源标识符[<一个href="#IRI">IRI].从DCMI抽象模型的角度,uri的等价定义为RDF [<一个href="#RDF">RDF].
价值
物理实体,概念实体或文字(a资源),它与a有关财产当一个属性对是用来描述一个资源
URI值
一个URI标识的价值
值字符串
一个文字,可选择与a相关联语法编码方案URI或者一个value字符串语言.在一个文字值替代一个值字符串编码价值;在一个non-literal值替代一个值字符串代表了价值
value字符串语言
ISO语言标签,表示文件的语言值字符串
价值的代理
一个文字值替代或者一个non-literal值替代
词汇表
一组或多次术语
词汇编码方案(<一个href="http://purl.org/dc/dcam/VocabularyEncodingScheme">http://purl.org/dc/dcam/VocabularyEncodingScheme)
的枚举集资源
词汇编码方案URI
一个URI确定一个词汇编码方案

附录A - 与遗产DCMI语法原则的关系

自20世纪90年代后期提出的第一重形主义,Dublin Core™元数据的基础模型已经发展。下表呈现了早期版本的DCMI之间的粗略术语等价性语法原则[DCMI- gram - prin]和当前的DCMI抽象模型。

DCMI语法原则 DCMI抽象模型
词汇词 资源
元素 财产元素
元素细化 财产sub关系
编码方案 语法编码方案词汇编码方案
语法编码方案 语法编码方案
限定符 财产sub关系,语法编码方案,或词汇编码方案
词汇编码方案 词汇编码方案

表2 - DCMI语法原理和DCMI抽象模型

参考

[DCMI]
Dublin Core™元数据计划
<<一个href="//www.voudr.com/">//www.voudr.com/>

(DCMI-GRAM-PRIN)
DCMI的使用。DCMI语法原则。2003年11月。
<<一个href="//www.voudr.com/specifications/dublin-core/grammatical-principles/">//www.voudr.com/specifications/dublin-core/grammatical-principles/>

[DCMI-编码]
DCMI编码指南
<<一个href="//www.voudr.com/schemas/">//www.voudr.com/schemas/>

(DCRDF)
尼尔森,迈克尔,安迪·鲍威尔,皮特·约翰斯顿,Ambjörn纳伊夫。使用资源描述框架(RDF)表达Dublin Core™元数据。DCMI提出建议。2007年4月。
<<一个href="//www.voudr.com/specifications/dublin-core/dc-rdf/">//www.voudr.com/specifications/dublin-core/dc-rdf/>

[Iri]
杜斯特,苏伊格纳德。RFC 3987:国际化资源标识符(IRIs)。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3987.txt">http://www.ietf.org/rfc/rfc3987.txt>

(RDF)
克莱恩、格雷厄姆和杰里米·卡罗尔,编辑。资源描述框架:概念和抽象语法。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/tr/rdf-concepts/>

[RDFMT]
海斯,帕特里克,编辑器。RDF语义。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-mt/">http://www.w3.org/TR/rdf-mt/>

(RDFS)
布里克利,丹和R.V.古哈,编辑。RDF词汇描述语言1.0:RDF模式。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-schema/">http://www.w3.org/tr/rdf-schema//>

(UML)
Booch,grady,詹姆斯·兰德和伊思尔雅各布森。统一建模语言用户指南。Addison-Wesley,1998年。

(URI)
Berners-Lee,T.,R. Fielding,L. Masinter。RFC 3986:统一资源标识符(URI):通用语法。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3986.txt">http://www.ietf.org/rfc/rfc3986.txt>

确认

感谢丹伯利,雷切尔休闲,Alistair Miles,Sarah Pulis,DC使用董事会的成员以及DCMI建筑社区的成员,了解本文档之前版本的评论。

勘误表2007-09-24:排印错误——在两次“which is is”中删除了额外的“is”。

勘误表2013-02-11:修正了dcm - gram - prin的URL。