创造者: | 安迪•鲍威尔 Eduserv基金会、英国 米凯尔尼尔森 KMR集团,CID, NADA, KTH(皇家理工学院),瑞典 Ambjorn Naeve KMR集团,CID, NADA, KTH(皇家理工学院),瑞典 皮特·约翰斯顿 Eduserv基金会、英国 汤姆贝克 DCMI |
发行日期: | 2007-06-04 |
最新版本: | //www.voudr.com/specifications/dublin-core/abstract-model/ |
发布历史: | //www.voudr.com/specifications/dublin-core/abstract-model/release_history/ |
描述: | 该文档为DCMI元数据描述指定了一个抽象模型。 |
本文档为Dublin Core™元数据指定了一个抽象模型。本文档的主要目的是指定Dublin Core™元数据中使用的组件和构造。它定义了所使用组件的性质,并描述了如何组合这些组件来创建信息结构。它提供了一个独立于任何特定编码语法的信息模型。这样的信息模型使我们能够更好地理解我们正在编码的各种描述,并促进更好的映射和交叉语法翻译的开发。
本文档主要面向支持Dublin Core™元数据的软件应用程序开发人员、参与为Dublin Core™元数据开发新的语法编码指南的人员以及基于DCMI词汇表或其他兼容词汇表开发元数据应用程序概要文件的人员。
DCMI抽象模型建立在万维网联盟(W3C)在资源描述框架(RDF) [RDF, RDFS]上进行的工作之上。下面的第5节总结了RDF概念的使用。
这里使用UML类图[UML]表示DCMI抽象模型。不熟悉UML类图的读者应该注意,以块箭头结尾的行应该被理解为“is”或“is a”(例如,“a”价值是一个资源”),以方块菱形开头的行应该读为“contains a”或“has a”(例如,“a声明包含一个URI属性").其他关系被适当地标记。在本文档中,斜体字的单词和短语的定义见第7节,术语。
的抽象模型资源所描述的描述如下:
每一个资源描述使用一个或多个属性-值.
每一个属性对是由一个人组成的财产和一个价值.
每一个价值是一个资源-物理的、数字的或概念的实体或文字它和a有关财产当一个属性对是用来描述一个资源.因此,每个价值要么是一个文字值或者一个non-literal价值:
一个文字值是一个价值这是一个文字.
一个non-literal价值是一个价值它是一个物理的、数字的或概念性的实体。
一个文字是一个实体,它使用Unicode字符串作为词法形式,以及可选的语言标记或数据类型,以表示一个资源(即。“文字的”,由RDF [RDF]定义。
DC元数据的抽象模型描述集如下:
一个描述组一组是一个还是多个描述,每个都描述一个单一的资源.
一个描述是由一个或多个组成的语句(大约一个,也只有一个,资源)和0或1描述资源URI(一个URI标识的资源描述).
每一个声明实例化一个属性对,是由一个URI属性(一个URI确定一个财产)和一个价值的代理.
一个价值的代理要么是一个文字值替代或者一个non-literal值替代:
一个文字值替代是一个价值的代理对于一个文字值,而且恰好是由一根杆子组成的值字符串.的值字符串是一个文字的编码文字值.
一个non-literal值替代是一个价值的代理对于一个non-literal价值,由0或1组成URI值(一个URI标识的non-literal价值相关的财产), 0或1词汇编码方案URI(一个URI标识的词汇编码方案的non-literal价值是成员),零或更多值的字符串.每一个值字符串是一个文字代表了non-literal价值.
一个值字符串要么是一个普通的字符串值或者一个输入值的字符串
一个普通的字符串值可能有相关的值字符串的语言这是一个ISO语言标记(例如en-GB)。普通的字符串值都是人类可读的。
一个输入值的字符串都有一个关联的语法编码方案URI确定一个语法编码方案.
的抽象模型词汇表用于DC元数据描述如下:
一个词汇表一组是一个还是多个条款.每一个术语成员是一个还是多个词汇表.
一个术语是一个财产(元素),类,词汇编码方案,或语法编码方案.
每一个财产可能与一个或多个相关类由一个有域的关系。这里写着a财产有这样的关系吗类和财产是一个属性/值对,由此可知资源描述这是一个例子吗类.
每一个财产可能与一个或多个相关类由一个有范围的关系。这里写着a财产有这样的关系吗类和财产是一个属性/值对,由此可知价值这是一个例子吗类.
每一个资源可能是一个的实例一个或多个类.
每一个资源可能是一个的成员一个或多个词汇编码方案.
每一个类可能与一个或多个其他相关类由一个子类的关系(二类都是这样定义的吗资源子类的实例也是相关类的实例类).
每一个财产可能与一个或多个其他相关属性由一个sub-property的的关系。在哪里说存在这样的关系,两个属性是这样定义的,每当sub-property是一个属性/值对描述一个资源,由此可知资源也可以用second属性/值对由…组成财产和价值.
每一个语法编码方案是一个类(文字).
注意“词汇表”这个词在这里是专门指一组条款,其中成员为属性(元素),类,词汇编码方案和/或语法编码方案.
图3 - DCMI词汇表模型关于这个模型有很多值得注意的地方:
每一个non-literal价值可能是资源描述在一个单独的描述在相同的描述集内-例如,一个单独的描述可以提供关于?的创建者的元数据资源描述.一个文字值不可能是资源描述在一个单独的描述.
DCMI描述集模型没有提供明确的机制来指示类的资源描述.类的资源描述是否可以使用一个或多个显式指示语句在描述或从域的属性中使用的描述.
DCMI描述集模型表明了两者之间的区别文字值和non-literal值通过在一个声明的文字值替代或者一个non-literal值替代.对于一个non-literal价值, DCMI描述集模型没有提供明确的机制来进一步指示类的价值.任意给定的类non-literal价值是否可以使用一个或多个显式指示语句在一个单独的描述关于这个价值或从范围的财产.对于一个文字值,类的价值是否可以使用语法编码方案的值字符串或从范围的财产.
的XML内容值字符串是用输入值的字符串与一个语法编码方案URI的<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral.
上面提出的抽象模型指出了每个DC元数据描述描述了一个,而且只有一个,资源.这通常被称为一对一原则。
然而,真实的元数据应用程序往往基于松散分组的集合描述(资源描述在某种程度上通常是相关的),在这里被称为描述集.例如,一个描述组可能包括描述一幅画和一个艺术家。此外,经常有这样的情况描述组也包含描述关于描述组本身(有时被称为“管理元数据”或“元数据”)。
描述集是否以元数据的形式实例化,以便在软件应用程序之间进行交换记录,根据DCMI编码准则之一(例如,XHTML元标记、XML和RDF/XML) [DCMI- encodings]。
DC元数据价值是物理实体、数字实体还是概念实体文字它和a有关财产当一个属性对是用来描述一个资源.例如,一个价值与Dublin Core™Creator相关财产是一个人、组织或服务——一个物理实体。一个价值与Dublin Core™日期相关财产是时间上的一个点(或范围)-一个概念实体。一个价值与Dublin Core™覆盖相关财产是一个地理区域或国家-一个物理实体。一个价值与Dublin Core™主题相关财产是一个概念(一个概念性实体)或一个物理对象或人(一个物理实体)。一个价值与FOAF名称相关联财产是一个文字.每个实体都是a资源.
注意,本建议没有明确定义DCMI抽象模型的正式语义。其目的是通过引用RDF和RDF Schema语义来定义形式语义,如[RDFMT]中定义的那样。下表给出了DCMI抽象模型中的一些概念与相应的RDF概念之间的等价性:
DCMI抽象模型 | RDF / RDFS |
---|---|
资源 | 类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Resource |
财产或元素 | 类:<一个href="http://www.w3.org/1999/02/22-rdf-syntax-ns">http://www.w3.org/1999/02/22-rdf-syntax-ns#Property |
类 | 类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Class |
语法编码方案 | 类:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#Datatype |
有域的关系 | 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#domain |
有范围的关系 | 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#range |
sub-property的的关系 | 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subPropertyOf |
子类的的关系 | 属性:<一个href="http://www.w3.org/2000/01/rdf-schema">http://www.w3.org/2000/01/rdf-schema#subClassOf |
普通的字符串值 | 纯文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/#dfn-plain-literal |
输入值的字符串 | 输入的文字。看到的:<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/#dfn-typed-literal |
表1 - DCMI抽象模型语义
与DCMI推荐“使用资源描述框架(RDF)表达都柏林核心™”一起[DCRDF],这些等价构成了DCMI抽象模型形式语义的基础。但是,此类语义的细节超出了本建议的范围。
特定编码准则(HTML元标签、XML、RDF/XML等)[<一个href="//www.voudr.com/schemas/">DCMI-ENCODINGS不需要对上面描述的抽象模型的所有方面进行编码。但是,它们应该引用DCMI抽象模型,并指出模型的哪些部分编码了,哪些没有编码。
编码准则应指明如何non-literal价值可以视为资源描述在一个单独的描述在这些情况下non-literal值替代不包括URI值.
本文档使用的术语如下:
自从20世纪90年代末提出第一个形式主义以来,Dublin Core™元数据的基础模型已经发展了。下表给出了DCMI早期版本之间的大致术语等价语法原则[DCMI- gram - prin]和当前的DCMI抽象模型。
DCMI语法原则 | DCMI抽象模型 |
---|---|
词汇词 | 资源 |
元素 | 财产或元素 |
元素细化 | 财产与sub-property的关系 |
编码方案 | 语法编码方案或词汇编码方案 |
语法编码方案 | 语法编码方案 |
限定符 | 财产与sub-property的关系,语法编码方案,或词汇编码方案 |
词汇编码方案 | 词汇编码方案 |
表2 - DCMI语法原则和DCMI抽象模型
(DCMI)
Dublin Core™元数据计划
<<一个href="//www.voudr.com/">//www.voudr.com/>
(DCMI-GRAM-PRIN)
DCMI的使用。DCMI语法原则。2003年11月。
<<一个href="//www.voudr.com/specifications/dublin-core/grammatical-principles/">//www.voudr.com/specifications/dublin-core/grammatical-principles/>
(DCMI-ENCODINGS)
DCMI编码指南
<<一个href="//www.voudr.com/schemas/">//www.voudr.com/schemas/>
(DCRDF)
尼尔森,迈克尔,安迪·鲍威尔,皮特·约翰斯顿,Ambjörn纳伊夫。使用资源描述框架(RDF)表达Dublin Core™元数据。DCMI提出建议。2007年4月。
<<一个href="//www.voudr.com/specifications/dublin-core/dc-rdf/">//www.voudr.com/specifications/dublin-core/dc-rdf/>
(IRI)
杜斯特,苏伊格纳德。RFC 3987:国际化资源标识符(IRIs)。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3987.txt">http://www.ietf.org/rfc/rfc3987.txt>
(RDF)
克莱恩、格雷厄姆和杰里米·卡罗尔,编辑。资源描述框架:概念和抽象语法。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-concepts/">http://www.w3.org/TR/rdf-concepts/>
(RDFMT)
海斯,帕特里克,编辑器。RDF语义。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-mt/">http://www.w3.org/TR/rdf-mt/>
(RDFS)
布里克利,丹和R.V.古哈,编辑。RDF词汇描述语言1.0:RDF模式。W3C推荐标准。2004年2月10日。
<<一个href="http://www.w3.org/TR/rdf-schema/">http://www.w3.org/TR/rdf-schema/>
(UML)
Booch, Grady, James Rumbaugh和Ivar Jacobson。统一建模语言用户指南。addison - wesley, 1998年。
(URI)
Berners-Lee, T., R. Fielding, L. Masinter。统一资源标识符(URI):通用语法。Internet工程任务组(IETF)。2005年1月。
<<一个href="http://www.ietf.org/rfc/rfc3986.txt">http://www.ietf.org/rfc/rfc3986.txt>
感谢Dan Brickley, Rachel Heery, Alistair Miles, Sarah Pulis, DC使用委员会的成员和DCMI架构社区的成员对本文档以前版本的评论。
勘误表2007-09-24:排印错误——在两次“which is is”中删除了额外的“is”。
勘误表2013-02-11:修正了dcm - gram - prin的URL。