元数据设计、实现和最佳实践方面的创新

用RDF/XML表示Simple Dublin Core™

创造者: 戴夫·贝克特
布里斯托尔大学学习与研究技术研究所(ILRT)
埃里克•米勒
W3C
Dan Brickley
W3C / ILRT
发行日期: 2002-07-31
最新版本: //www.voudr.com/specifications/dublin-core/dcmes-xml/
发布历史: //www.voudr.com/specifications/dublin-core/dcmes-xml/release_history/
描述: Dublin核心元数据元素集V1.1 (DCMES)可以用多种语法格式表示。本文档解释了如何用RDF/XML对DCMES进行编码,提供了一个DTD来验证文档,并描述了一种从web页面链接它们的方法。

1.简介和目标

Dublin Core™元数据元素集V1.1 (DCMES) [DCMES]可以用许多语法格式表示。本文档使用简单的RDF[RDFMS]给出了XML[XML- spec]中的DCMES编码,提供了DTD和W3C XML模式[XMLSCHEMA]来验证文档,并描述了从web页面链接它们的方法。

本文档描述了基于以下限制的XML中的DCMES编码:

  • 可以使用DCMES V1.1参考中描述的Dublin Core™元素
  • 不能使用其他元素
  • 不能使用任何元素限定符
  • 生成的RDF/XML不能嵌入到网页中

本文档的主要目标是提供一个简单的编码,其中不允许有额外的元素、限定符、可选或可变部分。这允许根据DTD验证结果数据,并保证XML解析器可以使用结果数据。第二个目标是使编码也是有效的RDF[RDFMS],允许使用RDF模型对文档进行操作。我们试图限制RDF构造至少,结果是每个文档都有一个标准的页眉和页脚。

我们承认将会有进一步的文档描述没有这些限制的DC的其他编码,但这是最简单的形式。这些限制的一个结果是编码不能创建可以嵌入到HTML页面中的文档。请参考用RDF / XML表示合格的Dublin Core™[DCQ-RDF-XML]获取用RDF/XML表达完整数据中心的详细信息。

本文档基于先前的工作,如[EM-DTD]、[CIMI-XML-TB]和[CIMI-DC-DTD]。

2.都柏林核心™的XML编码

本节将逐步介绍如何用XML为DCMES创建文档的方法。

2.1.XML声明

任何格式良好的XML文档都必须包含所使用的XML版本(和内容编码)的声明。目前,按照W3C推荐标准的定义,唯一有效的XML版本是1.0。因此,文档必须以

<?xml version = " 1.0 " ?>

在第一行。

2.2.引用XML DTD

< !DOCTYPE rdf: rdf PUBLIC "-//DUBLIN CORE//DCMES DTD 2002/07/31//EN" "//www.voudr.com/specifications/dublin-core/dcmes-xml/2002-07-31/dcmes-xml-dtd.dtd">

2.3.声明RDF的使用

有必要声明正在使用RDF[RDFMS],以便应用程序能够识别这是一个RDF/XML文档。它声明了外部rdf: rdf包含带有其XML名称空间的标记和用于DCMES元素的XML名称空间。

作为文档中的下一行,在XML DTD引用之后。

2.4.描述资源

这种编码可以描述单个文档中的多个资源。所描述的每个资源都包含在一个容器元素中,即一对rdf:描述标签。资源可能没有标识符,也可能有一个或多个标识符,其中一些标识符可能是uri。

如果资源至少有一个URI,则应该使用最合适的URI作为rdf: about属性rdf:描述标签是这样的:

…> < / rdf:描述

(关于如何处理其他问题,请参见下文标识符元素)

rdf:描述容器,将每个Dublin Core™元素与dc:命名空间前缀,例如标题元素变得dc:名称都是小写的,并且在rdf:描述像这样的容器:

 我的主页 

可以对标准Dublin Core™指导方针所需的所有其他DCMES元素重复执行此操作—所有元素都是可重复的和可选的。请注意,使用此文档的应用程序不要求保留容器中元素的顺序,因此不应期望保留此顺序。

如果Dublin Core™元素的值是具有URI而不是纯文本的资源,则应该将其记录在rdf:资源属性,标记内容为空。例如,如果是一个URI,它将被这样记录:

  

可能不止一个标识符元素,用于包含uri或其他标识符的资源。如果URI标识符可用并且适合使用,则应该将其作为rdf: about属性rdf:描述元素,如上所述。另一个标识符元素值应该以与下面描述的其他元素相同的方式编码。下面是一本书的描述片段,它有一个非uri标识符:

 Internet Ethics Duncan Langford Book ISBN 0333776267 

可能资源没有标识符,在这种情况下,不应该使用上述两种方法,也不应该使用rdf: about属性和标识符遗漏的元素。它是这样使用的:

 The Mona Lisa …< / dc: description > < / rdf:描述>

2.5.语言和字符编码

XML提供了xml: lang属性,可以在任何元素上使用。类所使用的语言提供了一种描述方法内容元素的。DCMES提供了语言元素,该元素用于描述对象的语言资源

当值中有特殊字符时,需要使用XML规则对元素和属性的值进行编码。需要编码的特殊字符,以及何时需要编码,总结如下以供参考:

纯文本 XML编码 需要在
& , 元素和属性值
< & lt; 元素和属性值
> 比; 元素和属性值
(撇号/单引号) ' 属性值
(双引号) “; 属性值

注意,“和”只需要用于属性值中的那些字符,而属性值只需要用于rdf:资源属性(参见2.4节)和xml: lang属性(参见第2.5节)。

32-126核心US-ASCII范围之外的所有其他字符都应该使用HTML实体(如)进行编码,因为这些不是在XML中定义的。字符的数字实体应该写成&#ddd;十进制或十六进制઼。或者,它们可以被编码为Unicode格式之一,如广泛支持的UTF-8。

2.6.完成文档

最后一件要做的事是关闭rdf: rdf元素通过添加以下行在文档的顶部打开:

< / rdf: rdf >

3.示例(仅供参考)

示例1

<?xml version = " 1.0 " ?> < !DOCTYPE rdf: rdf PUBLIC "-//DUBLIN CORE//DCMES DTD 2002 01 24//EN" "//www.voudr.com/specifications/dublin-core/dcmes-xml/2002-01-24/dcmes-xml-dtd.dtd">   戴夫·贝克特的主页 戴夫·贝克特 布里斯托尔大学 2000-06-06  

示例2

<?xml version = " 1.0 " ?> < !DOCTYPE rdf: rdf SYSTEM "//www.voudr.com/2000/12/01-dcmes-xml-dtd.dtd">   都柏林核心™元数据倡议-主页 都柏林核心™元数据倡议网站。 1998-10-10 text/html en 都柏林核心™元数据倡议  L'Initiative de msamtadonnsames du Dublin Core der Dublin-Core Metadata-Diskussionen  

4.从HTML链接到Dublin Core™XML元数据

在这里描述的方法中编码的Dublin Core™可以从HTML文档中引用,并通过HTML与它相关联<链接>元素。用于此目的的推荐关系类型是rel = "元",这样使用:

在哪里mydoc.dcxml是所引用的XML文档的URI。这在编码都柏林核心™元数据在HTML[DC-HTML]。

附录A - RDF/XML格式的简单都柏林核心™元数据元素集1.1的DTD(仅供参考)

本节仅供参考,不是标准的一部分。

这个DTD的URI是//www.voudr.com/specifications/dublin-core/dcmes-xml/2002-07-31/dcmes-xml-dtd.dtd

< !—XML DTD 2000-12-01都柏林核心™元数据元素集版本1.1 //www.voudr.com/specifications/dublin-core/2000/11/dcmes-xml/dcmes-xml-dtd.dtd参见简单都柏林核心™元数据的XML编码- 2000-12-01 //www.voudr.com/specifications/dublin-core/2000/11/dcmes-xml/作者:Dave Beckett <(电子邮件保护)>埃里克·米勒<(电子邮件保护)>丹·布里克利<(电子邮件保护)>基于都柏林核心™元数据元素集,版本1.1:参考描述//www.voudr.com/specifications/dublin-core/rec/dces-19990702.shtml—>          < !实体% dcmes "dc:标题| dc:创作者| dc:主题| dc:描述| dc:出版商| dc:贡献者| dc:日期| dc:类型| dc:格式| dc:标识符| dc:源| dc:语言| dc:关系| dc:覆盖| dc:权利" >                                                    

附录B - RDF/XML格式的简单都柏林核心™元数据元素集1.1的W3C XML模式(仅供参考)

本节仅供参考,不是标准的一部分。

这里涉及到三个XML名称空间,相应地有三个W3C XML Schema文档:

要将RDF/XML实例中的简单DC与W3C XML Schema一起使用,它需要与具有URI的主W3C XML Schema一起使用//www.voudr.com/specifications/dublin-core/dcmes-xml/2002-07-31/dcmes-xml-xsd.xsd

感谢爱丁堡大学的Henry S. Thompson创建了这些模式的原始版本。

参考文献

(dcm)
都柏林核心™元数据元素集,版本1.1:参考描述
//www.voudr.com/specifications/dublin-core/dces/1999-07-02/

(xml规范)
可扩展标记语言(XML) 1.0, W3C推荐,1998年2月10日
http://www.w3.org/TR/REC-xml

(EM-DTD)
都柏林核心™元素集的DTD, Eric Miller
//www.voudr.com/specifications/dublin-core/dcmes-xml/2002-07-31/dcmes-xml-dtd.dtd

(DCQ-RDF-XML)
在RDF / XML中表达合格的都柏林核心™:Stefan Kokkelink和Roland Schwänzl, DCMI提出的建议
//www.voudr.com/specifications/dublin-core/dcq-rdf-xml/2002-04-14/最新版本

(DC-HTML)
在HTML中编码Dublin Core™元数据:John Kunze, DCMI, December 1999, RFC 2731
http://www.ietf.org/rfc/rfc2731.txt

(CIMI-XML-TB)
在CIMI Dublin Core™测试台上使用XML作为博物馆记录的传输语法:一些实际经验,Bert Degenhart Drenth
MS Word(无非专有格式):http://www.cimi.org/wg/xml_spectrum/XML_for_DC_testbed_rev.doc

(CIMI-DC-DTD)
CIMI Dublin Core™DTD
MS Word(无非专有格式):http://www.cimi.org/public_docs/CIMI-DC-DTD_210400.doc

(RDFMS)
资源描述框架(RDF)模型和语法规范,W3C推荐,1999年2月22日
http://www.w3.org/TR/REC-rdf-syntax

(XMLSCHEMA)
XML模式,W3C推荐标准,2001年5月2日
http://www.w3.org/TR/xmlschema-1/