创新元数据的设计、实施和最佳实践

应用程序概要文件的评审准则

创造者: 使用DCMI董事会
发行日期: 2009-03-02
最新版本: //www.voudr.com/specifications/dublin-core/profile-review-criteria/
发布历史: //www.voudr.com/specifications/dublin-core/profile-review-criteria/release_history/
描述: 本文档阐明了DCMI使用委员会审查应用程序配置文件的标准。

1.评价的对象

以下指南阐明了DCMI使用委员会审查应用配置文件的标准。截至2008年3月,这些审查标准的主要参考点是都柏林核心™应用程序概要的新加坡框架[Singapore - Framework]、抽象模型[DC-AM]和描述集概要规范[DC-DSP]草案。应用程序配置文件的最佳实践示例包括由使用委员会[DC-CAP- review]审查的都柏林核心™集合应用程序配置文件[DC-CAP]和Eprints应用程序配置文件[Eprints]。

应用程序概要文件是描述元数据应用程序的文档(或文档包),以便更广泛地重用其元数据。一个好的概要文件提供了足够的细节和上下文

  • 可能需要集成来自多个源的元数据的信息提供者,以及
  • 希望使用相同(或类似)元数据构建应用程序的开发人员。

应用程序配置文件包含以下内容:

  • 应用目标及范围:
  • 应用程序的功能需求,
  • 应用程序描述的实体的数据模型,以及
  • 描述集概要文件,详细描述应用程序中使用的类和属性,以及它们的使用约束。

其中一些组件被认为是“必需的”,而另一些则只是“推荐的”。文档的主要要求是语义清晰和内部一致。

2.领域的评价

2.1.应用目标及范围

应用程序的目标和范围必须描述。文件必须回答以下问题:

  • 是否对使用(或可以使用)应用程序概要文件的上下文进行了描述?

文件应回答以下问题:

  • 是否识别并描述了应用程序配置文件的目标用户组?
  • 参与概要文件开发的组织和个人是否被识别和描述?
  • 是否描述了关于概要文件未来开发和维护的任何安排、指导方针或意图?

2.2.应用程序的功能需求

文档必须根据用户需求描述应用程序的功能。这些功能需求应该定义为通用功能,如“查找”、“识别”或“选择”,但也可以更具体一些。

需要问以下问题:

  • 是否定义了功能需求?

2.3.域模型

应用程序概要文件必须提供一个数据模型(如果只是一个简单的数据模型的话),它描述实体和实体之间的关系。数据模型可以以图形形式(例如,UML类图)或文本形式描述。应用程序概要文件可以基于外部定义的数据模型。关于数据模型,必须回答以下问题:

  • 模型是否描述了要描述的实体集以及这些实体之间的关系?

  • 如果应用程序配置文件使用外部定义的数据模型:

    • 是否标识了外部数据模型?
    • 是否记录了外部定义的数据模型的偏差?

2.4.描述设置配置文件

描述集profile按照“模板”和“约束”来指定一条元数据记录[DC-DSP]:

  • 描述模板是一个容器,用来存放对所描述的资源以及描述中所有语句的约束。(在DCMI抽象模型中,一个描述只适用于一个资源)。
  • 语句模板是应用于特定语句的所有约束的容器。(在DCMI抽象模型中,一个Statement由一个属性URI和一个值代理组成。)

2.4.1.领域模型实体的描述模板

如果域模型只有一种类型的资源(例如,“book”),那么DSP文档中的所有语句都可以被认为是关于该资源的。在正式的术语中,描述模板是隐含的,不需要显式地这样标记。

如果域模型有多个被描述的实体(例如,“作者”和“图书”),元数据需要对每个实体有单独的描述。因此,描述集概要文件应该提供单独的、明确分隔的部分(描述模板)。

描述模板的头部或简介应该提供以下信息:

  • [必选]在描述中描述的资源的类(或类)可能是一个实例(例如,foaf:Person,或http://xmlns.com/foaf/0.1/Person)(资源类成员约束).
  • [可选]元数据记录中描述信息的字符串。
  • [可选]指示是否允许基于模板的描述独立存在(例如,“如果没有被描述的书,作者就不能被描述”)。
  • [可选]此类描述在描述集中出现的最小和最大次数。

2.4.2.描述模板中的语句模板

语句模板通常为元数据中使用的每个“术语”提供一个小表,以及关于如何使用这些术语的信息(使用什么基数、编码模式等),以及“编目规则”或使用指南。

这些表可包括下列资料:

  • [可选]这种语句在包含的Description中出现的最小和最大次数。
  • [可选]语句中允许的值代理的类型(字面量/非字面量)。

这些表必须包含以下属性约束之一:

  • [可选]属性列表约束:语句中允许使用的属性列表(可以是一个成员的列表)(以uri或缩写uri的形式给出,例如,使用dc:创造者http://purl.org/dc/terms/creator).
  • [可选]子属性约束:可以使用任何子属性的属性;这种限制很少见。

在一个描述模板中,属性约束应该以这样一种方式构造:语句中的属性URI最多可以在一个语句模板中匹配属性约束。例如,不允许有两个语句模板,每个语句模板的一个属性列表约束引用同一个属性。

定义文字值约束的语句模板:如果只允许字符串(即字面量)作为值,则可以将Statement定义为引用字面量值,它由字面量值代理(Literal Value proxy)表示。允许的约束(在“文字值代理”上)包括:

  • [可选]文字列表,如“animal, vegetable, mineral…”(文字列表约束).
  • [可选]指示文字的语言指示符是“强制”、“可选”还是“不允许”。
  • [可选]表示允许使用哪种语言的文字。
  • 指示字面量的语法编码方案是“强制的”、“可选的”还是“不允许的”。
  • [可选]语法编码方案列表约束:一个允许的语法编码方案列表,由URI标识。

定义非文字值约束的语句模板:允许的约束(在aNon-Literal值替代)包括:

  • [可选]描述模板的标识符,可用于描述值(描述模板参考).

  • [可选]类成员约束:一个类的列表(由URI标识),其值可能是一个实例。

  • [可选]值URI约束:值URI是“不允许”、“可选”还是“强制”。

  • [可选]值URI列表约束:允许作为值URI的URI列表。

  • [可选]词汇编码方案出现约束:词汇编码方案是“不允许”、“可选”还是“强制”。

  • [可选]词汇编码方案列表约束:允许作为词汇编码方案的uri列表。

  • 值字符串约束

    • [可选]最小出现限制:这种值字符串必须在封闭语句中出现的最小次数。
    • [可选]最大出现次数限制:允许这种值字符串在封闭语句中出现的最大次数。

2.4.3.作为一个整体的模板和约束

关于模板和约束(或它们的功能等价物)作为一个整体,审查者应该问:

  • 描述模板和语句模板中显示的约束是否反映了域模型的内容?

  • 语句模板中提供的约束是否与其所有者提供的属性的定义一致?

    • 审稿人应该验证property Constraint中声明的属性是使用文字范围还是非文字范围声明的,并标记与DSP中使用的任何矛盾。

并不是描述集配置文件中包含的所有信息都属于上面描述的类型。任何这样的信息都可以被认为是“注释”——在正式意义上属于描述集概要之外的用户指导。对于这些类型的信息,审稿人应该问以下问题:

  • 该术语的建议使用是否与术语所有者提供的定义一致?
  • 这些术语在描述集概要文件中的使用是否与其声明的语义一致?

2.5.描述集配置文件中引用的元数据术语

审查员的任务是识别描述集概要文件中使用的“术语”,并根据DCMI抽象模型测试这些术语是否适合用于元数据。要合适,术语必须是四种类型的“元数据术语”之一,在DCMI抽象模型:属性(也称为元素)、类、词汇编码方案(VES)和语法编码方案(SES)。下面的问题测试给定的术语是否符合这种已知的类型学:

    1. DCMI抽象模型要求用统一资源标识符(uri)来标识Property、Class、SES和VES的实例。这个术语是否被分配了一个“适当的”URI(参见下面的讨论)?否则,该术语在RDF语句中不可引用,因此在基于DCMI抽象模型的元数据中不可用。
    1. 在RDF模式或其他形式的文档中,是否明确声明该术语为下列之一:
      1. RDF属性,也称为(在Dublin Core™使用中)元素(http://www.w3.org/1999/02/22-rdf-syntax-ns#Property或其子类)。用于:属性列表约束、子属性约束。
      1. 一个类(http://www.w3.org/2000/01/rdf-schema#Class或其子类)。用于:资源类成员约束、类成员约束。
      1. RDF数据类型或(在Dublin Core™使用中)语法编码方案(http://www.w3.org/2000/01/rdf-schema#Datatype或其子类)。用于:语法编码方案列表约束。
      1. 词汇编码方案(http://purl.org/dc/dcam/VocabularyEncodingScheme或其子类)。用于:词汇表编码方案列表约束。

如果所讨论的术语没有明确定义为这四种类型之一,那么它在基于DCMI抽象模型的元数据中就没有可识别的功能。

2.5.1.讨论

RDF模式中的声明.RDF模式说明给定的术语如何适合标准规范(如“RDF词汇描述语言1.0:RDF模式”[RDFS]和DCMI抽象模型[DC-AM])定义的类型。示例模式包括DCMI元数据术语[DCMI- Terms]、SKOS词汇[SKOS- vocabulary]和RDF词汇描述语言(RDF Schema)本身[RDF - vocabulary]。例如,术语“发布者”在DCMI元数据术语的RDF模式中被声明为一个“RDF属性”,如下所示:

 Publisher 负责使资源可用的实体。 …> < / rdf:描述

最佳实践RDF模式.声明良好的术语的最佳实践示例是DCMI元数据术语[DCMI- terms]、Dublin Core™集合描述术语[DC-CDT]和Eprints术语[Eprints - terms]。术语也必须以RDF模式声明(例如DCMI元数据术语[DCMI- Terms -RDF])。和Dublin Core™Collection Description Terms [DC-CDT-RDF]。

使RDF模式可用.W3C注释“发布RDF词汇表的最佳实践食谱”[Recipes]描述了应该如何使用HTTP重定向从术语uri重定向到用于描述这些术语的RDF模式。正如注释中所描述的那样,理想情况下,RDF模式应该在配置为根据浏览器首选项(text / htmlapplication / rdf + xml).

“适当的”uri.按照惯例,在创建应用程序概要文件期间创造的新术语通常使用域名分配临时urihttp://example.org.作为http://example.org不能使用uri来解析术语声明,这样的临时uri应该被可以作为元数据基础的适当uri所取代。“适当”uri是一个域下的uri,在这个域中,术语的作者被授权创造这样的uri。

术语的种类及其子类.定义为上述类子类的术语类型可以用于基于dc - am的元数据——例如,来自Web本体语言[OWL]:http://www.w3.org/2002/07/owl#Class的子类http://www.w3.org/2000/01/rdf-schema#Class而且http://www.w3.org/2002/07/owl#ObjectProperty的子属性是http://www.w3.org/1999/02/22-rdf-syntax-ns#Property

2.6.语法的指导方针

关于语法选项和数据格式的指导方针可以在应用程序配置文件中提供。如果提供了这样的材料,审稿人应该确定所选择的语法(或语法)是否支持描述集概要文件中表达的约束。例如,如果给定的编码语法不支持DC-AM构造的词汇编码方案uri,并且词汇编码方案uri的约束在Description Set Profile中定义,那么审核人员应该标记这种不一致。评审者应该考虑这样的可能性:描述集概要文件不是直接用数据格式表示的,而是通过转换的方式(例如,GRDDL)表达的。

审稿人应提出以下问题:

  • 应用程序概要文件是否提供语法指导(无论是模式的形式还是人类可读的用户指南的形式)?
  • 如果是,语法是否明确支持应用程序配置文件中使用的DC-AM实体?

参考文献

DC-CAP
Dublin Core™Collections应用简介,2007年3月9日。
<//www.voudr.com/specifications/dublin-core/collection-description/collection-application-profile/2007-03-09/>
DC-CAP-REVIEW
DCMI使用委员会对托收申请资料的审查,2007年7月20日。
<//www.voudr.com/usage/reviews/2007/collections-ap/>
DC-CDT
Dublin Core™Collection Description Terms, 2007年3月9日。
<//www.voudr.com/specifications/dublin-core/collection-description/collection-terms/2007-03-09/>
DC-CDT-RDF
Dublin Core™集合描述术语的RDF模式,2007年3月9日。
<//www.voudr.com/specifications/dublin-core/collection-description/collection-terms/2007-03-09/cldterms.rdf>
DC-DSP
尼尔森,米凯尔。Set Profiles: Dublin Core™应用概要文件的约束语言。
<//www.voudr.com/specifications/dublin-core/dc-dsp/2008-03-31/>
DC-AM
Powell, Andy, Mikael Nilsson, Ambjörn Naeve, Pete Johnston, Thomas Baker。DCMI抽象模型。
<//www.voudr.com/specifications/dublin-core/abstract-model/2007-06-04/>
dcmi术语
DCMI元数据术语。
<//www.voudr.com/specifications/dublin-core/dcmi-terms/>
DCMI-TERMS-RDF
RDF模式http://purl.org/dc/terms/
<//www.voudr.com/2008/01/14/dcterms.rdf>
EPRINTS-TERMS
eprint条款。
<http://www.ukoln.ac.uk/repositories/digirep/index/Eprints_Terms>
猫头鹰
Web本体语言(OWL)参考版本1.0。
<http://www.w3.org/TR/2003/WD-owl-ref-20030221/>
RDFS
RDF词汇描述语言1.0:RDF模式。
<http://www.w3.org/TR/2004/REC-rdf-schema-20040210/>
RDFS-VOCABULARY
RDF词汇描述语言的RDF模式(RDF模式)。
<http://www.w3.org/2000/01/rdf-schema#>
食谱
发布RDF词汇表的最佳实践菜谱。
<http://www.w3.org/TR/swbp-vocab-pub/>
SINGAPORE-FRAMEWORK
尼尔森,迈克尔,托马斯·贝克,皮特·约翰斯顿。Dublin Core™应用程序配置文件的新加坡框架。
<//www.voudr.com/specifications/dublin-core/singapore-framework/2008-01-14/>
SKOS-VOCABULARY
SKOS核心词汇规范。
<http://www.w3.org/2004/02/skos/core>

改变历史

2009-03-02。修正了第2.4.2节中第一组要点(从“强制”到“可选”)中的“值代理类型”的可选项性2009年1月28日.增加了关于检查多个语句模板共享属性列表约束根据决议2009年2月26日