元数据设计、实施和最佳实践方面的创新

计划使用多种语言的Dublin Core™分布式注册表

标题:

计划使用多种语言的Dublin Core™分布式注册表

创造者:
发行日期:
1998-07-14
标识符:
替换:
取而代之的是:
最新版本:
文档的状态:
这是一个DCMI工作草案
描述文档: 这份立场文件产生于1998年5月25日在德国波恩的德国国家信息技术研究中心举行的工作组会议上的讨论。[GMD]它将通过讨论而发展。

这份立场文件产生于1998年5月25日在德国波恩的德国国家信息技术研究中心举行的工作组会议上的讨论。[GMD]它将通过讨论而发展。

都柏林多语言核心工作组的立场如下:

  1. 国际都柏林核心™社区的参考语言是英语,因为它的所有产出都是用英语讨论和批准的。因此,都柏林核心™的英文版本作为一个国际过程的规范结果具有特殊的地位。

  2. 然而,Dublin Core™元素的语义原则上在任何现代语言中都可以很好地表达。我们不愿将都柏林核心™英语以外的语言版本称为“翻译”。相反,这些版本本身可以作为参考定义,作为讨论、调整和以本地特定方式扩展的对象。此外,像任何好的翻译一样,这样的版本不必逐字逐句地直译,只要它们以对读者有意义的方式传达规范定义的精髓。

  3. 人们目前将“都柏林核心™”与英语标准联系在一起。我们希望将不同语言的Dublin Core™实例化的总和称为“Multilingual Dublin Core”或“DC-Multilingual”。人们可能认为DC-Multilingual内部共享的元数据语义在某种意义上独立于任何特定的语言,因此是通用的。

  4. 不同语言中的Dublin Core™元素版本应该共享一个名称空间。从1998年5月开始,命名空间名称的一个可能候选名称是“http://purl.org/metadata/dublin_core_elements”。这将需要都柏林核心™社区作为一个整体进行讨论和批准。

  5. 正如在简单都柏林核心™[RFC]的RFC中定义的那样,都柏林核心™元素由描述性名称(如“作者或创建者”)、用于编码方案的单字标签或“标记”(如“创建者”)和元素定义组成。描述性名称和元素定义主要由人读取,而标记主要由机器读取。这些符号看起来像英语单词,但代表通用元素。通用元素可以在多种语言中具有可互换的名称和定义。

  6. 都柏林核心™的法文版本(dc -法文)在http://www.inria.fr可以有通用元素——具有经过翻译的定义和名称的规范元素——以及特定于DC-French的元素。Universal元素将使用Dublin Core™名称空间(这里,http://purl.org/metadata/dublin_core_elements),而局部元素将使用名称空间,例如http://www.inria.fr/metadata/dublin_core_elements。在DC-French at的(假设的)RDF模式中http://www.inria.fr那么,Title元素的定义是这样的:< RDF:描述RDF: href = " http://purl.org/metadata/dublin_core_elements #标题”< RDF: instanceOf RDF: href = " http://www.w3.org/TR/WD-RDF-Syntax # PropertyType”/ < RDFS:必要性RDF: href = " http://www.w3.org/TR/WD-RDF-Schema ZeroOrMore " / < RDFS:注释xml: lang =“fr”

> < RDF:描述RDF: href = " http://purl.org/metadata/dublin_core_elements标题“> < RDF: instanceOf RDF: href = " http://www.w3.org/TR/WD-RDF-Syntax PropertyType " / > < RDFS:必要性RDF: href = " http://www.w3.org/TR/WD-RDF-Schema ZeroOrMore " / > < RDFS:注释xml: lang =“fr”> Le笔名多恩拉ressource Le createur ou l 'auteur不相上下。< / RDFS:评论< / RDFS:评论> < / RDF:描述>

  1. Dublin Core™元素具有人类可读的描述性名称、机器可读的标签(令牌)和人类可读的定义。然而,从1998年5月开始,资源描述框架模式核心只支持后两种——令牌和定义。[RDF]对于用英语描述Dublin Core™,这不会造成大问题,因为令牌几乎与名称相同(例如,“Creator”与“Author或Creator”)。然而,要用其他语言表达模式,我们还需要支持人类可读的描述性名称。如果Schema Core中的RDF规范不支持这一点,也许都柏林Core™社区应该定义自己的RDF扩展(RDF术语中的新“属性类型”),它可以在官方的都柏林Core™名称空间中维护。

8.使用Simple Dublin Core™和RDF语法对文档的描述如下所示,与该描述的创建者是否引用DC- english、DC- french或DC- thai无关,不管文档本身是什么语言(在本例中是德语):/P>

<?xml:名称空间ns = " http://purl.org/metadata/dublin_core_elements " prefix =“直流”?>
< RDF: RDF >
< RDF:描述DRF: HREF = " http://www.biblio.de/buecher/kleist.html " >
Das Erdbeben in Chili
< DC:创造者>海因里希·冯·克莱斯特< / DC:创造者>
< RDF:描述>
< / RDF: RDF > < / DC:创造者< < / RDF: RDF / RDF:描述

  1. 目前还不清楚机器可读的RDF模式是应该嵌入到人类可读的HTML文档文件中,还是应该单独保存。现在我们将把它们分开,这样当我们知道需要什么时,就可以更容易地更改它们。

  2. 不清楚名称空间名称(参见上面的#4)应该指向RDF模式文件还是HTML格式的Web页面。也许元素定义可以从RDF文件动态提取到HTML文件,反之亦然。此外,XML名称空间规范草案[XML]对名称空间名称和指向模式的可选URI进行了区分。这显然是一个有待进一步研究的问题。无论哪种方式,名称空间名称所指向的内容都会随着时间的推移而改变,因此我们可以放心地继续编写元数据。

  3. 其他语言版本的Dublin Core™应该引用它们所基于的特定英语版本(例如,1.0、1.1、2.0…),因为规范版本将随着时间的推移而发展。例如,Dublin Core™可以增加到超过15个元素。也许可以为每个新版本提供自己的URI。对于整个Dublin Core™社区来说,版本控制到底应该如何实现是一个问题。

  4. 从中央名称空间服务器到其他语言版本的链接应该是机器可解析的。用户应该可以传输一个首选项为Finnish,返回DC-Finnish的URI,然后从Helsinki加载Dublin Core™元素名称和定义。

  5. 我们正在进行一段实验期,在此期间,我们应该邀请许多国家的元数据使用机构以各种语言创建Dublin Core™版本。区域语言或机构差异可能偶尔会导致以任何给定语言创建多个版本的Dublin Core™,但我们认为目前没有理由对此加以限制。最终,我们可能需要一个评估这些版本的过程,对质量进行同行评审,并对机构长期维护版本的承诺进行一些验证。通过认证的版本可以由都柏林核心™社区作为一个整体进行“认证”。

  6. DC-Multilingual应该是一个跨语言共享和协商元数据语义的论坛。最初在泰国定义的扩展可以合并到通用版本中,并在世界范围内使用。


过程和交付

  1. 分布式注册中心应该以多种语言的Simple Dublin Core™版本开始。在Dublin Core™社区批准Complex Dublin Core™版本之前,子元素不应实现。

  2. 随着RDF规范的发展,dc -多语言应该遵循它们。实际上,它可以为RDF提供一个高调的、国际化的、与供应商无关的模型应用程序。反过来,dc -多语言社区应该将其不断发展的需求反馈给RDF工作组,以便在RDF的未来版本中考虑。

  3. DC-Multilingual分布式注册表将由工作组在都柏林核心™实现多种语言与都柏林核心™咨询委员会密切磋商,RDF工作组,都柏林核心™社区作为一个整体(如由周期性车间和dc-international邮件列表)。工作组将维持一个网页,网址为//www.voudr.com/groups/languages/并就华盛顿特区-国际邮递名单进行讨论http://www.jiscmail.ac.uk/lists/dc-international.html

  4. 强烈鼓励本地实现者开发增强或扩展注册中心功能的项目。除了模式之外,这些站点最终还可以保存可下载的模板、元数据编辑器、Java实用程序、用户指南、枚举列表、到其他元素集的交叉路径和受控词汇表。


引用文献:

(GMD)//www.voudr.com/groups/languages/mr-19980525/
(DC4)//www.voudr.com/groups/languages/mr-19970303/
(ISDL97)http://www.DL.ulis.ac.jp/ISDL97/proceedings/thomas/thomas.html
(RDF)http://www.w3.org/TR/1998/WD-rdf-schema-19980409/
(RFC)ftp://ftp.ietf.org/internet-drafts/draft-kunze-dc-03.txt
(XML)http://www.w3.org/TR/WD-xml-names