元数据设计、实施和最佳实践方面的创新

作为索引工具的叙词表和分类的定义

创作者: Aida Slavic.
发行日期: 2000-11-28
最新版本: //www.voudr.com/specifications/dublin-core/thesauri-definition/
发布历史: //www.voudr.com/specifications/dublin-core/thesauri-definition/release_history/
描述: 本说明总结了叙词的定义和分类为索引工具,并赋予实体(分类学)和书目分类之间的区分。它还解释了叙述和分类之间的差异,以及为DCMES元素主题建议的一般分类方案之间的差异:LCC,DCC和UDC。

此消息总结了叙词和分类作为索引工具的定义,并赋予实体(分类学)和书目分类之间的区分。它还解释了叙述和分类之间的差异,以及为DCMES元素主题建议的一般分类方案之间的差异:LCC,DCC和UDC。

根据我的经验,这个正在进行的讨论就是证明,认为DCMES和DCMES限定符中使用的术语可以被清楚地理解的假设只对部分DC社区是正确的。那些有图书馆和信息研究背景的人理解元数据的“行话”没有问题,然而其他人却在努力寻找其中的意义。

我碰巧是教学索引语言,并在一个分类上进行研究,我认为人们不普遍,人们正在努力,检查一般词典,以实现一些共识,而答案相当简单。如果试图澄清正在进行的讨论,我深表歉意,我重复一些已经很好地理解和接受的概念。

我试图总结在DCMES中使用的术语,这些术语具有LIS来源,并且在该社区中解释了其他人可能期望的。

在这里,我将集中讨论SUBJECT元素的DCMES限定符中的术语,它涉及到编码方案,如同义词典和分类。DCMES中给出的示例起源于图书馆和文档。这背后的意义是非常严格的,并不是意味着要被自由地解释或理解在一般意义上(例如,每一个系统的排序可以被称为分类,任何建立术语之间关系的词典可以被称为同义词典)。

重要的是要理解,这里使用的叙述和分类是在索引语言的具体感觉(因为它在ISO 5963中良好定义,它描述了建议的审查文件的程序,确定他们的主题并选择适当的索引术语并与ISO相关联机构和发展的指导方针2788和多语言词汇 - ISO 2788)

这里理解为“索引”作为描述或在对象内容方面描述或识别文档的行为(而不是作为物理实体的文档的描述)。

索引语言(和其他语言一样)由词汇表和语法规则组成。我们经常把它们称为“系统”,比如分类系统或主题标题系统。

通常会讲“索引项”(即代表文档中的主题的概念的表示)被建议使用:

被公认为该领域权威的词典或百科全书

b)主题词表

c)分类计划

有两种主要的索引语言:

A)使用自然语言术语或词(同义词典,主题标题系统)

B)使用符号的:数字、字母或符号的组合(书目分类)

注:这些之间的区别不是在显示,因为同义词典当适当地设计将有一个字母顺序的清单和一个系统或分类显示。此外,每一种书目分类都建立了概念之间的关系,因此概念之间的关系并不只对叙词表特别。此外,每个书目分类提供了某种按字母顺序排列的主题索引,有时甚至是一个同义词典,以使概念位置。还有一个索引工具叫做“classaurus”,它是两者的混合(参见Bhattacharyya: classaurus its fundamentals, design and use, 1982)。

因此,在实践中,最明显的区别是您实际使用的索引术语:符号或单词(其他差异超出了本文讨论的范围)。

对于非图书馆员来说,分类似乎更令人困惑。有许多分类方案,也有许多知识分类,它们可能与书目或文献分类混淆,因为它们既可以涵盖一个特定的知识领域,也可以涵盖整个知识体系。然而,有一些理由限制DCMES的SUBJECT字段中的限定符仅用于书目分类。

知识和书目分类分类之间的主要区别是,特殊的书目/纪录片分类,如NLM,Inspec等或一般,例如杜威十进制分类,国会分类图书馆,普遍十进制分类,是旨在处理的索引系统记录在文件中的知识。它们通常能够表达不仅仅是知识,而是记录知识的形式,其中呈现了它的语言以及许多特征,特别是在某些文档中的特定主题的实例化特征。

知识分类可以是,通常是分类(有时称为“实体分类”),如动物学的分类,植物分类,或化学元素的分类(这意味着它们只在一个地方列出一个概念分类结构)。

书目分类即,那些必须用来描述真实文件并不是且不能是分类学。他们都是一定的方面或纪律的分类。这意味着他们将在所有学科和领域列出一个概念,其中可以研究该概念:例如“水”必须出现在化学,物理学,地质,医学,体育等中的化学物理学中。

这对于信息检索是至关重要的,因为方面分类有助于建立文档中可能研究一个概念或现象的上下文。

一般(我们也有专门的)书目分类是现有的系统,词汇量大(DDC超过20000个术语,UDC 61000个,LCC几十万个)。这些系统不仅提供了描述主题的规定,而且还提供了主题呈现的形式、主题连接的时间和地点、在文件中呈现的语言、载体的物理性质等。

有些分类方案具有层次结构(如DDC和UDC),有些分类方案既列出了单个概念,也列出了组合概念,基本上列举了文档中预计要研究的所有可能主题(如LCC)。然而,有些倾向于具有分面特性,即是合成的,如UDC,允许在文档中表达无限多的主题组合。这些分类系统在数百个国家被广泛接受和使用,并被翻译成多种语言——这就是DCMES提出这些分类系统的原因。

它们由拥有出版和翻译权利的机构或团体维护和发展。“维持”的意思是,随着知识的增长,新概念不断被添加。上述三种方案也有电子形式。

因为它们使用符号而不是单词,它们特别适用于互联网的多语言环境。它们可以用作开发撰写和建设和根据特定目的的索引条款列表的基础。它们可用于描述任何对象不仅仅是文本。分类可以是UDC,设计和适用于信息检索,不仅用于货架排列。在各国中,其他那么美国分类对于分类目录和货架安排。虽然在美国传统中,它始终是“标记和公园”工具(DDC和LCC均旨在为此服务),但大多数欧洲国家都有丰富的传统,使用分类为语言独立的索引工具。