元数据设计、实施和最佳实践方面的创新

代表都柏林核心的人名

创造者: andrew.waugh
发行日期: 1998-02-03
最新版本: //www.voudr.com/specifications/dublin-core/name-representation/
发布历史: //www.voudr.com/specifications/dublin-core/name-representation/release_history/
描述: 本文提供了在元数据中表示人名的一些指导。

本说明提供了一些关于代表元数据中的名称的指导。

1.这个问题

虽然大多数人只有一个名字,但这个名字可以用许多不同的方式写下来。姓名可以写成全称(例如:“约翰·斯图亚特·米尔斯”)。名称的组成部分可以缩写(例如:'John S. Mills'或'J.S. Mills'),或省略(例如:“约翰·米尔斯”)。名字可以由头衔或敬语扩展(例如:“约翰·米尔斯先生”)。名称的组成部分可能被重新排序(例如。“米尔斯,约翰·斯图亚特·”)。 Complexity is added by the fact that people frequently do not use their 'official' name. People often prefer to use shortened or alternative forms of their name (e.g. 'Kathy' for 'Kathryn', and using 'Jack' for 'John' was once common in Australia). Some people prefer to use their second name instead of their given name (e.g. 'Margaret Read' instead of 'Frances M. Read').

当必须处理来自多种文化的名称时,复杂性的最后一个维度就出现了。附录A总结了在澳大利亚常见的一些文化的名称形式。在名称中可以找到的不同组件的范围是惊人的,这些组件可以排序的方式也是惊人的。让名字更难处理的是,移民在融入另一种文化时通常会更改自己的名字。例如,在抽取附录A的小册子中,人们注意到,在澳大利亚,名字以姓开头的人经常把姓移到最后,以适应主要的姓氏形式。

2.名称的使用

既然名称形式不是国际上一致的,而且每个人经常为了适合自己而更改自己的名称,那么在元数据中表示名称的最佳方法是什么?要回答这个问题,有必要考虑一下元数据系统中如何使用名称:

作为一条信息。通常,用户感兴趣的是使用名称作为自己的信息。比如,用户可能会问:“《狮子、女巫和魔衣橱》是谁写的?”用户需要这些信息是有原因的,比如检查返回的条目是否正确,或者执行进一步的工作。当使用名称作为一段信息时,名称如何表示并不重要,只要用户理解约定。例如,一个库目录将返回名称“Lewis, Clive Staples, 1898-”,并且期望用户(按照惯例)理解第一部分是姓氏,而字符串“1898-”根本不是名字的一部分。

*作为搜索键。用户感兴趣的是搜索与该名称相关的条目。

大多数当前搜索引擎搜索条目的完整文本,因此它是无关的*搜索*引擎如何订购名称的组件。但是,在某些情况下,它与用户有关。全文搜索将匹配名称中的搜索字符串的任何发生。例如,对姓氏'Andrew'的搜索将在名称(姓名或任何给定名称中的任何部分中的“Andrew”与所有名称匹配。如果可以将搜索限制为族名称,这将返回显着的比赛。在英文派生名称中,使用姓氏作为给定名称并不常用。但这可能对其他文化的名称不存在。

*作为排序键。名称通常用于对结果列表进行排序,并且在区域性中通常有关于名称排序的约定。例如,对于澳大利亚名字,惯例是按姓氏排序。不幸的是,很难构造一个通用算法来提取主排序键和次排序键,特别是当系统必须处理来自多种文化的名称时。一种常见的方法(例如,在库编目中使用)是对组件重新排序,使主键位于名称的开头。不同的名称表示方法权衡了不同的用途。例如,如果一个名字被用作一种信息,以“自然”的顺序(即发音的顺序)来代表一个名字可能是最好的,特别是当来自多种文化的名字要混合在一起的时候。但是这样的表示法会使盎格鲁-撒克逊人的名字难以排序,因为这些名字本应按姓氏排序。

4.表达名称的方法

它不太可能会对代表姓名的单一常见方式进行同意。以下是优选的优选方法。

一种。用你已经拥有的任何东西

在许多情况下,元数据将是现有数据库的视图(例如,图书馆目录或HR数据库)。简单地采用该数据库中使用的名称表示策略具有以下优点:

  • 名称与具有相同格式的其他数据库兼容。
  • 您不必在输入或维护名称时花费资源。(这是一个非常显着的成本。)

缺点是:

  • 现有数据库的设计可能没有考虑到国际范围。例如,它是否假定每个名字都有名、首字母和姓?
  • 名称可能与您希望使用的其他数据库(例如图书馆目录)不兼容。

b.使用已有的命名权限

如果您没有现有数据,或者不适合使用现有格式,则可以采用现有的命名权限。这些是标准化表示中的名称中的长期名单。一个例子是(美国)国会名称授权文件库,但大多数国家图书馆都将维护类似的名称权限文件。

使用现有的名称权威文件的优点是:

  • 与其他数据库的兼容性。标准名称权威文件被广泛使用。
  • 应用程序的一致性。

使用现有的名称权威文件的缺点是:

  • 您需要的名称可能不会在权威中。如果权威倾向于专业,这尤其如此。例如,国会名称颁发机构文件库将非常良好地覆盖美国作者,但也不会涵盖日本作者或美国联盟领导者。要添加扩展权限,您必须*完全了解用于生成权限的规则(否则名称将不一致)。
  • 必须购买名称机构
  • 为了有效,必须使用名称权限。也就是说,当需要添加条目时,必须咨询名称权威机构以获得官方表示。这显然需要时间,而且对某些应用程序来说并不经济。

c.采用现有的命名准则

如果您没有使用合适的命名权限,您可以通过有关如何表示名称的现有指导。附录B和C包含两个这样的指导方针的摘要。

采用现有指南的优势是:

  • 与共享这些准则的其他数据库(现有的和未来的)的兼容性
  • 完整性规则。在代表名字方面有许多复杂的问题,一套广泛采用的指导方针比一套内部制定的方针更有可能解决这些问题。
  • 开发指南的成本更低。

缺点是:

  • 这些指导方针可能比应用程序中实际需要的更复杂。例如,AACR包括了关于贵族头衔和荣誉条款的章节。
  • 指南可能需要相当大的培训和资源材料来持续应用。例如,在AACR中命名非Anglo / US名称的命名规则,假设访问被命名人的母语的参考书。大多数组织不太可能访问此类资源,也不熟练员工使用这些资源。

天。开发自己的命名指南

如果您可以使用的不合适的命名指南,您将不得不开发自己的。

如果可以,简化现有的命名方案。至少您将知道您要从您的方案中删除哪些灵活性和能力。

如果您必须开发自己的命名计划,请仔细思考:

  • 名字的三种用法(第3节)中哪一种对你来说是重要的。
  • 以您选择的格式收集名称的成本是多少。

美国、英国和澳大利亚的传统方法是将姓与名分开存储。这可能会导致非盎格鲁-撒克逊名称的问题,因为不同的数据输入人员可能以不同的方式输入名称,从而导致记录碎片化。另一种方法是在一个字段中输入首选名称,在另一个字段中输入排序键。喜欢的名字通常很容易从个人那里得到(事实上,他们可能更愿意用这个名字,而不是他们的全名)。排序键是名字中用作主要排序键的部分(通常是姓),通常也很容易从人那里获得。当使用条目时显示首选名称,当条目与其他条目一起排序时显示排序键。如果有必要,可以扩展此方法以包含完整的正式名称。

确认

Elizabeth Cherhal从两个非常明智的问题开始滚动球。STU Weibel,Simon Cox,Ann应用程序,Daniel Brickley,Jon Knight,Michael Jost,Karen M. Hsu,以及John A. Kunze凭借有用的建议。

附录A:国家名称表格

本附录的目的不是给出名称表单的最终列表(特别是,所有文化都有不符合符合的名称),而是让读者了解世界上使用的广泛名称的想法。希望这将鼓励元数据设计师远离设计,这假设名称可以填充

本综合摘要是基于澳大利亚小册子的民族命名制度:社会保障人员和社区工人指南,社会保障部,1990,ISBN 0 644 12167 x

许多文化使用一个或多个名后跟一个姓的通用名称形式。这些语言包括:亚美尼亚语、塞浦路斯语、爱沙尼亚语、希腊语、一些印度语(北印度语、古吉拉特语和孟加拉语)、拉脱维亚语、立陶宛语、马其顿语、马耳他语、毛利语、俄罗斯语、斯洛文尼亚语、汤加语和乌克兰语。阿拉伯语是类似的,但名称可能包括前缀(例如。“El”),这不是家族姓氏的一部分。(这本指南没有讨论英国人、美国人、法国人、德国人或荷兰人的名字)。

第二个最常见的名称表单是姓氏之前的名称。这些名称在以下文化中找到:中文,克罗地亚语,捷克,匈牙利语,意大利语,高棉,韩语,老挝,波兰语和塞尔维亚。其中一些文化只有一个给定的名字。如果存在两个给定的名称,某些文化使用第一个给定名称作为主要名称,其他文化是最后一个。

许多文化都不使用这两个名称表单。更复杂的名称表单的示例包括:

亚述

<父亲的个人名字> <祖父的个人名字>

在伊朗,习惯于将村庄名称放在所有官方文件上的姓氏(祖父名称)。这是*不是他们名称的一部分。

中国人

必须始终检查名称订单;有时名称已逆转以适合英语自定义。大多数女性在婚姻之前将丈夫的名字附加。姓氏可能由两个组件组成。

斐济

+

菲律宾人

洗礼名不常用。名称通常是缩写的(删除组件和缩短组件)。已婚女性通常省略母系姓氏,在自己的姓氏后加上丈夫的姓氏。寡妇通常在丈夫的姓前加上“Vedova”(缩写“Vda”)。

匈牙利

当女性成为鳏夫时,她们可能会在姓氏前加上“ozvegy”(简称“ozv”)。

印度(锡克教)

辛格 (男性)

考尔 (女性)

'Singh'和'Kaur'是宗教名字。一些锡克教徒可能会把它作为他们姓氏的一部分(可能用连字符连接)。“Singh”和“Kaur”可以缩写为首字母。

印度(南)

<父亲的名字>

父亲的名字可以写成姓名的首字母。父亲的名字可能被出生地、母亲的姓氏或依地区而定的父名所取代(或被缩写为首字母)。

印尼

+

可能没有部落名(也就是说,名字只是一个名字)。氏族的名字可能是他们父亲的名字,也可能是整个社区共有的名字。名称成分可以缩写为首字母。

意大利

已婚妇女可以将丈夫的姓氏添加到他们的名字:
在<丈夫的姓氏>

韩国人

每个给定的名称都有两个类型(音节)写为两个单词,这可能是连字符。必须使用两个部件(它不正确缩写或丢弃第二个)。有些韩国人使用每天使用的英文名称。

老挝

有些名字可以表示性别,所以名字前可能会有“Thao”或“Chao”(男性)或“Nang”(女性)来表示性别。

马来西亚

+ bin (男性)

+ Binte (女性)

'bin'和'binte'是指'儿子/女儿',不会出现一个非穆斯林马来语。已婚妇女传统上在他们给出的名字之前加入'Puan'。

葡萄牙语

+ <母亲的姓氏> <父亲的姓氏>

几乎每个女人都有“玛丽亚”作为她的名字,第二个是在日常使用中使用。在澳大利亚,许多葡萄牙语都丢弃了一个姓氏,并添加了“da”,'das','dos',或者'de'到另一个姓氏。已婚妇女将丈夫的父亲姓氏添加到他们的名字的尽头。

sinhalese.

<父亲的名字>

孩子们一出生就有了父亲的头两个名字。父亲的名字通常缩写为首字母。

西班牙语

<父亲的姓氏> <母亲的姓氏>

传统上,已婚妇女省略母系姓氏,在丈夫父亲的姓氏前加上“德”字。

土耳其

中间名不在每天使用。

越南语

<2 nd给定名称> <1st给定名称>

性别指标通常是“Thi”表示女性,“Van”表示男性。

附录B. Euler项目名称约定

欧拉(欧洲图书馆和数学科学中的电子资源)是一个欧洲项目,提供对数学出版物的网络访问(见http://www.emis.de/projects/EULER/)。描述命名实践的下文是由##提供的。

作者,编辑,作者参考

作者名以所有STN数据库通用的形式实现,即姓、名、中名。第一名和中间名可以缩写,也可以不缩写。搜索作者姓名时,建议只使用首字母。您将得到所有形式的名字,因为系统会自动添加一个截断符号。因此,下列实现形式是可能的:

Friedrich Wilhelm Mahle作为Mahle,F.
马勒,f·W。
马勒,弗里德里希
马勒,弗里德里希·W。
马勒,弗里德里希·威廉
作为编辑(如马勒,弗里德里希·W.)

推荐的搜索表格如下:

Mahle,F.

系统会自动搜索

马勒,F *

包含介词(VON,VAN),文章(LE),文章和介词组合(DU,VANDER),关系或属性(FITZ,MAC,JUN。,III)的名称具有其原籍国的格式。因此,建议使用放置在名称前面和名称之后的补充品的名称。

文档数据库记录

彼得·冯·德·米尔,彼得·冯·德
Fritz von heyden(de)担任海登,弗里茨冯
Fritz von Heyden(美国)作为弗里茨的冯海登
A. de l'Aigle担任L'Aigle,A de
C.M. Di Bari, C.M. Di Bari
Michel del Pedro担任Del Pedro,米歇尔
L.C. MacLean更名为MacLean, L.C.
John Fitz Gerald As Fitz Gerald,约翰
A. Miller jun. as Miller, A.jun。

西里尔字母的名字已经按照ISO标准转录。在某些情况下,这种音译与翻译文件上或西方期刊上的音译不同。在这种情况下,我们将不同形式的拼写作为作者引用显示在作者字段的大括号中。

AACR中命名规则的附录C摘要

英美编目规则[1]是描述加拿大、美国和英国图书馆对象如何编目的标准。它也在其他国家使用(如澳大利亚)。这些规则的一部分描述了人员的名字如何在目录条目中表示。本附录总结了这些命名规则。

一般原则是:

  1. 使用的名称应该是该人通常已知的人。例如,'Mark Twain'不是'Samuel Clemens'。(在图书馆目录中,其他名称被添加为跨引用。)

重音符号和变音符号应该包括在内,如果被使用的人的名字之间也应该有连字符。

一般情况下,首选名称取自作者的作品,但也可取自以作者的语言或居住或活动国家发表的参考文献。

如果名称来自非罗马脚本,并且存在着名的英语语言版本,请使用英语版本。例如,'孔子'不是'k`ung-tzu'。根据需要添加其他版本作为交叉引用。(此规则几乎肯定不会在语言以外的语言以外的图书馆中采用!)

  1. 对名称进行了排列,以便用于对名称进行排序的组件(“entry元素”)最先出现。例如,在盎格鲁-撒克逊名字中,名字是按姓氏排序的。“克莱夫·斯台普斯·刘易斯”的“入口元素”是“刘易斯”,名字将被表示为“刘易斯,克莱夫·斯台普斯”。

使用以居住国或活动国语言编写的权威字母列表来确定姓名的输入元素。权威的按字母顺序排列的名单是“Who's Who”(或类似的),而不是电话号码簿。(区别似乎是一个是由人类排序的,或者至少是由人类检查的,而另一个是机械排序的)。

如果条目元素是姓氏(姓氏),它之后是逗号*即使姓名正常是第一个*如中文名称。

一些特殊规则:
*对于复合族名称(包含两个或多个名称组件的名称),以下规则适用(按顺序):

  1. 条目元素是人们更喜欢被列出的名称,即使这比姓氏长(例如'Lloyd George,David',即使他父亲的姓氏是'George')。
  2. 如果复合名称通常为连字符,则以完整的复合名称输入名称。
  3. 除非此人是葡萄牙人或姓由娘家姓和丈夫姓组成的妇女,否则请输入复合姓的第一个元素。
  4. 如果该人是葡萄牙语,请在复合姓氏的第二个元素下输入。
  5. 如果这个人是一个女人,她的姓由她的娘家姓和丈夫的姓组成,如果这个女人是捷克人、法国人、匈牙利人、意大利人或西班牙人,请在名字的第一个元素下输入。否则就以丈夫的姓氏登记。

如果名称看起来是一个复合名称,但不能检查,它应该被视为一个复合名称,除非语言是英语或斯堪的纳维亚语言之一。对于斯堪的纳维亚名称,在复合名称下添加交叉引用。

*将拍摄的姓氏的位置名称被认为是姓氏的一部分。

关系术语(Jnr, fils)不被认为是姓氏的一部分,除非它是葡萄牙语名字。如果有必要区分两个相同的名称,则在名称后面加逗号(如Smith, John, Jnr)

*如果姓氏中有冠词或介词作为前缀(如van, du, le),在冠词或介词下输入冠词或介词,如果这是在人的语言或居住或活动的国家排序的方式。

如果姓氏包括不是文章或介词的前缀(例如,在Welsh名称或'Mac'中的文章或介词(例如'AP'),请在前缀下输入。

*如果名称不包含姓氏,则在给定名称下列表。

如果名字不含姓,但包含父名(源自父亲的名字),不要把父名当作姓;在名字下面列出名字。如果父名在前面(例如在蒙古名字中),重新排列名字,使名在前面。

参考文献

[1] Anglo-Americ Americs编目规则,第二版,1988年修订,1993年修订,Michael Gorman&Paul W. Winkler(EDS),由美国图书馆协会,加拿大图书馆协会和图书馆协会出版有限公司出版