使用语义网络来提高翻译知识

Karen Sandra Smith-Yoshimura

抽象的


WorldCat中近4亿本近4亿的书目记录中的一半以上是英语以外的语言。所描述的大多数专着仅发布一次。但是,几百万代表了我们分享文化作品的核心,这些工程已被翻译成多种语言,有时将多次翻译成相同的语言。我们了解其他文化,其他文化通过这些翻译了解我们的文化。作为世界上最大的书目数据库,WorldCat定位为提供工程的翻译历史,使用W3C Bib extension Translictricwork将每个翻译的关系传达给原始工作。在我们的多语言数据增强项目中,我们的目标是改善最常见的发布作品的描述,因为它们是最有可能被用户翻译和搜索的人。在Marc Records的数据库中,机器流程无法支持浏览或搜索作品及其翻译。关键实体,如原始工作的标题和转换器的名称并不总是以机器可理解的形式表达 - 有时信息缺少。由于手动清理不可扩展,我们探讨了从第三方来源,Wikidata的链接数据丰富MARC记录的可能性。通过将来自WorldCat和Wikidata的信息集成,我们可以更好地展示有关用户的首选语言和脚本的频繁翻译作品的信息。