元数据设计,实施和最佳实践的创新

DCMI 2021:元数据最佳实践

dcmi - 2021最佳实践是听取实施了健全和创新的元数据系统的机构的意见,他们与DCMI社区分享他们的经验和见解。

在Web上发布结构化元数据的指南

吴明博士

澳大利亚研究数据公共(ARDC)

FAIR(可查找、可访问、可互操作和可重用)数据原则经常将元数据作为可发现性的关键推动者。在网络上发布结构化元数据可以为提高研究资源的公平性提供一种简单而有效的手段:它通过正式的机制公开网页中包含的元数据,允许基于网络的爬虫进行系统的收集和处理。在数据目录内和跨数据目录采用结构化元数据的努力将极大地受益于一组建议,这些建议将有助于确保一致的实现,从而增强数据的可发现性和可访问性,以及元数据的互操作性。本报告报告了研究数据联盟研究元数据模式工作组的一项工作,该工作组正在开发指导方针,其中包括9条建议,以支持在web上发布结构化元数据的过程。

将Wikidata合并到编目工作流程中

河边科恩博士

以色列国家图书馆,耶路撒冷

链接数据作为现实正在通过巨大的步骤接近。越来越多的组织包括以色列国家图书馆(NLI),是将Wikidata作为一个连接的数据世界的踏脚石。此演示文稿将讨论NLI如何努力弥合编目工作流程和Wikidata工作之间的差距以及Covid-19相关锁定对我们计划的影响。我们还将讨论与NLI纳入最佳实践的相关成本和福利,以将Wikidata纳入我们的最佳实践。预定的受众包括目录者,Wikidata爱好者和对多元文化元数据感兴趣的人作为社会正义工作。

壁画元数据需求开发

女士萨旺尼河Hoaihongthong

Khon Kaen University.

本研究是数字人文研究小组的成果。它是基于元数据生命周期模型为壁画创建元数据需求。元数据需求开发通过使用元数据组件与主要标准进行比较,找到15个元素之间的共同元素,分析壁画的特征,从元素的信息行为研究6个元素,元素来自当前状态的数据寄存器17个元素和来自标准VRA核心元素19个元素。分析结果来源于壁画的19个元数据元素。该成分可适用于VRA核心标准的13种元素,是主标准无法参考的元素,需要设置6种元素。

档案的链接数据:模型,技术和应用

卡拉·特谢拉·洛佩斯医生和克里斯蒂娜·里贝罗医生

TECS - 葡萄牙技术与科学研究所 - 科技和科学研究所

EPISA -语义档案的实体和属性推断是一个项目,涉及国家档案馆(Arquivo Nacional da Torre do Tombo)和两个大学研究中心,INESC TEC和Évora大学。EPISA将档案作为全球语义Web系统的组件处理,使它们的资产更加可见,并在档案描述性记录中公开丰富的信息。EPISA探索了新的关联数据模型,并建立在已提出的文化遗产模型的经验基础上,即博物馆社区开发的CIDOC概念参考模型(CIDOC- crm)和国际档案理事会提出的记录背景概念模型(RiC-CM)。该项目有两个主要目标。第一个是对现有归档记录的显式表示模型的定义,该模型将其中的信息链接到世界范围内庞大而多样的语义信息存储库。第二个是构建应用程序,该应用程序嵌入模型,并提供丰富的接口,用于导航档案和档案管理员组织和描述新资产。这为档案处理更系统地吸收出生数字基金做好了准备,也为物理和数字资产上的元数据的互操作性做好了准备。

促进粮食和农业科学信息和数字数据的可及性

Imma Subirats

联合国粮农组织(联合国粮食及农业组织)

Agris是联合国粮食和农业组织(粮农组织)提供的全球公共服务,是一个中央服务,该服务管理不同的资源,越过许多界限,如资源类型,语言,地理区域,提供商和领域。此演示文稿将集中在三个重要组成部分:(1)元数据基础设施,统一参考书目和研究数据的管理和访问,(2)通过Agrovoc为其多语言和语义策略而启用的索引方法,以及(3)统一社区的平台和服务,可以为数据提供商,合作伙伴和用户提供两种方式,为Agris Core KnowersionBase提供贡献。

基于云本机实现的语义架构:上海图书馆数字人文平台设计

刘伟和夏翠娟

上海图书馆(上海科学技术信息研究所)

语义体系结构是数字人文应用系统特有的体系结构,也是语义技术成熟所带来的一种能力。具体来说,是指数字人文平台中的数字知识内容具有一定的结构,可以用本体、关联数据、知识图等形式来描述和表达。例如,各种词汇表可以描述和编码各种对象(人、地点、时间、事件等)的字符、属性和关系,以便计算机可以处理这些语义数据(可以理解为RDF数据)。然后语义数据可以被认为是“可以理解的”,因此大量的数字内容在整个知识基础可以被看作是一个数字的双胞胎的现实世界中,它甚至可以用于制造机器进行某些“事实推理”。在本次演讲中,主讲人将尝试解释上海图书馆数字人文平台语义架构的设计和基于云本地的实现。

传感器无处不在

John Antill.

国防部,美国GOV

军方使用多个数据点来创建报告。其中一些是开源数据点,其他人是军事特定。开源数据可以包括跟踪濒临灭绝的动物运动,因为它们对威胁,社交媒体帖子和GPS的展示,发布宣传的网站。一些军事特定数据点可以是生物识别,地理空间,图像,信号,人类或网络标识符。本次会议将如何识别数据的标准化,并将其放入高电平的智能报告中。

建立生物多样性知识图谱的培训和黑客马拉松

罗德里克教授页面

格拉斯哥大学

这次谈话将讨论论文的“Wikidata的智能化作为标识符代理和范围工具的奖励”结果,并挑战说话者从元数据到知识图表的地址。

都柏林核心在开放地理空间数据出版中的作用

哈维尔·格拉Iso

萨拉戈萨大学先进信息系统实验室

空间数据基础设施在九十年代结束时定义为技术,政策,标准和人力资源的协调方法,以促进收购和开发地理空间数据。自这样的基础架构开始以来,元数据扮演了描述这些基础架构提供的数据和服务的重要作用。此外,鉴于纯地理信息的复杂性,如ISO 19115,Dublin核心始终被视为必要的互补元数据标准,以便于实现发现服务的实现,或与其他更多常规域的互操作性。如今,地理空间数据构成了开放数据门户网站中的政府管理和发布的数据的很大一部分,这些门户网站是地理空间数据的主要传播机制,替换了地理位置和空间数据基础架构的地理空间目录中扮演的角色。考虑到DCAT和DCAT-AP是开放数据资源描述的主要元数据模式,并且基于都柏林核心,都柏林核心现在更重要地在20年前出版地理空间数据。此谈话将在过去20年中展示Dublin Core的历史,与空间数据基础架构中的地理空间数据发布和开放数据门户网站。鉴于在各种地区的决策和资源管理的地理信息的重要性,这种谈话可能对有兴趣的关于信息系统的开发或管理的人感兴趣。

创作实践档案:来自物理、数字和无形的元数据挑战

盖伊·巴克斯特和莎伦·马克斯韦尔

雷丁大学特刊

与我们寻求记录的许多人类活动相比,创造性实践对图书馆员,档案家和策展人的挑战起到了许多挑战。我们如何捕捉一个想法的本质?创造力什么时候发生?是否有完成的工作,甚至可以记录?因为他们寻求能够获得作家,艺术家,表演者,建筑师,电影制造商和工艺品的机会,英国阅读大学的档案团队对广泛的方法开放,甚至更加复杂过渡到数字创意实践。这次最佳实践演示将借鉴我们对数据结构,数据等待和时间表的工作,以及我们对信息接入点的方法。它会问:这些挑战与编目元数据的生产是什么?如何学习创作过程的知识援助我们在数字档案中“看到”的内容?如何跨越跨学科方法如何帮助我们浏览这些问题,并确保在实践中帮助档案论坛?

元数据练习

李·希伯德和埃尔斯佩思·哈斯顿

苏格兰国家图书馆(Lee Hibberd),皇家植物园爱丁堡(Elspeth Haston)

在各自的机构进行元数据实践。

元数据在马来西亚的网络归档计划中使用

法拉·戴安娜·赛弗·巴里,穆罕默德·伊兹万·本·拉姆利

信息管理学院,马来西亚国家档案馆大学Teknologi Mara

马来西亚的网络档案计划已经开始并逐步展开。马来西亚教育机构和国家层面的网络档案计划将被公开,并以实施和元数据使用的方式进行解释。教育机构和国家层面的倡议(被称为MyGWA)都积极地在指定的网络存档库中收集网络存档内容。网络档案存储库要么配备描述性元数据,以方便网络用户公开访问集合。然而,有必要改进和扩展元数据的使用,以满足网络存档在未来的广泛使用,特别是使用适当的元数据标准。因此,已经进行了一些比较研究和基准测试,并将对结果进行可视化和展示。这一比较研究的结果对进一步增强网络档案存储库的web保存功能具有一定的参考价值。

机构存储库元数据:肯尼亚大学图书馆的方法和挑战。

Joseph Kiplang'at和Humprey Keah博士

莫伊大学信息科学学院;粮农组织顾问KM顾问

肯尼亚大学通过发展机构知识库,在利用当地内容方面做出了巨大的努力。据观察,大学图书馆使用不同的工具和软件来组织其机构知识库中的资源。这些知识库提供了发表和展示一个机构的整个学术领域的机会,包括文章、书籍、论文、学位论文和期刊。本文将探讨肯尼亚选定的大学机构知识库的机遇和挑战。此外,还将重点介绍通过语义网实现都柏林核心元数据模式在研究成果知识发现中的主要经验。

DC数字图书馆的演变:Digibib

伊莎贝尔马丁Tirado

Digibis,Slu.

我们的数字图书馆中元数据的短期发展,从DC(对OAI存储库至关重要),到EDM和未来的IIIF和Schema.org,特别是博学多才虚拟图书馆(Larramendi基金会)的遗产中心项目,该项目获得了2021年Europa Nostra教育类奖项。

在韩国国家图书馆改进元数据工作流程的实施和挑战

yoon kyung choi.

韩国国家图书馆

NLK正在尝试应用新技术,使元数据工作流程更高效。我将介绍NLK与演示文稿中的自动主题索引和元数据自动提取相关的两个项目。

都柏林核心在巴西科学信息生态系统中的使用

华盛顿Luís里贝罗·德·卡瓦略第二贡多

Instituto Brasileiro de Informação em Ciência e Tecnologia

巴西在创建开放获取数字资源的互操作网络方面有着悠久的传统。2002年,巴西论文和学位论文数字图书馆(BDTD)成立,它使用了一种基于特定的电子论文和学位论文互操作性元数据标准(ETD-MS)的文档描述标准。在21世纪的后半期,巴西科学出版物和数据门户(oasis)也创建了,它是围绕OAI-DC元数据描述标准组织的。最后,从2018年开始,除文本科学对象外,OasisBr还开始收集研究数据。为了描述这种类型的资源,使用了DataCite标准作为基础。更重要的是,OasisBr的另一个扩展正在进行中,目前正在全国范围内建设一个名为BrCris的研究信息系统。后者基于VIVO本体对实体和关系进行描述。本次演讲的目标受众是数据分析师、图书管理员和开放数字存储库的利益相关者。

支持历史人物数字人文的本体设计:台湾传记数据库(TBDB)案例

昊守克,顺宏,苏冰

国立台湾师范大学,台湾,R.O.C。

台湾传记数据库(TBDB)组装台湾历史人物的传记信息。它支持关系数据库操作,全文搜索,社交网络分析和地理信息系统功能。TBDB的主要目的是提供一种数字 - 人文为导向的系统,激发历史学家探索台湾历史。为了描述TBDB中的实体,提高台湾现代历史中的域知识的重用,并促进通过链接开放数据的台湾历史相关系统之间的数据交换和系统互操作性,在TBDB中开发了本体。此演示文稿介绍了TBDB的开发,并侧重于该本体论的设计过程,这些过程集成了几个广泛的本体和元数据,如CIDOC CRM,Schema.org和Dublin Core。