元数据设计、实施和最佳实践方面的创新

DCMI 2019:元数据最佳实践日

DCMI 20129最好的练习日是一项新活动,将于2019年9月26日在首尔(由韩国国家图书馆主办)举行,紧随2019年DCMI会议和研讨会之后。

目的最好的练习日是听取已经实施了健全和创新的元数据系统的机构的意见,以便与DCMI社区分享他们的经验和见解。

主持人:2019年DC会议主席Sam Oh

上午9点——09:20
全智海(国立图书馆)
标题:Dublin Core™用法用于链接开放数据服务:NLK LOD
文摘:韩国国家图书馆(NLK)一直在发布LOD,并从Kormarc和Mods转换为RDF格式的kormarc和mod。为了实现数据的互操作性和开放性,NLK正在使用现有的RDF词汇表和本体的属性和类(例如,D.ILIN Core,Bibo,Skos,FoAF),同时定义其当地词汇名为Nlon(国家图书馆本体)。此演示文稿将显示NLK LOD服务的开发,重点关注使用这些可重用标准建模和转换数据的过程。根据提供数据的目的,NLK运行一个单独的LOD服务平台(LOD.nl.go.kr),可以从SPARQL端点查询数据。还提供了数据集和一些应用服务的批量下载。该平台将简要介绍。
09:20——09:40
[上海图书馆,中国]
标题:将不同的元数据模式建模为一个本体的知识氛围。
文摘:具有不同元数据模式的LOM资源不同。在将所有这些元数据记录转换为链接数据时,我们需要一个统一的数据模型来将数据集成在一起。上海图书馆的数字人文团队设计了一个本体论作为抽象数据模型,以定义不同概念,类和属性的关系,从档案,家谱文件,古人书,旧照片,旧电影等不同资源的元数据模式中提取的不同概念,类和属性。很快。然后将不同格式的元数据记录转换为RDF数据,并通过构建从包括人员,组织,置位等的元数据记录中提取的实体之间的关系来将所有资源链接为链接的开放数据。
09:40 - 10点
努诺·弗莱雷和安东尼·艾萨克[欧欧拉]
标题:欧洲数据模型 - 原则,社区和创新。
文摘:在欧洲汇总进程中,欧洲数据模型(EDM)是允许欧洲欧洲数据模型,以维持关于文化人工制品的数字表示的可持续聚合,以及丰富的上下文化数据和支持元数据的多语分。EDM支持欧洲欧洲运营的几个核心进程,并对欧洲平台的访问层贡献,支持与第三方共享数据,按照Web上发布数据的最佳实践。EDM是一个以社区为基础的努力,涉及来自欧洲欧洲所有域名的代表:图书馆,博物馆,档案馆和画廊。它最初在2010年定义,并在欧洲欧洲的协调和维护下,在持续改进之下。虽然欧洲欧洲维持核心EDM,但它还提供了在社区内部建立新扩展的指导。我们将介绍指导EDM设计,最近进展和扩展示例的故事和原则。根据EDM治理最近的一份报告,我们将反映社区模型如何达到初步期望。此外,我们将讨论EDM在欧洲网络在董事会中提高元数据质量的活动中发挥的作用,特别是通过欧洲数据质量委员会。最后,我们将提议讨论我们最近的创新方面的工作与欧洲欧洲的元数据流相关,例如Schema.org的使用情况,了解文物的描述。
10 - 20
Sachiko Inoue [日本国家饮食图书馆]
标题:日本搜索:数字文化遗产的国家跨部门门户。
文摘:日本搜索(Japan Search),顾名思义,是搜索从出版作品、绘画、文化遗产到广播、电影等各种日语内容的门户网站。它通过聚合由图书馆、画廊、博物馆和档案馆等机构创建的元数据,增强了内容的可发现性。在这次演讲中,日本国家国会图书馆,日本搜索系统的开发,将给出一个解释,重点在三个主要的点:它如何提供用户跨部门的搜索,而不确定单一的数据格式聚合元数据;它如何通过将聚合的元数据转换为标准化的基于rdf的数据模型来实现与其他文化遗产门户的互操作性;以及它提供了哪些额外功能来活跃用户社区。还将简要演示日本搜索的工作原理。
10:30 - 11:00
咖啡时间(休闲时光
11点- 11:20
MC Cote〔加拿大图书馆及档案馆〕
标题:加拿大政府的元数据成功案例和其他故事
文摘:Marie-Claude Côté将介绍在加拿大政府(GC)成功的元数据应用,解释它们的成功因素,并从不太成功的元数据应用中吸取经验教训。故事将包括支持联邦地理空间平台的元数据、全gc级别的记录保存系统、统计数据、网络元数据和电子学习对象。
11 - 11点
萧光王,谭旭,宁源宋,大卫克拉,萧曦罗。[武汉大学]
标题:文化遗产意象的深层语义诠释。
文摘:随着文化遗产图像信息资源的快速增长和数字人文研究的发展,以文化遗产图像语义标注为目标的图像深度语义标注(Deep Semantic Annotation, DSA)逐渐受到越来越多的关注。然而,目前基于特征和主题的文化遗产图像语义索引方法大多只关注元数据层面,不能很好地处理文化遗产图像的内容,存在不足。与现有方法不同,本文提出的DSA不仅对文化图像元数据进行索引,而且对文化图像中的细粒度语义元素进行注释,从而支持图像资源的集成和知识自动发现。本研究提出的DSA方法名为DSA- ch (Deep Semantic Annotation for Cultural Heritage Images),包含一系列图像内容组织模型,并使用标注和实验过程进行设计。多层次的组织结构是研究的关键。本研究借鉴Panofsky的图像学理论(Panofsky, 1939),提出了文化遗产图像多级细粒度标注模型,包括元数据级、元素级、语义标注级和语义组织级。本研究采用两个独立的注释实验,分别对敦煌壁画中的两幅不同的叙述性绘画进行了评价和描述:(1)以莫高窟257洞的《九色鹿本生》为例,实施DSA过程;(2)以莫高窟428洞《饥饿的老虎本生》为例,对标注方法进行检验。在这些实验中,图像中的对象使用工具(Synaptic)进行标记,并映射到用于结构化组织的领域本体。利用DSA-CH方法提取并注释这些对象之间的关系。 The annotation experiments verified the feasibility of DSA-CH.
11:40 - 12:00
Marcia Zeng[美国肯特州立大学学院],Imma Subirats Coll[联合国粮农组织]
标题:AGRIS整合研究数据集元数据的步骤。
文摘:AGRIS是联合国粮食及农业组织(FAO)的国际农业科技系统。作为粮农组织农业信息管理标准(AIMS)的全球公共多语言书目数据库和服务,自1975年以来,AGRIS一直在全球范围内提供有关农业科学和技术的书目信息资源,是最早使用先进语义技术的链接开放数据之一。它的AGRIS AP元数据元素集是Dublin Core™的应用程序概要文件。本报告报告了AGRIS的一项新努力,即有效地扩展元数据范围,以便不仅持续覆盖出版物的书目元数据,而且还包括研究数据资源。该试点项目产生了一项新功能,使用户可以自2019年5月以来通过AGRIS搜索数千个开放数据集。本次演讲将分享在AGRIS框架内实现书目和研究数据管理和访问的元数据互操作性的过程、研究成果和最佳实践。
12:00 - 12:20
Sophy Shu-jiun陈和陆日路。[Sinica Digital Cultures中心,台湾)
标题:链接开放数据及其构建语义聚合平台的可能途径:台湾数字档案案例
文摘:在语义网时代,数据集成的主要问题之一是如何在数字聚合平台上处理来自异构资源的不同主题的数据。以“台湾数位档案”(TaiUC)为例,“台湾数位档案”是由中央研究院数位文化中心(ASCDC)管理的一个联合目录,包含超过560万件数位资料,涉及生物、人类学、艺术及文物等17个不同主题。ASCDC正试图展示一种基于慷慨和特定语义数据模型的异构链接数据集成方法,以及它在不同模式的数据可视化(图表、GIS地图、SNA)、跨域数据查询和与外部资源链接(VIAF、ULAN)方面的可能应用(EDM、BIBFRAME)。
12:30 - 14:00
午餐
14:00 - 20分
Kosuke Tanabe [国家材料科学研究所]
标题:FAIR材料数据的协作词汇服务
文摘:在国家材料科学研究院,我们正在开发服务平台,称为材料数据平台(MDPF),以支持数据驱动的材料科学。该项目聚合来自许多子域的数据,称为柔性元数据管理方案,存储不同类型的信息,如化学物质,表征方法,仪器和单元。鉴于要管理的复杂性和数据量,我们决定遵循一个协作方法,其中平台从UserBase的贡献中受益(也称为人群源)。因此,我们正在基于Wikibase构建词汇管理服务,使我们能够将来自各种子域和专业知识的投入合并。这种词汇不仅支持材料数据中的灵活性和可粘附性,而且我们还预计这一词汇本身就是可重复使用的知识库。在此贡献中,我们介绍了服务的详细信息及其与MDPF中的其他应用程序和系统的集成,例如材料数据存储库和文本和数据挖掘平台。
十四20 - 40
Myung-Ja Han和Jackie Shieh [史密松机构伊利诺伊大学]
标题:关联数据合作编目计划
文摘:合作编目计划(PCC)的工作是“通过支持图书馆和其他文化遗产社区的元数据生产者,并通过与具有共同目标的伙伴结成联盟,促进世界知识的发现和利用”。[1]自2016年以来,PCC已积极开发联系数据最佳实践,特别是在审查和评估链接数据工具和标准以指导链接数据工具和标准后,在图书馆联系数据中开发联系的数据最佳实践,尤其是建立任务组和工作组,以在审查和评估链接数据工具和标准后发布最佳实践文件。本演示文稿将分享三个PCC组的目标和成就:联系数据咨询委员会(LDAC),为有关联系数据提供指导;链接数据最佳实践组,在MARC环境中建立了联系数据实践;和应用程序配置文件任务组,它定义了开发基于社区的应用程序配置文件的指南。虽然这三个团体有具体的指控,但它们共享相同的目标,例如,为LibleD数据建立图书馆社区的最佳实践。
14:40 - 15:00
Yoonkyung崔。[国家图书馆]
标题:韩国国家图书馆的元数据应用与未来方向。
文摘:韩国国家图书馆(NLK)负责培训和标准化的国家书目。NLK采用了各种元数据方案,如Kormarc(韩国机器可读目录),MODS(元数据对象描述架构)和都柏林核心™,基于需要呈现的资源和服务。通过不同方案获得的元数据已与韩​​国的其他库共享。在Kolis(韩国图书馆信息系统)中,一个内部开发系统,我们采用Kormarc用于离线资源和在线资源的Mods。为集成搜索生成这些元数据的索引。通过各种元数据方案的采用导致数据管理和使用情况存在一些问题。To settle those issues, the NLK has applied ‘work clustering’ for offline and online resources in the national union catalog ‘KOLIS-NET’ since April 2019. In a long-term perspective, the NLK set up the future goals for the national bibliographic data as “faster and richer”, “more precise and with high quality” and “well-used in various fields even outside of the library”. To achieve that goal, the NLK is looking for some ways to use various external data other than MARC library data. Also, we are planning to apply BIBFRAME to integrate many different types of metadata until 2023. Furthermore, the NLK will develop strategies for next-generation national bibliography to provide special services for data consumers such as libraries, publishers/venders, end users, and researchers.
15:00 - 15:20
大卫·克拉克。(Synaptica)
标题:关联数据KOS -分类法和本体之间的空间。
文摘:如果公理和全猫头鹰对于一个人的业务用例太复杂,但Skos分类是限制性的。With Reference to the Zeng-Mayr 2018 paper on KOS in the Semantic Web (1), and with the use of live demonstrations in Synaptica’s KOS modelling tool Graphite, Clarke will explore some practical design, build, and governance methods for curating Knowledge Organization Systems as Linked Data in the space between taxonomy and ontology.https://link.springer.com/article/10.1007/S00799-018-0241-2
下午15:30 - 16:00
咖啡时间(休闲时光
16:00 - 16:20
郭建贤和李娇。[中国农业科学院农业信息机构(CAAS0),中国]
标题:基于KOSS开放,交互和发现多语种农业数据。
文摘:为了探索开放,交互和发现多语言数据的有效方法,本演示文稿首先对开放联系数据和知识组织系统(KOS)进行了概念分析。说明了作为依赖API的语义开放和整合中国农业文献数据的架构和关键技术,主要基于KOSS(中国农业杂耍和Agrovoc及其映射)。此外,数百万命名实体(如人,组织,植物区系,动物区系等)用于促进认知搜索过程。最后,展望了具有大数据和人工智能的KOSS的合并趋势。
十六20 -发表
Haiqing林。(加州大学伯克利分校)
标题:利用人脸识别技术为电影明星照片集分配LC名称权限的实验报告。
文摘:在管理历史照片集合时,识别旧照片中的人是对图书馆的挑战。实验现在旨在探讨部署亚马逊的人脸识别以识别历史舞台照片中的电影明星的方式。该演示概述了实验的框架,包括三个基本组件,包括应用程序界面,亚马逊再识别API,面部收集和元数据集。讨论将专注于开发面部收集元数据解决方案,以满足当地需求。作为当地的实践,我们审查了将面部识别标识与国会授权文件库连接到国会授权文件库,因为我们打算将国会名称权限图书馆分配给舞台照片。在介绍结束时,将谈论使用面部识别技术的伦理问题。
16:40 - 17:00
Tae-Sul Seo和Mihwan Hyun [Kisti,韩国]
标题:开放存取存储库之间信息共享的元数据
文摘:随着最近开放访问的进步,有许多存储库和聚合服务。因此,需要交换和集成存储库之间的数据。元数据标准化很重要,因为每个存储库的数据结构可能略有不同。因此,我们介绍了KISTI和OpenAire的存储库之间的开放访问日记信息的交换示例,以及存储库之间的元数据映射方法。还提出了未来学术信息的数据模型。
17:00 - 17:20
Nisachol Chamnongsri博士[苏拉勒理工大学信息技术学院]
标题:泰国和亚洲棕榈叶手稿元数据标准
文摘:Palm Leaf MoreScripts(PLM)元数据的目标是促进尽可能有效地访问和使用记录在PLM上的知识。同时,该模式应作为用于管理PLMS和其他数字化古代文件的标准信息结构。这也将通过互联网将亚洲文化遗产和智慧与该地区可能的国家进行联系。本文旨在为泰国和亚洲提供当前PLMS管理的现状,目前在工作项目中使用PLMS元数据模式,为PLMS的长期保存,挑战和建设性解决方案以及PLMS元数据元素的第一草稿2017年9月6日至7日举行的IFLA国家图书馆和文件服务委员会国家图书馆和文件服务委员会的IFLA PLMS保存研讨会。
17:20 - 17:40
艾哈迈德·扎姆·哈里罗·萨姆苏丁博士
标题:元数据的创新使用:来自马来西亚的一些见解
文摘:在信息检索中,元数据是确保及时检索到相关信息的重要元素。在国际和地方层面有许多元数据倡议,包括信息机构的贡献,特别是马来西亚的图书馆。该论文强调了马来西亚元数据计划的当前发展。会议将讨论发展状况、问题和挑战。