元数据设计、实施和最佳实践方面的创新

论文,报告,会议,海报,研讨会,教程和实践会议

主题演讲
年轻人KO主题演讲:从术语数据库中提取本体(主题)
年轻人Ko
基于结构定义的术语是基于由概念类别(类)构建的属性的术语。当从关系数据库中提取结构定义的术语进入RDF时,可以通过SPARQL查询生成推理规则以用于复杂的语义搜索。杠杆的复杂SPARQL查询,这些规则可以产生比简单的关键字查询更好的结果,反映了语义相关术语的逻辑组合。在如此生成的本体中,基于本体的基础,基于结构定义的术语可用于索引数据库,以通过应用明确定义的语义概念来索引数据库以进行检索和挖掘非正式大数据。
Karen Coyle的Keynote:所有书籍(主题)
Karen Coyle.
由于亚历山大亚历山大的传说库的日子,有努力收集完整的记录知识。虽然各种努力都注重质量,覆盖范围和冗余,但对于如何 - 或if - 这些数据仓库最佳地提供知识追求者的措施。Coyle将需要很长时间的信息来源的“狩猎和聚集”的历史,包括难以定义全部或书籍。虽然可以提出对用户服务的简单解决方案,但她将争论以人为本的而不是以目标为中心的方法。
Javed Mostafa的主题演讲:即将到来的信息倒置年龄:当信息搜索“将是”寻求者时(主题)
javed mostafa.
“书籍太多了。他们每天都在猛烈的丰富。他们中的许多人都是无用而愚蠢的;他们的存在和保护是人类的重量。“后者是来自西班牙哲学家何塞·奥尔塔·ygasset着名致辞的报价,标题为“图书管理员的使命”,他在大约85年前。众所周知,情况没有改变,事实上它已经变得更糟。大约十几年jensen等人。发表了一项很好的研究,表明甚至专家,在生物医学的某些地区,在花费整体终身的努力时可能无法在其特定的研究领域阅读所有相关文章。从“双刃剑”的“双刃剑”中获取灵感,这些技术应该作为解决方案的潜在来源来视为贡献信息生产。但是,如果我们依靠信息技术只能改善我们如何找到信息,我们会严重处理其实际潜力。 With recent advances in IT, there is an opportunity to enhance the full scholarly information life-cycle: seeking, producing, disseminating, and using scholarly information. Discussing the various ways to take advantage of IT to support the full scholarly information life-cycle may take too long and it may be out-of-scope in this forum. Hence, I will primarily focus on seeking and producing scholarly information. Specifically, four areas will be covered: 1) Machine-assisted information discovery, authentication, and validation, 2) Cyberinfrastructure and scientific instrument interfacing to automate document and data production, 3) Documents as information agents and document-agent communities, and finally, 4) Communication in next-generation scholarly ecosystems where scholars and documents engage in dialogs and even debates. Wherever appropriate, I will point out relevant R&D activities conducted by researchers in my laboratory and other researchers around the world.
会议:元数据分析和评估(1)
朝着元数据活动矩阵:概念化和接地研究生命周期和元数据连接[纸张(短)]
索尼娅·帕斯夸,李凯和简·格林伯格

元数据如何涉及数据驱动的科学实践是评估其价值的重要手段,实现元数据资本概念的目标。在此过程中,我们提出了一个研究项目,旨在探讨元数据活动如何嵌入研究和数据活动中,如研究和数据生命周期模型中所示。作为该项目的第一步,我们识别研究和数据生命周期模型,最适合该项目的范围,并在研究活动,数据流程和元数据活动中提供一些更高级别的映射。这项工作为该项目的下一步提供了一个坚实的框架,以更好地了解元数据的实际价值和输出。

元数据迁移分析与协调的策略和工具[纸张(短)]
安妮·华盛顿、安妮·吴、桑蒂·汤普森、托德·克罗克肯、勒罗伊·瓦列霍、肖恩·沃特金斯和安德鲁·韦德纳

休斯顿大学(UH)图书馆,与众多机构的伙伴关系和磋商,被授予博物馆和图书馆服务(IMLS)国家领导/项目授予,以支持Bridge2hyku(B2H)工具包的创建。研究表明,机构倾向于从专有数字系统切换到开源数字解决方案。然而,由于缺乏工具,教程和文档,从专有系统到开源存储库的内容迁移仍然是许多机构的障碍。B2H工具包包括迁移策略和用例以及从ContentDM到Hyku转换的工具,充当了一个全面的资源,以指导迁移规划,元数据分析和协调中的迁移从业者,并促进存储库迁移过程。本文重点介绍了Toolkit的元数据指南和迁移工具如何帮助迁移计划,元数据分析,元数据应用程序配置文件开发,元数据谐波和数字对象的批量摄取到Hyku。

使用元数据记录图理解数字图书馆元数据(纸(完整的))
Mark Phillips,Oksana Zavalina和Hannah Tarver

文化遗产机构的数字馆藏正在越来越多地将实物数字化,收集原生数字物品,并将这些资源放到网上。元数据在这些集合的发现和管理中扮演着至关重要的角色,这使得确定元数据改进的领域变得非常重要。许多框架和相关的指标支持元数据评估。这些指标中的大多数利用了以记录为中心的信息,例如元数据元素的计数和集合中数据值的出现情况。很少有人研究使用传统的网络分析来理解由共享值(如主题或创建者)创建的元数据记录之间的联系。本文所报告的研究目标是调查网络分析的潜在用途,并确定哪些指标在有效评估元数据方面最有希望。我们将介绍元数据记录图,并分析如何使用它来更好地理解不同规模的元数据集合。

会话:特定上下文中的元数据
Japan Search RDF Schema:描述来自异构数据源的项的双层方法[纸张(短)]
Daichi Machiya,Tomoko Okuda和Masahide Kanzaki

日本国家国会图书馆(NDL)在Xenon Limited Partners的支持下,设计了一种基于RDF模型的新的元数据模式,同时开发了一个用于元数据聚合和共享的全国性平台“日本搜索”。Japan Search从全国各地的图书馆、博物馆、档案馆和研究机构收集元数据,并提供集成的搜索服务和api (SPARQL端点和REST-API)。本文的目的是介绍这个新模式,重点介绍它的双层数据模型以及源数据中提供的时间(When)、空间(Where)和代理(Who)信息的规范化。

捕捉人类学领域的研究成果:元数据设计和经验教训[纸张(短)]
Sittisak Rungcharoensuksri和Wachiraporn Klungthanaboon

为了倡导开放科学和知识发展,诗琳通公主人类学中心(SAC)认识到将该中心资助的研究成果用于公共用途的重要性。SAC的研究数据库(http://www.sac.or.th/databases/sac-research/index.php)于2019年3月开发并启动,以提供在创造性公共许可(CC-BY-NC-ND 3.0)下免费访问数字全文研究成果。这个数据库是为数据库管理员、sac的工作人员和一般公众设计的,考虑到可用性。因此,在选择元数据方案时要考虑可用性和互操作性。为SAC的研究数据库选择了Dublin Core™元数据元素集,并对其进行了一些改进。本文介绍了发展科研数据库的经验教训。最后,本文可能会对人类学领域中人类学研究者对公众用户的元数据使用的应用有所启发。

讲座:信息科学教学(1)
教学信息科学[特别会议]
Kai Eckert,Magnus Pfeffer和Marcia Zeng

在这个特别会议中,我们将从教师的角度讨论信息科学的技术和(元)数据方面。这一主题将在不同层面进行讨论:

大局:

世界各地的信息科学项目都在适应新的挑战以及社会和技术的发展。在许多学校中,数据科学、计算机科学或信息设计是信息科学的补充。如果这些是独立的项目,它们如何与信息科学项目相互作用?否则,这些领域有多少可以/需要纳入信息科学项目?为了给这些新话题腾出空间,哪些内容可以省略?

计算机科学/数据科学/编程:

许多课程现在提供至少一个编程介绍,作为可选课程,而是在计划结束时或第一学期的课程。这些课程如何教授?来自当前和未来的预期是学生的?这些课程的目标是什么,结果是什么?提供了什么理论背景(例如,算法,数学)?使用什么教学材料?

教学元数据:

广泛的元数据纪律的现状是什么。从数据建模到实施,从元数据方案创建到编目标准和最佳实践:技术进步如何影响元数据的讲座?会议不一定会解决所有这些主题深入,也可以将焦点转移到教学的其他方面。这一切都取决于参与者,这是首先关于交流经验和未来发展的潜在合作。

演讲者:

  • Sam Oh,Sungkyunkwan大学
  • Kai Eckert,Stuttgart Media University
  • 武汉大学丹武
  • Marcia Zeng,肯特州立大学
  • Magnus Pfeffer,斯图加特媒体大学
  • 四川大学魏粉
  • 黄汝华,武汉大学
  • 汤姆贝克,DCMI

会话:元数据应用程序配置文件:当前计划
应用程序概要:当前计划的讨论(面板)
托马斯·贝克和凯伦·科伊尔

应用程序概要:当前计划的讨论

这将是一个高度互动的观众和小组讨论,以开发人员和应用程序配置文件用户之间出现的一些关键问题为基础。与会者也应该提出他们必须讨论的问题。没有先决条件,一切都是受欢迎的。

背景:

Dublin Core™Metadata Initive长期以来,在共享全局词汇表或命名空间,选择性地使用和约束在应用程序配置文件中,选择性地使用和约束,促进了语义互操作性的概念。DCMI应用程序配置文件在2019年4月召开的兴趣小组旨在为简单的应用程序配置文件创建核心模型,以便在工具和工作流中使用,以帮助作者应用程序配置文件最常见的直接用例。

尽管目前还没有创建和共享应用程序概要文件的标准,但在这一领域已经有许多活动正在进行,许多概要文件已经在使用中。本节将着重讨论创建和实现应用程序概要文件的活动项目,特别是需要进一步开发的领域,以增加应用程序概要文件在开放网络上的效用。我们将邀请在书目数据领域积极工作的参与者(筑波大学BIBFRAME),以及来自其他社区的概况,如开放政府数据(DCAT)。讨论将以几个关键问题开始,我们将要求演讲者在对小组的介绍性发言中提出这些问题。小组成员将接受观众的提问和评论。

向小组成员提出的问题包括:

-简要描述在你的社区中什么是“应用配置文件”。-如果有的话,您的计划有什么工具来帮助人们创建和发布应用程序概要文件?-您认为创建应用程序概要文件的最大障碍是什么?

会话:链接[元]数据
重塑归档元数据描述链接档案(纸(完整的))
Brian Dobreski,Jaihyun Park,Alicia Leabers和Jian Qin

虽然档案资源可能因其独特性而受到重视,但它们并非相互孤立地存在,而且可以从能够将它们暴露给更广泛的资源网络和潜在用户的关联数据处理中获益。为了利用这些好处,必须将描述物理材料及其数字化代理的现有项目级元数据重构为链接数据。存在许多解决方案,但该领域的许多当前模型都很复杂,可能无法捕获更大、异构的媒体材料集合的所有相关方面。本文介绍了链接档案模型的开发,该模型是一种链接数据方法,用于将项目级元数据用于媒体材料的档案收集,包括照片、录音和录像。通过检查现有的集合和项元数据,并与已建立的领域本体和词汇表进行比较,开发和完善了该模型,该模型采用模块化方法将归档数据重构为链接数据。目前的努力集中在一个简化的、以用户发现为重点的模块上,旨在改善对这些材料的访问,并将它们的元数据合并到更广泛的数据网络中。本项目致力于探索档案和特殊收藏范围的表示,以及如何通过关联数据模型处理这些材料。

日本教科书的案例研究链接开放数据:从特殊图书馆发布小书目收集[纸张(短)]
江古优香和高雄

日本教科书链接开放数据(LOD)是由国家教育政策研究所教育图书馆多年来组织的书目和教育信息的LOD数据集。该数据集包括1992年至2017年审定的7548册日本教科书的书目信息,截至2019年4月,提供了219018个RDF (Resource Description Framework)的三倍。本文以日本教科书LOD的开发与出版为例进行了研究。

评估BIBFRAME 2.0:元数据生成器中的探索性实现[纸张(短)]
Brinna Michael和明子Han

随着文化遗产界对链接数据的兴趣不断增长,有必要审慎评估现有的转换和创建链接数据“记录”的工具,并探索使用现有框架创建和编码数据的新途径。本文讨论了BIBFRAME 2.0模型和当前的国会图书馆从MARC21的转换规范,通过设计和实现一个适应的、最低层次的转换框架到编目web应用元数据制造者的过程。在评估过程中,我们确定并解决了美国国会图书馆转换规范导致的三个关键结构性问题:重复数据、空节点的普遍存在以及文本数据值超过uri的普遍存在。此外,我们还解决了BIBFRAME 2.0模型当前如何将Work和链接数据概念化为静态“记录”的问题。

会话:支持数字人文的元数据
元数据在支持数字人文中的作用(面板)
Marcia Zeng, Shigeo Sugimoto, Koraljka Golub, shu - jun Chen, Lala Hajibayova and Wayne de Fremery
元数据在支持数字人文中的作用

数字人文(DH)被广泛被认为是主流学术领域。报告的数字人文学科(DH)研究活动包括开发元数据和技术标准,以模型,代表人文证件(文本,视觉艺术,架构,雕塑等),并使用此类标准开发数字学术版本和人文文件模型.在本次会议中,小组成员将展示元数据在跨文化,域,资源类型,历史时期和数字应用程序的实际情况中支持数字人文学科的作用。它还将推测MetAdata可能播放的角色。

玛西娅曾介绍Shigeo杉本学文化建模——从数字档案和元数据的角度苏菲Shu-Jiun陈数字奖学金的联系数据 - 中国科学院中文稀有书籍的案例Koraljka Golub人文学科期刊文章的主题元数据:本地存储库和外部书目数据库之间的索引一致性Lala Hajibayova.解构用户生成的词汇表:可靠、不可靠还是?Wayne de Fremery,数据作为元数据-元数据作为数据。元数据在支持数字人文中的作用

环节:与维基塔合作
Wikidata的文化遗产数字资源链接数据:基于Europeana数据模型的评估(纸(完整的))
努诺·弗莱雷和安东尼·艾萨克

Wikidata是具有许多潜在应用程序的数据源,其在RDF中公开地提供其数据。我们的研究旨在评估Wikidata作为用于在欧洲人的背景下获取文化遗产数字对象的富裕描述的联系数据源的可用性,来自文化领域的数据聚集体。我们希望尽可能自动化此类数据采集。具体而言,我们的目标是使用为(语义)数据Web开发的标准方法和操作来爬网和转换Wikidata,即使用链接数据消耗和RDF(S)/ OWL本体表达和推理等技术。我们还寻求重新使用已开发的“语义”规范,例如往返于架构和斯科斯的通用数据模型的转换。我们开发了一个实验和附带的纽约软件,以测试这种方法的可行性。我们得出结论,Wikidata的链接数据能够表达文化遗产的有趣语义水平,但仍然可以改善质量,人类运营商仍然必须帮助联系数据应用来解释Wikidata的RDF。

主题发现的链接开放数据:评估国会图书馆词汇表和维基百科之间的一致性(纸(完整的))
尤娜·斯奈德,丽莎·洛伦佐和卢卡斯·麦

链接的开放数据(LOD)已长期被推迟为通过在相关项目和概念之间使用强大的链接增强图书馆资源的手段。最近,图书馆已经开始尝试使用LOD来源,例如Wikidata和DBPedia,以利用用户贡献的资源,并增强图书馆发现系统中显示的信息。密歇根州立大学图书馆(MSUL)数字存储库团队已开始在一个项目中显示来自“知识卡”(信息弹出窗口)的Wikidata和DBPedia的上下文信息,其中包括为用户提供有关项目的更多信息在数字存储库中。本文将简要描述该项目并概述质量分析倡议,意味着评估国会主题图书馆(LCSH)和Wikidata之间的联系以及该分析的结果。它还将解决在不同受控词汇表之间的映射方面遇到的许多挑战。最后,它将结束,可以提高知识卡和支持它们的LOD的准确性。

使用Wikidata作为视频游戏的工作权限[纸张(短)]
Kazufumi Fukuda.

电子游戏拥有短暂但丰富的历史。因此,它们作为文化遗产和研究材料受到了广泛的欢迎。一些研究分析了电子游戏的元数据和分类。然而,对其实施的研究还很有限。因此,在本研究中,我们调查立命馆大学游戏研究中心(RCGS)的电子游戏编目实践,并检验来自Wikidata的数据利用的有效性,以构建电子游戏作品的权威性。我们通过将分发包与Wikipedia和Wikidata关联来实现这一点。因此,大约一半的电子游戏都有了作品记录。然而,基于维基百科的文化和策略,这些数据存在粒度和完整性的一致性问题。因此,由于维基百科的书目粒度不统一,数据丰富是困难的。相比之下,创建数据的成本是有效的。 Furthermore, the external link ID is highly effective in enhancing the value of catalog as Linked Open Data (LOD). It is also evident that using published authority data is useful for data integration but Wikidata has some problems with its features. There is a need to consider the function and purpose of the catalog as linked data instead of a separate catalog. Thus, the adaptation of Wikidata for catalogs needs to be designed accordingly as linked data.

使用Wikidata为茎中的女性提供可见性[纸张(短)]
梅丽莉·莱姆斯-罗哈斯和李柳英

Wikidata是一个开放的知识库,存储结构化的链接数据。自2012年10月29日起,维基百科已经包含了超过5600万条目(“维基百科:统计数据”,n.d),但它的数据显示了明显而普遍的性别差异。为了促进增长和加强妇女在Wikidata条目,印第安纳州立大学普渡大学印第安纳波利斯(IUPUI)大学图书馆和渥太华大学图书馆合作开始试点项目,扩大表示,提高妇女的能见度STEM(科学、技术、工程和数学)。在本文中,我们分享了这两个机构用于收集教师数据、使用外部工具批量获取数据以及将归档数据映射到现有Wikidata属性的方法。我们还讨论了我们在试点项目中面临的挑战。

会议:元数据分析与评估(2)
作为意义生成的语义元数据:检查#标签和集合级元数据[纸张(短)]
Hollie White,Leisa Gibbons和Eileen Horansky

内存机构和有兴趣保护社交媒体数据的组织正在使用各种收集级元数据来代表这些材料。本文的目的是在元数据社区内开始对话,关于元数据专业人员如何以更好的方式描述社交媒体集合,以确保Hashtags的语义复杂性在收集水平上保持完整。本文探讨了Hasthtags如何在收集级别在集合级别中描述其表达式的语义元数据。使用两个数据集进行研究。使用专题分析检查并分类专业文献定义的主题标签上的第一个数据集。第二个数据集收集了从现在的Twitter数据集的文件选择中收集的元数据,并使用Gi​​lliland(2016)五个类别的元数据分类。调查结果和讨论涉及使用收集级元数据来描述社交媒体内容和元数据代理,作为弱化语义含义。

中国政务公开数据门户提供来源元数据要素研究[纸张(短)]
李春秋,周玉寒,黄昆

公开政府运动有助于政府数据的透明度和分享。开放政府数据的出处(OGD)描述了与OGD的生命周期上的谁,如何,Where,何种信息相关的源信息。OGD的出处应跟踪OGD的高质量和可靠性。目前,OGD Portals通过一般元数据元素提供出差,例如创建者,提供商,创建日期,发布日期,发布时间。在中国,本地OGD门户网站定义了自己的元数据配置文件。然而,不同OGD门户网站中的这些元数据元素变化,并且在中国的OGD没有明确且定义明确的物质描述方案。因此,本文旨在调查42中国OGD门户网站的出差元数据的现状,并根据调查结果进行统一。本研究有意义,促进了中国OGD门户网站的出处信息。

元数据对数据市场的重要作用[纸张(短)]
塞巴斯蒂安·劳伦兹,普里扬卡·夏尔马和安德烈亚斯·劳施

随着社会向数据驱动的转变,数据交易具有了全新的意义。在未来,数据市场将相当于其他电子商务平台,如亚马逊或eBay。就像任何其他在线市场一样,数据市场是一个能够方便地买卖产品的平台——在这里是“数据”。

元数据是关于数据的数据。元数据在数据交易中扮演着重要的角色,因为它是数据市场中所有相关方的方向。想要在市场上出售其数据的卖家需要元数据来描述销售报价,买家可以使用它来搜索和识别相关数据。

本文概述了元数据在数据市场上的数据交易中的重要性,并对元数据的级别进行了分类。此外,在数据交易中,元数据在决定数据质量方面也有重要作用。本文还讨论了元数据在数据质量方面的作用。

会话:元数据应用程序概要:开发和实现
又一个元数据应用程序简介(yama):应用程序配置文件的创作,版本控制和发布(纸(完整的))
Nishad thalhas, Mitsuharu Nagamori, Tetsuo Sakaguchi和Shigeo Sugimoto

元数据应用程序概要文件是任何元数据实例的基本蓝图。新加坡都柏林核心应用程序概要文件框架(Singapore Framework for Dublin Core™Application Profiles)定义了设计元数据应用程序概要文件的框架,以确保互操作性和可重用性。然而,公共可访问的数量,特别是机器可操作的应用程序概要文件的数量明显更低。考虑到技术方面、成本和不成比例的激励因素,领域专家发现很难创建应用程序概要。缺乏易于使用的元数据应用程序概要文件创建工具也是缺乏更广泛覆盖面的一个原因。本文提出了另一个元数据应用程序概要文件(Yet Another Metadata Application Profile, YAMA)作为一个友好的互操作预处理器,用于创建、维护和发布元数据应用程序概要文件。YAMA帮助产生各种格式和标准来表达元数据应用程序概要文件、变更日志和不同版本,期望为领域专家简化元数据应用程序概要文件的创建过程。YAMA包含一个集成的语法,用于记录应用程序配置文件以及不同版本之间的变化。一个概念验证工具包,演示了YAMA的能力也正在开发中。YAMA拥有人类可读但机器可操作的语法和格式,可无缝地适应现代版本控制工作流,并可扩展为任何特定需求。

新加坡的生命时刻:元数据应用(纸(完整的))
Kathy Choi和Haliza Jailani

作为新加坡智慧国家计划的一部分,生命时刻(MOL)作为一个政府移动应用程序被创建,通过技术更好地服务公民的需求。新加坡国家图书馆委员会(NLB)的智能国家和数字政府办公室(Smart Nation and Digital Government Office)的一个战略项目受邀为该应用开发元数据框架。从父母到积极老龄化和生命末期需求,该应用巩固了政府服务,为公民生活中的重要里程碑。基于Dublin Core™(DC)的电子政务元数据标准和举措早在2000年就开始了。欧洲标准化委员会CEN/ISSS提供了一种开发电子政府元数据元素集的方法。本文首先回顾了DC电子政务元数据的标准和举措,以及元数据在数字政府中的最新应用。随后,它介绍了NLB如何应用它的方法来开发一个应用程序概要文件和一个多方面的分类。作为一个拥有4种官方语言的多元文化社会,公共词汇对于公民跨机构共享、重用和搜索数据非常重要。这不仅将帮助公民更有效地搜索信息,而且它将为互联网发现的结构化数据实现准备MOL内容。使用Dublin Core™作为支持MOL的元数据模式,可以有效地实现移动应用程序的特性,如分析和过滤、全局搜索和分面导航。

车间和教程
网络知识组织系统(NKOS)(车间(天))
Joseph Busch和Marcia曾

该研讨会的计划将包括:

主题演讲

  • 秦健。AI和本体系统之间知识表示的范式相似之处

提交并审核报告

  • Joseph Busch。为Robert Wood Johnson基金会开发健康政策领域模型。
  • Marcia Zeng和Julaine clenis。相关开放数据(LOD)KOS产品的功能度量。
  • 安德烈亚斯科勒。如何利用SKOS、本体、语料库分析和关联数据从文本中提取隐藏信息和“about”。
  • 索尼娅·帕斯夸,简·格林伯格,彼得·洛根,琼·布恩。1910年国会科目库的斯科斯,主题标题为19世纪百科全书不列颠遗传群岛的控制词汇转型。
  • Minjuan Liu和Yao Lu。《农业同义词词典》的比较研究。

提交和审查简短的陈述

  • Vânia Mara Alves Lima、Cibele de Araújo Camargo Marques dos Santos和Artur Simões Rozestraten。Arquigrafia项目。
  • Ziyoung Park,Claudio Gnoli和Daniele P. Morelli。综合层次分类第二版:KOS的进化。
  • 朴子荣、李胡信、金承村、朴成宰、郑大顺、孙承熙、金允焕。在语义网络环境中改进传统韩国表演艺术的档案记录。
  • 李惠元、尹素英、朴子英。一种数字策择模型,专注于语义富集。

看看2019年NKOS车间页面为更多的细节。

Jupyter笔记本介绍(教程(天))
Kai Eckert和Magnus pfeffer

Jupyter Notebook是一个开源的网络应用程序,用于创建和共享“实时文档”,除了文本或图像等传统文档元素外,还可以包含代码和执行结果。最初是作为IPython项目的一部分开发的,现在它独立于Python并支持一长串不同的编程语言,包括JavaScript、Ruby、R和Perl。

这些实时文档非常适合创建教学材料和交互式手册,允许读者在相同的环境中更改程序代码并查看结果:程序输出可以显示,可视化图形或数据表可以实时更新。为了支持传统的用例,静态非交互版本可以导出为PDF、HTML或LaTeX格式。

对于数据实践者来说,Jupyter笔记本是执行数据分析或转换的理想选择,例如,生成Linked Open data,其中工作流文档是实现的一部分。可以添加或更改单行代码,然后执行,而不丢失之前部分代码的结果。可视化可以在代码中生成,并直接嵌入到文档中。这使得原型制作和实验非常高效,实际上也非常有趣。

最后,Jupyter笔记本是一个理想的初学者平台,因为它们可以按行执行代码行,并立即查看变化如何影响结果。

此研讨会不需要先验知识的Jupyter笔记本或Python编程语言;只需要基本的编程和HTML / MARKDOWN知识。

议程:

  • 第一部分:简介
    • 本地安装必要的编程环境
    • 使用现有文档
    • 创建具有丰富内容的文档
    • 笔记本电脑扩展
  • 第二部分:案例研究
    • 在数据集成基础教学中使用jupiter Notebook
    • 使用Jupyter Notebook开发,测试和记录与生成RDF的数据管理工作流
  • 第三部分:高级主题
    • 服务器安装和使用
    • 版本控制
    • 使用不同的语言内核

Kai Eckert教授

Kai Eckert是Stuttgart Media University和Apply Apply Apply Intelligence研究所的Co-Director的基于网络信息服务教授。他的研究涉及在包括文化遗产,开放科学和智能城市的领域中的自然语言处理和人工智能的应用。最近的项目包括Confref.org,与Springerrenauly合作,以创建科学会议的公开数据集;犹太人,犹太研究的知识图;和CAIUS,与曼海姆大学合作,调查人工智能对城市社会的后果。凯教授斯图加特媒体大学的信息科学计划,在那里他开发了新课程来介绍技术概念。

马格努斯菲教授

MAGNUS PFEFFER是斯图加特媒体大学的信息管理教授,以及信息科学计划的学习院长(计划经理)。他的研究专注于元数据管理,本体和自动分类。他最新的研究项目“日本视觉媒体图”是媒体研究领域,日本研究和信息科学领域的国际合作,使用爱好者社区累计的数据创建一个综合日本视觉媒体数据库。

Wikidata作为链接数据云的集线器(教程(天))
Tom Baker,Andra Waagmeester和Joachim Neubert

本教程将帮助人们使用Wikidata作为“链接中心”——利用链接数据存储库和链接数据云之外的数据集的链接来探索数据集的起点。1.使用和查询维基百科(90m)。介绍Wikidata及其数据模型。Wikibase的表示,这是wikiata本身和独立维护的数据库的基础设施平台。演示将数据加载到Wikidata并使其保持最新的方法。2.Wikidata作为链接数据云的枢纽(9000万)。Wikidata数据模型与Linked data模型的比较。标识符的使用,用于将外部资源链接到外部资源,以及它们与链接数据uri的连接。 Current state of Wikidata as a linking hub. Demonstration of integrated access to Wikidata and other datasets using federated SPARQL queries. 3. Wikidata tools and hands-on exercises - Part 1 (90m). Demonstration of how the coherence of data and precision of search can be improved by creating a semantic data model linked to commonly used vocabularies such as Dublin Core™. Presentation of applications that use Wikidata as a back-end source of data and provide interfaces for formulating queries and contributing content. Participants will split into groups of two or three people each to work on exercises. 4. Wikidata tools and hands-on exercises - Part 2 (90m). Presentation of tools for creating links to datasets outside of Wikidata. Groups will work independently on exercises with help from the tutorial presenters.

海报(同行评审)
模拟/数字LP集合:图书馆发现和数字集合平台之间的链接元数据(海报(同行评审))
马克·斯托克尔和英格丽·赖希(呈现:Marc Stoeckle)
海报(“工作进展”)
日本视觉媒体图:为研究人员提供来自爱好者社区的数据[海报(正在进行的工作)]
马格努斯·菲佛和马丁·罗斯(提出:MAGNUS PFEFFER)
深度文本分析与知识图和机器学习[海报(正在进行的工作)]
Andreas Blumauer.(提出:Andreas Koller)
文化遗产图像的深刻语义注释[海报(正在进行的工作)]
Xiaoguang Wang,徐潭,宁源歌,戴夫克里克和Xiaoxi Luo(主持人:徐谈)
基于DC元数据的智能政府元数据映射研究[海报(正在进行的工作)]
张云凯,马杰,胡摩,郝志远,谢玉山(呈现:)
分享世界文化纲要和文化材料概述:重组遗留分类系统,韩国研究历史,为语义网络[海报(正在进行的工作)]
道格拉斯黑(主持人:道格拉斯·布莱克)
探索与图形小说相关的用户生成评论:丰富还是贫乏元数据?[海报(正在进行的工作)]
Lala Hajibayova.(主持人:Lala Hajibayova)
日本区域文化遗产信息的汇总[海报(正在进行的工作)]
Taiki三岛(提出:Taiki Mishima)
会晤
DCMI管理委员会(非公开会议)(会议)
这是DCMI管理委员会的非公开会议。
开放社区会议(会议)
这是一个公开会议 - 向会议的任何参与者开放 - 为DCMI提供建议的机会,就其活动(包括但不限于会议)。会议是免费的,没有设定议程。带上你的想法!