元数据设计、实施和最佳实践方面的创新

最佳实践演示:基于ETL工具的高效RDF模式映射和三元组生成

标题: 基于ETL工具的高效RDF模式映射和三元组生成
日期: 2020-09-15 07:00
资源:

Guojian西安
Guojian西安
中国农业科学院农业信息研究所国家农业图书馆
中国农业科学院农业信息研究所国家农业图书馆营业部主任、教授。主要从事农业信息资源数字化处理、多源异构大数据融合、数据开放与共享、同义词词典、本体、权威文件、关联数据、知识图谱等方面的研究与实践。主持并参与国家科技支撑计划“外语科技文献信息知识组织系统建设与示范应用”、科技部“农业科技数据共享中心”项目、国家自然科学基金项目“农业本体构建与翻译研究”、中国工程院知识中心建设项目、欧盟第七框架项目、联合国粮农组织国际合作项目等。获科技成果奖4项,获得计算机软件著作权登记10余项,发表论文50余篇,出版著作4部。

李娇
李娇
中国农业科学院农业信息研究所国家农业图书馆
信息管理博士,中国农业科学院农业信息研究所知识组织与智能计算课题组成员。主要研究方向为关联数据、知识图和语义分析。

摘要
由于在层次层次上的资源映射和基于图的表示的优点,RDF数据在文档和数据都链接的Web上显示了数据重用和联合的前景。关联数据社区使用了许多工具或框架,本报告将对它们的目标、方法和最显著的特点进行全面调查,以全面了解当前的研究趋势。此外,中国农业科学院农业信息研究所(CAAS AII)为ETL (Extract-Transform-Load)环境下的RDF生成和管理提供了一种新的方法,本演讲将分享基于开源水壶开发的插件,支持多种数据源的RDF模式动态映射和三元组转换,即从关系数据库中的内部或开放数据或包含结构化数据(如Excel、CSV、XML和JSON文件)的文件转换为RDF数据。