元数据设计、实施和最佳实践方面的创新

特邀演讲:实施标准:公共卫生和食品安全中的病原体基因组学背景数据(“元数据”)标准

标题: 实施标准:公共卫生和食品安全中的病原体基因组学背景数据(“元数据”)标准
由: Marie-Claude象牙海岸
日期: 2021-10-07 14:00

说:
艾玛·格里菲思
艾玛·格里菲思
加拿大温哥华西蒙弗雷泽大学健康科学学院
Emma Griffiths在加拿大安大略省的麦克马斯特大学获得博士学位,她的研究方向是如何利用分子标记插入和删除来增强传统的方法来理解细菌系统发育。她的博士后工作集中在如何上下文数据标准,如本体,提高数据协调和整合在公共卫生和食品安全基因组学。她是一个加拿大标准委员会成员和从事许多上下文数据(“元数据”)协调项目-加拿大和国际的发展——包括一个ISO标准使用全基因组测序和上下文数据类型和基因组特征的食源性细菌,以及为加拿大的SARS-CoV-2基因组监测计划CanCOGeN制定国际公共卫生数据标准。她目前是加拿大温哥华西蒙弗雷泽大学的助理研究员。

文摘:

全基因组测序(WGS)是追踪和了解影响环境、动物和人类健康的病原体传播的有力工具。背景数据("元数据")包括实验室(如检测日期和地点、周期阈值(CT)值)、临床(如住院、结果)、流行病学(如年龄、性别、暴露)和方法(抽样、测序、生物信息学(生物信息学),用于解释序列数据并为公共卫生和食品安全计划产生可操作的结果。上下文数据通常是根据当地需求和报告需求在特定项目的基础上收集的,这导致在不同的粒度级别收集不同的数据类型,具有不同的含义和隐含的变量和属性偏差。此外,信息通常以自由文本的形式收集,或者根据组织或计划特定的数据字典,使用不同的字段、术语、格式、缩写和行话进行结构化收集。私有数据库中信息编码方式的可变性往往会传播到公共存储库,这使得信息更难解释和使用。我们的工作重点是开发和实施上下文数据标准,以提高不同加拿大和国际倡议的数据协调和整合。我们的工作实例包括开发两个本体论——食品本体论(FoodOn)和基因组流行病学本体论(GenEpiO)——作为IRIDA项目(加拿大公共卫生综合快速传染病分析生物信息学平台)的一部分,这是食源性细菌基因组特征的ISO标准,以及SARS-CoV-2大流行基因组监测的国际标准。

有关Griffiths博士在元数据方面的工作的更多信息,请参见Genome Canada的《利用背景数据抗击COVID-19——与Emma Griffiths博士的问答》。