标题: | 实施标准:公共卫生和食品安全中的病原体基因组学背景数据(“元数据”)标准 |
由: | Marie-Claude象牙海岸 |
日期: | 2021-10-07 14:00 |
全基因组测序(WGS)是追踪和了解影响环境、动物和人类健康的病原体传播的有力工具。背景数据("元数据")包括实验室(如检测日期和地点、周期阈值(CT)值)、临床(如住院、结果)、流行病学(如年龄、性别、暴露)和方法(抽样、测序、生物信息学(生物信息学),用于解释序列数据并为公共卫生和食品安全计划产生可操作的结果。上下文数据通常是根据当地需求和报告需求在特定项目的基础上收集的,这导致在不同的粒度级别收集不同的数据类型,具有不同的含义和隐含的变量和属性偏差。此外,信息通常以自由文本的形式收集,或者根据组织或计划特定的数据字典,使用不同的字段、术语、格式、缩写和行话进行结构化收集。私有数据库中信息编码方式的可变性往往会传播到公共存储库,这使得信息更难解释和使用。我们的工作重点是开发和实施上下文数据标准,以提高不同加拿大和国际倡议的数据协调和整合。我们的工作实例包括开发两个本体论——食品本体论(FoodOn)和基因组流行病学本体论(GenEpiO)——作为IRIDA项目(加拿大公共卫生综合快速传染病分析生物信息学平台)的一部分,这是食源性细菌基因组特征的ISO标准,以及SARS-CoV-2大流行基因组监测的国际标准。
有关Griffiths博士在元数据方面的工作的更多信息,请参见Genome Canada的《利用背景数据抗击COVID-19——与Emma Griffiths博士的问答》。