网络符合基因组学:微生物的DNA搜索引擎

 行业动态     |      2020-08-02 08:50

EMBL的欧洲生物信息学研究所(EMBL-EBI)的研究人员将其细菌遗传学知识和网络搜索算法结合起来,为微生物数据构建了DNA搜索引擎。
在《
自然生物技术》上发PCR仪表的一篇论文中描述的搜索引擎可以使研究人员和公共卫生机构使用基因组测序数据来监测抗生素抗性基因的传播。通过发现大量数据,搜索引擎还可以使研究人员更多地了解细菌和病毒。微生物搜索引擎

搜索引擎称为Bitsliced基因组特征索引(BIGSI),其实现的目的与互联网搜索引擎(例如Google )相似

微生物DNA测序的数量每两年翻一番。到目前为止,还没有实用的方法来搜索这些数据。

这种类型的搜索对于证明了解疾病可能非常有用。以食物中毒的爆发为例,其中的原因是沙门氏菌菌株含有抗药性质粒(一种“搭便车” DNA元件,可将抗药性传播到不同细菌种类中)。BIGSI首次使研究人员能够轻松发现质粒是否以及何时被发现。

Google和其他搜索引擎使用自然语言处理来搜索数十亿个网站。他们能够利用人类语言相对不变的事实。相比之下,微生物DNA显示了数十亿年进化的烙印,因此每个新的微生物基因组都可以包含从未见过的新“语言”。使BIGSI发挥作用的关键是找到一种方法来建立可以应对微生物DNA多样性的搜索索引。

监测传染病

EMBL-EBI研究组负责人Zamin Iqbal解释说:“我们受到传染病和抗生素耐药性管理问题的激励。“我们知道细菌可以通过突变或在质粒的帮助下变得对抗生素具有抗性。我们还知道我们可以将细菌DNA中的突变用作细菌祖先的历史记录。这使我们可以在一定程度上推断出如何细菌可能会在医院病房,一个国家或世界范围内传播,BIGSI帮助我们大规模研究了所有这些问题,这使科学家们首次提出了这样的问题,例如“以前是否曾见过这种爆发菌株?” 或“这种抗药性基因是否已传播到新物种?”。

快速简便的搜索

EMBL-EBI的生物信息学家Phelim Bradley解释说:“该搜索引擎是对其他现有工具的补充,并提供了可以扩展到我们正在生成的大量数据的解决方案。” “这意味着随着数据量的不断增长,搜索将继续有效。实际上,这是我们必须克服的最大挑战之一。我们能够开发出一种搜索引擎,任何拥有互联网的人都可以使用它。连接。”

Iqbal继续说:“随着DNA测序变得越来越便宜,我们将在基础研究之外看到大量新用户,并且所生成的数据量将迅速增加。”

“我们很可能会在诊所或现场使用DNA测序来诊断患者并开出治疗处方,但我们也可能会发现它可用于其他方面,例如检查汉堡中的肉类。在这一点上使基因组数据可搜索是必不可少的,这将使我们能够学习大量有关生物学,进化,疾病传播等方面的知识。”

我们为什么要关心微生物?

微生物是一种生物,体积太小,无法用肉眼看到,因此需要显微镜。“微生物”是一个通用术语,用于描述不同类型的生命形式,包括细菌,病毒,真菌等。

一小部分但很重要的微生物(主要是某些特定类型的细菌和病毒)与传染病有关。当细菌能够“存活”抗生素治疗时,它们对患者就变得极为危险。这在世界范围内越来越多地发生,被称为抗生素耐药性。

通过比较多种细菌物种的DNA,我们可以开始了解它们之间的关系,并研究抗生素耐药性在地理上和物种间传播的动态。例如,DNA分析可以帮助我们预测某种结核病菌株的危险性,以及该菌株可能对哪种药物产生反应。