研究人员构建了一种酶发现人工智能

来源:
导读 虽然大肠杆菌是研究最多的生物体之一,但构成大肠杆菌的 30% 的蛋白质的功能尚未明确揭示。为此,利用人工智能从未知的蛋白质中发现了464

虽然大肠杆菌是研究最多的生物体之一,但构成大肠杆菌的 30% 的蛋白质的功能尚未明确揭示。为此,利用人工智能从未知的蛋白质中发现了464种酶,研究人员继续验证了通过体外酶测定成功鉴定的三类蛋白质的预测。

联合研究团队成员包括韩国科学技术院化学与生物分子工程系的 Gi Bae Kim、Ji Yeon Kim、Jong An Lee 博士和杰出教授 Sang Yup Lee,以及韩国科学技术院的 Charles J. Norsigian 博士和 Bernhard O. Palsson 教授加州大学圣地亚哥分校生物工程系开发了 DeepECtransformer,这是一种人工智能,可以根据蛋白质序列预测酶的功能。此外,团队还建立了预测系统,利用人工智能快速准确地识别酶的功能。

该团队的工作在题为“使用带有变压器层的深度学习对酶编码基因进行功能注释”的论文中进行了描述。 该论文于11月14日发表在《自然通讯》上。

酶是催化生物反应的蛋白质,识别每种酶的功能对于了解生物体中存在的各种化学反应以及这些生物体的代谢特征至关重要。

酶委员会(EC)编号是国际生物化学与分子生物学联合会设计的酶功能分类系统,为了了解各种生物体的代谢特征,需要开发一种能够快速分析酶和EC编号的技术基因组中存在的酶。

人们已经开发出各种基于深度学习的方法来分析生物序列的特征,包括蛋白质功能预测,但大多数方法都存在黑箱问题,无法解释人工智能的推理过程。

各种利用人工智能进行酶功能预测的预测系统也已被报道,但它们并没有解决这个黑箱问题,或者无法在细粒度水平上解释推理过程(例如,酶序列中氨基酸残基的水平) )。

DeepECtransformer的人工神经网络的结构。图片来源:韩国科学技术院 (KAIST)

联合团队开发了 DeepECtransformer,这是一种利用深度学习和蛋白质同源性分析模块来预测给定蛋白质序列的酶功能的人工智能。

为了更好地理解蛋白质序列的特征,额外使用自然语言处理中常用的变压器架构来提取整个蛋白质序列背景下有关酶功能的重要特征,这使得团队能够准确预测EC酶的数量。开发的DeepECtransformer总共可以预测5360个EC数。

联合团队进一步分析Transformer架构,以了解DeepECtransformer的推理过程,发现在推理过程中,AI利用了对酶功能重要的催化活性位点和/或辅因子结合位点的信息。通过分析DeepECtransformer的黑匣子,证实AI在学习过程中能够自行 识别对酶功能重要的特征。

“通过利用我们开发的预测系统,我们能够预测尚未识别的酶的功能,并通过实验验证它们,”该论文的第一作者 Gi Bae Kim 说。

“通过使用 DeepECtransformer 识别生物体中以前未知的酶,我们将能够更准确地分析生物体代谢过程中涉及的各个方面,例如生物合成各种有用化合物所需的酶或生物降解塑料所需的酶,”他加了。

“DeepECtransformer 可以快速准确地预测酶的功能,是功能基因组学中的一项关键技术,使我们能够在系统水平上分析整个酶的功能,”Sang Yup Lee 教授说。

他补充说:“我们将能够利用它来开发基于全面的基因组规模代谢模型的生态友好型微生物工厂,从而有可能最大限度地减少代谢信息的缺失。”

标签:

免责声明:本文由用户上传,如有侵权请联系删除!