单颗粒冷冻电子显微镜技术的革命性发展,使得结构生物学家可以更高效地解析大量复杂生物大分子机器的高分辨率结构。从冷冻电镜产生的电子云密度图数据搭建原子结构模型是冷冻电镜结构的最后一步,目前主要依赖经验丰富的结构生物学家采用手工加软件辅助的方式完成。这是一个高难度的工作,要求模型的搭建者对蛋白质结构特征、侧链构象有很高的认知水平,掌握这些知识和规律需要花费大量时间学习和实践。尤其是局部分辨率较低的区域,手工搭建可能需要花费大量时间进行推敲,甚至需要补充实验以获得更高分辨率的密度图来解决。从电子云密度图快速、准确、自动化地搭建原子模型是解放冷冻电镜生产力的一个关键步骤。

CryoNet是一个结合三维计算机视觉和自然语言处理,基于注意力模型的从冷冻电子密度图中进行氨基酸识别,并搭建原子模型的人工智能算法(图1)。CryoNet用大量已解析的原子结构模型和匹配的电子云密度图中进行训练:通过三维残差神经网络学习氨基酸内部原子结构及蛋白质二级结构的电子云密度特征;通过注意力模型学习氨基酸序列与电子云密度特征的对应关系,实现了从冷冻电子云密度图中进行原子模型准确识别;通过在算法中加入带键长和键角约束的前向运动学模型,实现了侧链构象的正确生成。另外,CryoNet还可以迭代地进行结构片段补全和微调,进一步提升了原子模型的准确度。CryoNet预测结果示例见图2。

CryoNet网址:
https://cryonet.ai

 

0 Comments

Leave a reply

Your email address will not be published.

*

Log in with your credentials

Forgot your details?