文献内容简介
结核病(tb)是由结核分枝杆菌(m. tuberculosis)病原体引起的传染病之一,据报道,全球每年有500多万人死于结核病。随着全球人口的各种流行病和大流行,病原体已发生了不可预测的进化。据报道,大多数感染结核分枝杆菌的人都有咳嗽、胸痛、疲劳、发冷、盗汗、发烧、体重减轻等症状,而且很容易通过咳嗽和打喷嚏的飞沫在人与人之间传播。最近,世卫组织报告称,全世界约有1000万结核感染者。其中60%的感染者对现有结核病药物表现出多重耐药。此外,耐药菌株的发展导致治疗过程中抗生素摄入不足或有限。因此,需要努力开发新的强、效药物来解决新出现的耐药。
噻唑烷是五元环体系中杂环最多的有机基团之一,由硫醚和1、3位的氨基组成,这是第一个进行噻唑环表征的化合物。据文献报道,在2、4和5位这3个不同的位置上进行官能团取代对发展新的药物具有较好的效果。近年来,人们发现并揭示了多种新型噻唑烷衍生物通过抑制结核分枝杆菌泛酸合酶、结核分枝杆菌cysk1的非肽抑制剂和结核分枝杆菌h37rv株发挥抗结核作用。
在本研究中,研究人员采用基于结构的药物设计,评估了一系列噻唑烷衍生物(1a-1q)的有效抑制作用。噻唑烷是一个五元环结构,硫醚和氨基在1位和3位。虽然噻唑烷可以与许多蛋白质靶点结合,但它是药物化学中一个主要的杂环结构。研究人员通过分子对接的打分结果及结合模式对噻唑烷系列化合物进行分析。采用分子动力学模拟方法验证了结核分枝杆菌蛋白prpr与三种新型骨架(1b、1j和1k)之间的相互作用,所有的骨架分别与arg169、arg197、tyr248、arg308和gly311等残基表现出明显的稳定相互作用。最后研究人员通过机器学习算法对噻唑烷骨架的抑制活性进行预测和评价,对上述化合物进行排序。这项研究揭示了1k和1j可以作为治疗结核病的有效抑制剂的潜力。
maxflow重现药物发现流程
1、 数据
文章中,结核分枝杆菌蛋白prpr (pdb id: 6d2s, resolution: 1.82 a)的晶体结构来自结构生物信息学研究合作实验室(rcsb)蛋白数据库(),研究人员设计噻唑烷衍生物(1a-1q)并选择异烟肼作为参考化合物。
图1 研究人员所设计的噻唑烷系列衍生物结构图
为了评估使用maxflow进行该研究的效果,我们采用文章中研究人员所设计的化合物进行操作,首先我们使用maxflow的结构建模模块绘制上述16个化合物(1a-q),并转存成smiles格式以便进行后续虚拟筛选以及性质预测。
2、 admet预测
一般来说,药代动力学和药效学特性可能对衍生化合物的类药性有潜在的影响。在文章中,研究人员使用多种方法对16个噻唑烷衍生物的admet进行预测,分析其成药性。
maxflow可以使用机器学习以及深度学习对admet常见的29种参数进行预测,在这里我们选择了基于gnn的app对上述16个化合物进行admet预测(如图2所示)。
(a)
(b)
(c)
图2 maxflow预测文章中的16个化合物的admet参数(a)maxflow使用gnn预测admet参数的app界面,(b) maxflow预测的16个化合物的admet结果,(c) maxflow预测结果的原子贡献图)
表1 maxflow对文章中16个化合物的部分admet参数以及理化性质预测结果
3、分子对接
研究人员对上述20个化合物与结核分枝杆菌蛋白prpr (pdb id: 6d2s)进行对接,研究蛋白小分子之间的结合亲和力。
maxflow基于autodock vina引擎,将繁琐的开源代码封装成简洁易操作的组件,用户可以通过搭建工作流或者直接使用分子对接的app进行分子对接。对接结果如图3所示,maxflow在对接完成后,会给出用户对接打分结果、rmsd值、结合模式图、分子的理化性质参数以及是否符合ro5规则。
图3 maxflow分子对接app对prpp蛋白与噻唑环系列化合物进行对接后结果
4、分子动力学
文章中,研究人员将蛋白质-配体复合物在298 k温度和1.01 bar压力下进行了20 ns的md模拟。每4秒捕获一次模拟开放轨迹中的构象,然后利用这些轨迹评估氢键和均方根偏差(rmsd)。
maxflow使用gromacs引擎,整合了gromos、opls/aa和amber主流力场,可以对蛋白进行理化性质分析(能量、体积、压强、温度、密度监测)、骨架波动分析(rmsd、rmsf)、结构性质分析(rg、sasa、secondary structure)、热点残基分析(alnine-scanning、energy-decomposition)、结合自由能的分析(fep/ti 、mmpbsa)、相互作用分析(氢键、盐桥、角度、,、二面角、相互作用、水合作用)和构象转变分析(pca、energy-landscape plotting)等。
使用maxflow对化合物进行分子动力学模拟分析的工作流如图4所示,
图4 maxflow进行分子动力学计算及结果分析工作流
5、抗结核活性预测
文章中,研究人员通过机器学习方法预测对包括结核分枝杆菌在内的特定分枝杆菌的生物活性。
maxflow平台致力于使用人工智能技术加快新药研发进程,已部署包括gnn、cnn、dnn的深度学习算法,以及50多种机器学习算法可以通过训练数据集,快速预测化合物相关性质。如图5所示,在这里我们使用mycocsm平台的训练数据集,训练了两个基于gnn与xgboost回归模型的抗结核活性预测app。这两个app可以通过直接导入分子的smiles式,就可以快速得到活性预测值,预测结果如表2所示。
图5 maxflow基于gnn与xgboost回归模型的抗结核活性预测app
表2 使用xgboost回归模型预测的化合物的抗结核活性值
最后得到化合物1b、1j、1k具有潜在的抗结核活性,可以为后续发现治疗结核病的有效抑制剂具有较好的指导作用。
参考文献: rajasekhar s, das s, karuppasamy r, et al. identification of novel inhibitors for prp protein of mycobacterium tuberculosis by structure based drug design, and molecular dynamics simulations[j]. journal of computational chemistry, 2022, 43(9): 619-630.
maxflow分子模拟与人工智能平台
maxflow人工智能与分子模拟平台基于大数据和人工智能,整合计算机模拟技术,助力药物研发机构实现传统的实验驱动、理论驱动向数据驱动、智能模型驱动创新模式的转变,加速创新变革,实现跨越式发展,达到提高药品生产效率和审批率,并降低成本的最终目标。