来自斯科尔特计算和数据密集型科学与工程中心(CDISE)的iMolecule小组的科学家开发出了BiteNet,一种机器学习(ML)算法,可以帮助找到蛋白质中的药物结合位点,即潜在的药物靶点。BiteNet可以在1.5分钟内分析1000种蛋白质结构,并找到药物分子附着的最佳位置。这项研究发表在通讯生物学上。
蛋白质是控制大多数生物过程的分子,通常是药物的共同靶点。为了产生治疗效果,药物应该附着在蛋白质上称为结合位点的特定部位。蛋白质与药物结合的能力取决于位点的氨基酸序列和空间结构。结合位点是药理学中真正的“热点”。已知的结合位点越多,就有越多的机会创造出更有效和更安全的药物。
Skoltech-CDISE助理教授Petr Popov和博士生Igor Kozlovskii通过将深度学习算法和计算机视觉应用于作为三维图像处理的蛋白质结构,开发了一种新的蛋白质结合位点时空检测计算方法。有了这项新技术,人们甚至可以探测到难以捉摸的位点:例如,科学家设法探测到隐藏在实验原子结构中的结合位点,或是由离子通道、G蛋白偶联受体和上皮生长因子(最重要的药物靶点之一)所形成的结合位点。
彼得波波夫,这项研究的负责人和斯科尔特科技大学的助理教授说:“人类基因组由近20000种蛋白质组成,其中很少有蛋白质与药物靶点有关。我们的方法允许在蛋白质中寻找药物化合物的结合位点,从而扩大了可能的药理作用靶点。此外,最初基于结构的药物的发现很大程度上取决于蛋白质原子结构的选择。我们的方法能够分析蛋白质中的大量结构,找到最适合的结构。”
据论文第一作者伊戈尔·科兹洛夫斯基(Igor Kozlovskii)介绍,BiteNet在速度和准确性方面都优于同行:“BiteNet是基于计算机视觉的,我们将蛋白质结构视为图像,并将结合位点作为对象来检测。分析一个空间结构大约需要0.1秒,评估约2000个原子的1000个蛋白质结构需要1.5分钟。”
参考文献:Communications Biology (2020). DOI: 10.1038/s42003-020-01350-0。