利用人工智能,加州大学的研究人员解决了一个问题,这个问题一直是重要蛋白质研究的绊脚石。
研究人员利用显微镜和smFRET技术收集了大量的数据集,分析这些数据集一直是一项既费时又富有挑战性的任务,因为他们使用显微镜和smFRET技术来观察蛋白质是如何运动和与周围环境相互作用的。
同时,这项任务需要高水平的专业知识。因此,服务器和硬盘驱动器的数量激增。
现在,化学系、纳米科学中心、诺和诺德基金会蛋白质研究中心和哥本哈根大学尼尔斯玻尔研究所的研究人员已经开发出一种机器学习算法来完成这项繁重的工作。
“我们以前总是对数据进行分类,直到出现问题。现在我们的数据一按按钮就可以分析了。而且,这个算法至少和我们做得一样好或者更好。这为我们腾出了资源来收集比以往任何时候都多的数据,并获得更快的结果,”Simon Bo Jensen解释说,他是化学系和纳米科学中心的生物物理学家和博士生。
该算法已经学会了识别蛋白质的运动模式,使其能够在几秒钟内对数据集进行分类——这一过程通常需要专家几天才能完成。
“我们以前是手工检查的,一次检查一个。这样做,我们就成了我们自己研究的瓶颈。即使对专家来说,进行一致的工作并一次又一次地得出相同的结论也是困难的。毕竟,我们是疲劳的人,容易犯错,”西蒙·博詹森说。
而算法只需要一秒钟的时间
UCPH研究人员对蛋白质运动与功能之间关系的研究是国际公认的,对于理解人体如何运作至关重要。例如,包括癌症、阿尔茨海默氏症和帕金森氏症在内的疾病都是由蛋白质聚集或改变其行为引起的。
今年获得诺贝尔化学奖的基因编辑技术CRISPR还依赖于蛋白质切割和拼接特定DNA序列的能力。
“在我们能够治疗严重疾病或充分利用CRISPR之前,我们需要了解蛋白质这个最小的组成部分是如何工作的。这就是蛋白质运动和动力学发挥作用的地方。诺和诺德基金会蛋白质研究中心的教授Guillermo Montoya说:“这就是我们的工具能提供巨大帮助的地方。
来自世界各地的关注
似乎全世界的蛋白质研究人员都缺少这样一种工具。一些国际研究小组已经展示了自己,并对使用该算法表示出兴趣。
“这个人工智能工具对于整个领域来说是一个巨大的奖励,因为它提供了一个共同的标准,在世界各地的研究人员需要比较数据的时候,这些标准以前是不存在的。以前,大部分分析都是基于对哪些模式有用的主观看法。不同的研究小组可能会有所不同。现在,我们配备了一种工具,可以确保我们都能得出相同的结论,”研究主任Nikos Hatzakis解释说,他是化学系的副教授,也是诺和诺德基金会蛋白质研究中心的副教授。
他补充说,该工具还提供了一个不同的视角:
虽然分析蛋白质运动的编排仍然是一个利基,但随着所需的高级显微镜变得越来越便宜,它已经获得越来越多的基础。不过,分析数据需要高水平的专业知识。我们的工具使更多生物学和生物物理领域的研究人员能够使用这种方法,即使是那些没有专门知识的研究人员,无论是对冠状病毒的研究,还是新药或绿色技术的开发。”
研究人员使用一种叫做FRET(Förster共振能量转移)的技术来研究蛋白质的运动和相互作用。FRET的工作原理是在同一个蛋白质分子上放置两个或更多的荧光标记。当标签靠近时,任何荧光的变化都可以用先进的显微镜检测出来。这使得蛋白质的运动可以在纳米尺度上被测量。
人工智能工具“DeepFRET”是一个开源软件,它基于人工深层神经网络,经过训练可以识别数据中的高级模式。该软件可在任何计算机上使用,并与Mac和Windows兼容。
DeepFRET只需人类对数据进行分类所需的时间不到1%。这是以同样或更高的精度完成的。
这篇关于新的人工智能工具的科学论文现在发表在著名的国际期刊《eLife》上。