人工智能算法解决了结构生物学上的难题
一种新的人工智能算法可以从错误的结构中挑选出正确的RNA分子的三维结构。计算机预测RNA折叠结构通常是重要且困难的——因为我们已知的结构太少了。
确定生物分子的三维结构是现代生物学和医学发现最具挑战的问题之一。企业和研究机构经常花费几百万美元去确定一个分子的结构,而即使是如此大的努力也常常面临着失败的结果。
斯坦福大学的博士生Stephan Eismann和Raphael Townshend在计算机科学副教授Ron Dror的指导下,利用聪明的、新的机器学习技术开发了一种方法,利用计算机预测精准结构来攻克这一难题。
尤其值得关注的是,尽管只学习了几个已知的结构,他们的方法就已经很成功了,这使得这一方法适用于那些难以通过实验来确定结构的分子。
他们研究成果分别发表在2021年8月27日的《科学》(Science)上和2020年十二月的《蛋白质》(Proteins)上,论文详细地介绍了RNA分子和多蛋白复合体。发表于《科学》(Science)的那篇论文是与斯坦福大学生物化学副教授Rhiju Das一起合作完成的。
“结构生物学是一门研究分子形状的学科,它有一个信条:结构决定功能。”Townshend说。
研究人员设计的算法可以预测精确的分子结构,科学家便可以通过这种方法来解释不同分子是如何工作的。这种方法的应用范围从基础生物学研究到药物设计的实践。
蛋白质的各级结构。因为盘曲折叠,蛋白质的结构在空间上非常的复杂。
“蛋白质是承担着各种各样功能的分子机器。为了执行这些功能,蛋白质往往会结合在一起,”Eismann说。“如果你知道一对蛋白质与某种疾病相关,并且知道它们是怎样在三维层面结合的,那么你可以尝试用一种非常具有针对性的靶向药物来影响它们之间的相互作用。”
Eismann和Townshend与Das实验室的斯坦福博士后学者Andrew Watkins共同撰写了发表于《科学》(Science)的论文,同时与前斯坦福博士生Nathaniel Thomas共同撰写了发表于《蛋白质》(Proteins)的论文。
设计算法
研究人员没有明确指定什么能使得结构预测更准确,而是让算法自己去发现这些分子特征。之所以这样做,是因为他们发现提供这种知识的传统技术,会使算法倾向于某些特征,从而阻碍它去发现其他的信息特征。
“在算法中手动筛选特征的问题是算法会因此变得有偏向性——偏向于筛选者认为重要的那方面。你有可能因此错过一些你需要的、让研究更加全面的信息。”Eismann说。
“在没有明确指示的情况下,网络学会了寻找对分子结构形成至关重要的基本概念。”Townshend说,“令人兴奋之处在于,算法已经清晰地获得了那些我们已知的重要的事情,并且还发现了一些我们闻所未闻的特性。”
在蛋白质的研究上取得了成功之后,研究人员接下来把算法运用到了另一大类重要的生物分子——RNA上。他们在一系列“RNA谜题”中测试了他们的算法,这些谜题来自于他们领域的一个存在已久的竞赛。在每个案例中,这个工具都比所有其他谜题参与者表现得更好,而且算法本身并不是专门针对RNA结构设计的。
更广阔的应用
这项研究目前已经在蛋白质复合体和RNA分子方面取得了成功,研究人员很激动看到它还可以在其他地方派上用场。
“大部分近期在机器学习上取得了突破性进展的研究都是需要大量的数据来训练的。而我们的方式仅在很少量的训练数据下成功——这告诉我们:相关的方法是可以在缺乏数据的领域帮助我们解决尚未被解决的问题的。”《蛋白质》(Proteins)论文的资深作者和《科学》(Science)论文的共同高级作者Dror如是说道。
利用人工智能开发的新分子可以被应用在药物研究与开发上。
特别在结构生物学方面,研究团队表示,就待取得的科学进展而言他们只是触及了皮毛。“一旦你掌握了这项基本技术,你便将你的理解能力提高到了另一个层面,然后便可以开始追问后续的一连串问题了。”Townshend说,“举个例子,有了这类信息,你就能够开始设计新的分子和药物了,那是一个所有人都很期待的领域。”
图片使用申明:原创文章图片源自‘Canva可画’平台免费版权图片素材;引用文章源自引用平台文章中所使用的原图。