美国麻省理工学院和塔夫茨大学研讨人员设计出一种基于大型言语模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将方针蛋白与潜在的药物分子相匹配,而无需履行核算分子结构的密集型过程。相关论文宣布在最新一期《美国国家科学院院刊》上。
使用这种方法,研讨人员可在一天内挑选逾越1亿种化合物,比任何现有模型都要多得多。这项成果处理了对当前药物挑选的需求,其可扩展性还能够评价脱靶效应、药物再利用以及确认骤变对药物结合的影响。
近年来,科学家在根据氨基酸序列猜测蛋白质结构方面取得了巨大进步。然而,要猜测大型潜在药物库如何与致癌蛋白相互作用,依然具有挑战性,因为核算蛋白质三维结构需求大量时刻和核算才能。麻省理工学院团队以他们2019年首次开发的蛋白质模型为根底,此次将模型应用于确认蛋白质序列将与特定药物分子的相互作用。他们用已知的蛋白质—药物相互作用对网络进行训练,使其能学习将蛋白质特定特征与药物结合才能联系起来,而无需核算任何分子的三维结构。
经过挑选包括约4700种候选药物分子的库,团队测试了他们的模型,并确认了这些药物与51种蛋白激酶结合的才能。
从热门结果中,研讨人员选择了19组“药物—蛋白质对”进行实验测试,终究12对具有很强的结合亲和力,而几乎一切其他或许的药物—蛋白质对都没有亲和力。
研讨人员表明,药物研制本钱之所以如此高昂,部分原因是它的失败率很高。如果能事前猜测这种结合不或许奏效,就能削减失败率,从而大大降低新药开发的本钱。
在咱们普通人还在用言语模型聊天和写作时,科研人员现已看到了它在药物挑选方面的变革性潜力。药物研制耗时漫长且相当贵重,要做大量的“无用功”。人工智能现已被引进这一枯燥漫长的过程,协助缩短分子配对的时刻。文中介绍的新模型ConPLex能够剖析大量文本,并找到最或许出现在一起的组合。这种基于言语模型研讨的思路,逾越了现在最先进的算法,可在一天内挑选逾越1亿种化合物。论文现已对挑选结果进行了实验检测,结果也令人欢喜。