机器学习工具为制药行业常用反应的简化带来了新机遇

在过去的二十年里,碳氮键形成反应,被称为Buchwald-Hartwig反应,已经成为有机合成中最广泛使用的工具之一,特别是在制药工业中,由...

Machine learning tool simplifies one of the most widely used reactions in the pharmaceutical industry

在过去的二十年里,碳氮键形成反应,被称为Buchwald-Hartwig反应,已经成为有机合成中最广泛使用的工具之一,特别是在制药工业中,由于天然产物和药物中普遍存在氮。

这种强大的反应彻底改变了学术界和工业实验室制造含氮化合物的方式,但它需要漫长而耗时的实验来确定高效反应的最佳条件。

现在,伊利诺斯州的研究人员与瑞士制药公司Hoffman La-Roche的化学家合作,开发了一种机器学习工具,可以在几分钟内预测出高产反应的最佳条件,而无需进行冗长的实验。

在最近发表在《科学》杂志上的一篇文章中,伊利诺伊州化学教授斯科特·丹麦(Scott Denmark)和伊恩·莱因哈特(Ian Rinehart)(丹麦实验室最近的博士研究生)描述了他们如何开发、训练和测试他们的机器学习模型,以大大加快对这种钯催化碳-氮键形成反应的底物适应条件的识别。

丹麦表示,这种反应是一种非常普遍的转变,因此在反应物配对中存在很大的结构多样性,需要拉动很多“杠杆”才能使其发挥作用。

丹麦说:“这就是我们发现的。”Machine learning tool simplifies one of the most widely used reactions in the pharmaceutical industry

莱因哈特解释说,自从发现这种反应以来,用户指南和小单已经发展了近30年,它们可以提供一些指导,但实验往往是必要的。基本上,这是一个在实验室里反复试验的过程。

丹麦说:“制药行业的每个人都认识到,用信息学方法进行干预的时机已经成熟。”“很多人都试图使用美国专利和商标局或化学文摘或其他大型数据库来尝试建模,为这一非常重要的反应制作预测工具。但他们并没有做得很好,因为文献中的信息不是很可靠。”

他们的机器学习工具的设计和构建需要生成一个实验数据集,该数据集可以在一系列反应条件下探索不同的反应物配对网络。通过系统的实验设计过程,利用神经网络模型主动学习大范围的碳氮耦合。

丹麦说,这样一个项目面临的挑战是,需要收集的潜在数据量,以及建立一个用于建模的信息数据库所需的成千上万次实验。

丹麦说:“伊恩最大的贡献之一是找出了决定要做什么实验的工作流程,通过大约3500个实验得到一个有效的预测模型,并且仍然能够在没有庞大数据库的情况下做出预测。”

他们还通过实验验证了机器学习工具的预测。

丹麦说:“我们对它们进行了测试,并通过相当好的统计数据发现,这些条件产生的化合物与我们预期的一样。”

研究人员报告说,他们的模型在实验验证中表现出良好的性能:从一系列与样品外反应物的耦合中分离出10种产品,产率超过85%,这些反应物旨在挑战模型。

莱因哈特说,他们教会机器学习模型拥有一种像专家一样的化学直觉。

“所以,我们现在已经运行或讨论了这么多这样的耦合,我们对将要发生的事情有一个很好的直觉,但是没有运行数百或数千个这样的人可能没有一个好的第一个猜测。我们已经在(比用户指南)更细粒度的层面上教会了一个模型,让它拥有直觉。它并不完美。但这就是问题的关键。不一定是这样的。它只需要让你更快地找到答案,”莱因哈特说。

莱因哈特解释说,最酷的部分是,随着越来越多的人使用机器学习工具,直觉会随着时间的推移而得到磨练。随着数据量的增长,开发的工作流不断提高工具的预测能力。

“这是数据科学与化学融合的激动人心的时刻,”丹麦说。“这是完美的婚姻。很多人都认识到这一点,但没有人这样做,至少没有人以有意义的方式进行实验验证。”

丹麦小组正在创建一个基于云的工作流程版本,使世界各地的科学家能够使用这个工具,随着更多结构多样化的底物被测试,不同的催化剂和条件被添加到数据库中,该工具将不断添加数据来改进模型。

莱因哈特说,代码是公开的,并且是开源许可证,所以任何人都可以下载和使用它。此外,他目前正在开发一种更加用户友好的界面,允许人们绘制他们想要反应的两个分子,将它们复制并粘贴到程序中,并根据分子的复杂性在几分钟而不是几小时内得到预测。

莱因哈特说:“我认为做这样的事情真的很令人兴奋。“我们不经常发表一篇论文,并在公共领域推出人们可以在该领域使用的工具。像我们这样的学术实验室的人可以使用这个工具,在他们自己的研究中更快地得到答案。”

本文来自作者[天珊]投稿,不代表1U号立场,如若转载,请注明出处:https://m.1ugp.com/zlan/202507-1410.html

(9)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • 天珊
    天珊 2025年07月26日

    我是1U号的签约作者“天珊”!

  • 天珊
    天珊 2025年07月26日

    希望本篇文章《机器学习工具为制药行业常用反应的简化带来了新机遇》能对你有所帮助!

  • 天珊
    天珊 2025年07月26日

    本站[1U号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 天珊
    天珊 2025年07月26日

    本文概览:在过去的二十年里,碳氮键形成反应,被称为Buchwald-Hartwig反应,已经成为有机合成中最广泛使用的工具之一,特别是在制药工业中,由...

    联系我们

    邮件:1U号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们