GPT-5.4 自己设计实验改进药物合成，AI 自主科研走到哪一步了？

作者：

在

OpenAI 和波兰化学AI公司 Molecule.one 本周公布了一项引人注目的研究成果：GPT-5.4 在接入化学AI代理 Maria 之后，近乎自主地改进了药物合成中一个长期令人头疼的反应——Chan-Lam 偶联反应。说”近乎自主”，是因为 AI 负责出主意、设计方案、解读实验数据并提出下一步动作，而人类化学家仍在高层引导、纠正细节和复现关键实验等环节不可或缺。

一个让化学家头疼的反应

Chan-Lam 偶联是化学家用来搭建碳氮键（C-N）的经典反应，而碳氮键在药物分子里几乎无处不在——抗癌药、抗菌药、利尿剂里都有它的身影。问题在于，这个反应对底物的”脾气”很挑，尤其是用伯磺酰胺（primary sulfonamide）和硼酸去做偶联的时候，产率历来很低，经常让化学家不得不放弃一个有希望的分子，或者花大力气另找合成路线。

OpenAI 和 Molecule.one 的研究团队给 GPT-5.4 下了一道很开放的指令：去改进一类重要的反应。至于怎么改、改哪个，全权由 AI 自行判断。于是系统开始自主运转——它生成研究方案、设计并执行实验、分析数据、再据此提出下一轮该尝试什么。

“这是有机化学领域首个由 AI 近乎自主完成的发现。”——Molecule.one CTO Stanisław Jastrzębski

AI 提出了一个连人类都意外的方案

在 GPT-5.4 生成的众多方案中，编号 OAI-M1-03 的那个提出了一个让人类化学家都感到意外的思路：GPT-5.4 自己判断伯磺酰胺是一类又难又有价值的底物，然后提出——用 TEMPO 这种温和的氧化剂当添加剂，也许能改善这个反应。

这个建议让化学家们眼前一亮。随后的测试里，十种氧化剂中正是 TEMPO 跑出了最好的结果。更妙的是，系统后续还发现 TEMPO 可以换成便宜得多的类似物 4-hydroxy-TEMPO，而性能几乎不打折。

整个过程中人类做的最大一次干预，是叫停了用 DMSO 当溶剂的方案——因为化学家担心它会和用作对照的强氧化剂起反应。这类判断目前仍需要人类把关，但 AI 已经能决定”下一步试什么”，这在科学研究中是一个重要的里程碑。

数据说话：AI 的实验量有多大？

两轮实验下来，Maria 一共跑了 10080 个反应——这比一个化学家每天做三个、连做十年还要多。
优化后条件下，测试的硼酸中有 88% 产率提升，磺酰胺中有 83% 提升。
平均产率从 16.6% 涨到 25.2%。
产率超过 30% 的反应占比，从 15.6% 提高到了 37.5%。
人类化学家手工验证了 14 对底物中的 11 对，产率确实提高了，其中 8 对涨了两倍以上。

“近乎自主”，而非”完全自主”

整个实验过程历时两个半月——从 3 月 4 日发出第一个 prompt，到 6 月 4 日把 OAI-M1-03 的结果交给外部专家验证。其中两个半月在做实验，最后半个多月是人类化学家撰写和核实结果。

OpenAI 在声明中特别强调，这套流程仍然是”近乎自主”（nearly autonomous）而非”完全自主”。理由很明确：人类化学家始终在做重要决策。模型负责提出关键的研究想法，人类则提供高层引导和风险判断、纠正实验细节、帮忙备料配试剂，还亲手重复了关键实验。在这个过程中，人的判断仍然是不可或缺的。

那么，AI 实现药物全自动研发还有多远？从这次的成果来看，前沿模型已经能够支持科学研究的大部分环节——审查文献、提出假设、设计实验、解释数据，以及发现人类专家可以验证的成果。但”完全自主”的药物研发，至少在今天，仍然是一个正在靠近而尚未抵达的里程碑。

📎 原文来源：OpenAI 官方博客 | 中文编译：量子位

AI AI制药 AI医疗 AI技术 OpenAI

GPT-5.4 自己设计实验改进药物合成，AI 自主科研走到哪一步了？

一个让化学家头疼的反应

AI 提出了一个连人类都意外的方案

数据说话：AI 的实验量有多大？

“近乎自主”，而非”完全自主”

评论

发表回复 取消回复

更多文章

Signal总裁提醒：AI聊天机器人不是你的朋友，别把隐私交给它

SK海力士把三星拉下马了，AI存储器大战的真正赢家终于浮出水面

Chroma：AI原生开源向量数据库，RAG与语义搜索首选，28,530 Stars让搜索基础设施零门槛

iOS 27的AI不好玩，但真的好用

发表回复取消回复