OpenAI 和波兰化学AI公司 Molecule.one 本周公布了一项引人注目的研究成果:GPT-5.4 在接入化学AI代理 Maria 之后,近乎自主地改进了药物合成中一个长期令人头疼的反应——Chan-Lam 偶联反应。说”近乎自主”,是因为 AI 负责出主意、设计方案、解读实验数据并提出下一步动作,而人类化学家仍在高层引导、纠正细节和复现关键实验等环节不可或缺。
一个让化学家头疼的反应
Chan-Lam 偶联是化学家用来搭建碳氮键(C-N)的经典反应,而碳氮键在药物分子里几乎无处不在——抗癌药、抗菌药、利尿剂里都有它的身影。问题在于,这个反应对底物的”脾气”很挑,尤其是用伯磺酰胺(primary sulfonamide)和硼酸去做偶联的时候,产率历来很低,经常让化学家不得不放弃一个有希望的分子,或者花大力气另找合成路线。
OpenAI 和 Molecule.one 的研究团队给 GPT-5.4 下了一道很开放的指令:去改进一类重要的反应。至于怎么改、改哪个,全权由 AI 自行判断。于是系统开始自主运转——它生成研究方案、设计并执行实验、分析数据、再据此提出下一轮该尝试什么。
“这是有机化学领域首个由 AI 近乎自主完成的发现。”——Molecule.one CTO Stanisław Jastrzębski
AI 提出了一个连人类都意外的方案
在 GPT-5.4 生成的众多方案中,编号 OAI-M1-03 的那个提出了一个让人类化学家都感到意外的思路:GPT-5.4 自己判断伯磺酰胺是一类又难又有价值的底物,然后提出——用 TEMPO 这种温和的氧化剂当添加剂,也许能改善这个反应。
这个建议让化学家们眼前一亮。随后的测试里,十种氧化剂中正是 TEMPO 跑出了最好的结果。更妙的是,系统后续还发现 TEMPO 可以换成便宜得多的类似物 4-hydroxy-TEMPO,而性能几乎不打折。
整个过程中人类做的最大一次干预,是叫停了用 DMSO 当溶剂的方案——因为化学家担心它会和用作对照的强氧化剂起反应。这类判断目前仍需要人类把关,但 AI 已经能决定”下一步试什么”,这在科学研究中是一个重要的里程碑。
数据说话:AI 的实验量有多大?
- 两轮实验下来,Maria 一共跑了 10080 个反应——这比一个化学家每天做三个、连做十年还要多。
- 优化后条件下,测试的硼酸中有 88% 产率提升,磺酰胺中有 83% 提升。
- 平均产率从 16.6% 涨到 25.2%。
- 产率超过 30% 的反应占比,从 15.6% 提高到了 37.5%。
- 人类化学家手工验证了 14 对底物中的 11 对,产率确实提高了,其中 8 对涨了两倍以上。
“近乎自主”,而非”完全自主”
整个实验过程历时两个半月——从 3 月 4 日发出第一个 prompt,到 6 月 4 日把 OAI-M1-03 的结果交给外部专家验证。其中两个半月在做实验,最后半个多月是人类化学家撰写和核实结果。
OpenAI 在声明中特别强调,这套流程仍然是”近乎自主”(nearly autonomous)而非”完全自主”。理由很明确:人类化学家始终在做重要决策。模型负责提出关键的研究想法,人类则提供高层引导和风险判断、纠正实验细节、帮忙备料配试剂,还亲手重复了关键实验。在这个过程中,人的判断仍然是不可或缺的。
那么,AI 实现药物全自动研发还有多远?从这次的成果来看,前沿模型已经能够支持科学研究的大部分环节——审查文献、提出假设、设计实验、解释数据,以及发现人类专家可以验证的成果。但”完全自主”的药物研发,至少在今天,仍然是一个正在靠近而尚未抵达的里程碑。

发表回复