化学计算机（Chemputer）问世，可自动合成小分子药物，这会有什么影响？

有机化学家不必再亲自做常规合成了吗？会导致相关领域人员失业还是解放？

2018 年 11 月 26 日，国际顶级杂志 Science 发表的一篇新论文报道了来自英国格拉斯哥大学研究人员 Leory Cronin 的开创性成果：在一种价格合理的模块化化学机器人系统中实现重要药物分子的合成，该系统被称为「Chemputer」——化学计算机。

原文：
Science：化学计算机问世，药物合成进入自动化时代?
mp.weixin.qq.com
原文链接：
http://science.sciencemag.org/content/early/2018/11/28/science.aav2211?
science.sciencemag.org

这个工作最大的意义，我猜，在于解决了实验的可重复性的问题…这将是化学语言标准化上的有益尝试。

而不是什么自动合成神器啊，让伪化生小将失业啊之类的。

你们，对我们这些，真?搬砖工的实力，一无所知…这机器，不是用来给有机化学家做合成的。

关于自动化这部分，多的懒得展开，你以为那么多化工专业的人都是吃白饭的么？自动合成从来都是化学家追求的方向，大到化工厂的反应釜和蒸馏塔，小到精细化工的微通量反应器，哪个不是自动化？哪个不厉害？

那这个Chemputer用处在哪里？

用于大规模生产上，我认为基本接近一无是处。最大的用处，在于可能可以整合化学反应数据，规范化学语言。

打个比方，假设我们创造性地合成了化合物A，现在有机化学家通常会这么描写实验步骤:

"在-78摄氏度的冷浴中，将B缓慢加入C中，随后回温至室温过夜，加入D中止反应，柱分离提纯可得A"

你可能觉得你每个字都看懂了，超简单。相信我，没有有机化学博士帽子，基本上90%的人重复不出来的…

否则每年国际化学竞赛还考实验做什么？实验要是这么简单还可能搞的一大票人痛苦得要死么？

原因不在于造假，而在于省略了大量的细节。

比如"缓慢加入"，多慢算缓慢？回温？是撤去冷浴自然回温，还是不撤去冷浴的自然回温，还是架热水来回温？等等等等，不一而足。

这些，都要合成老司机带路才不会翻车。

至于为什么不写的更详细，主要是大家都这么写，约定俗成了。

你要是突然蹦出一句"5分钟加入"，合成老司机们估计慌得一匹。

这作者为什么强调"5分钟"？是不是6分钟会发生点别的什么？是不是4分钟的话有什么副反应?

所以不好弄。

我们经常开玩笑，假设文献报导产率95%，能做出60%就算是有机合成水平合格，做出80%全是熟手。要是您是隔壁非做合成的？能有10%算您水平高。

再加上有些人没有学术良心，极其可恶，经常谎报收率，导致合成类文章的SI惊喜连连，坑得小白一愣一愣。

其实像我这种合成老司机是无所谓的，坑不坑一眼可知。

但是这不利于跨学科合作。比如一个做物理的，突然对某个新发现分子产生了浓厚兴趣，自己又不会合成，学了几天又被文献坑到死，怎么解决？

这个Chemputer就可以很好的解决这个问题。

自然语言有其模糊性，每个人根据经验理解都不一样。但是机器代码就不同了，执行下来必然是精确和一致的。

如果一个反应，实验步骤可以转化成Chemputer代码，运行后，由机器得到目标产物。那么这就意味著这个反应的可重复性得到了完美保证。有了这一层背书，老司机们可以放手动手合成放大，乃至优化推广了。

如果不擅长做有机反应，可以学校买一台，下载合成步骤，交由机器生产。在各种研究的初试阶段，这个成本完全可以接受。

这样，化学家们合成的新分子才更容易进入别人的实验室，而不是躺在自己的实验室成为炫技的手段。

我见了好多跨学科合作者，问他，为什么不用我这个分子？根据你的理论，我这个分子难道不是更优秀的候选者吗？

"不好意思，我合成不出来…买又买不到，让你帮我做，你又没空…只能放弃了…"

所以这玩意要是能推广，对跨学科合作，算是不小的助力。

Cronin去年来我们组做报告，了解了一些关于自动合成机器人的事情。

其实这个机器背后还有一个更深层目的，就是暴力穷举各种化学反应，然后用这些数据做一些研究。

比如说用化学反应数据构成化学反应网路，这样就可以用网路科学、图论的一些工具来处理；进一步的，可以研究分子的复杂性是如何提升的、生命起源这样的大问题。

（别问我怎么知道的……我们老板天天遥控他们实验室的一个博后……）

Twitter上有机器运行的视频（theChemputer）：

The Chemputer

这是发展的趋势和潮流，很高兴看到这样的进步。这样的工作有两个意义，一是提高实验的可重复性，二是解放研究人员的劳动力。

拿最热的计算机技术做对比吧，毕竟经济形势不好金融都快凉了。大家都知道计算机技术发展迅猛，创造了很多价值，也提供了高薪就业。但这些都是基于什么呢？计算机技术的发展依赖于计算机体系的可重复性，一段代码在海量的机器上运行的结果完全相同。计算机技术创造的价值依赖于大大节省了人力劳动，提高了效率。否则的话，研究啥机器视觉，人眼一张一张看最准确了。

化学和生物处于什么阶段呢？我们还是以计算机为例比较一下。加入你买了一个手机，然后别人介绍你说，有个软体叫知乎你玩一下吧，里面的人个个都是人才。OK，下面怎么办呢？你首先去下载知乎的源代码，然后呢，对著源代码在你自己的手机上一行一行的编程测试。因为你的机器和源代码发布者的机器是不一样的，你要实验每一行代码的参数。OK，过了两个月一年，你调试好了代码，终于用上知乎了。然后别忙，赶紧存一份的机器上的代码，等下回你手机关机了，还要对著重写一遍。如果计算机技术是这样的，还有这么多app可以用么？还有这么多it产业么？显然不可能。

但现在生物化学就处在这样的阶段。你在paper上看到的结果，重复需要大量时间和金钱，然后才能做一点点改进。想像你每次做神经网路训练前都需要重写一遍tensorflow框架，你的模型迭代还能那么快么？更重要的是，无意义的重复和参数优化占据了研究人员大量的时间和精力，导致根本没有时间考虑自己在干什么。

因此说，机器代替人力做一些包括有机合成在内的实验，是非常有利于提高重复性和减少无意义的劳动的。想像一下以后大家发表的文献都带一份脚本，把脚本输入实验机器人里面，实验机器就根据脚本完美重复paper中的实验，想要改进实验，只需要改动脚本就可以，多么美妙。

如果你觉得这样的实验机器人的出现会抢了你的工作，那说明你这部分工作本来就是在浪费生命啊亲！

Lee Cronin超级赞的。这个工作好像去年就大概成型了，想不到现在才出来。

很多人说计算机（人工智慧）只想不会做，不过cronin的一直都会做！真的是未来的希望。

对了，基于采访，部分化学家认为这样的全合成/方法学是没有灵魂的。有没有灵魂，是不是只会背数据的傻瓜，下个十年可能就可以见分晓了。

小道消息：可能国内会合作搭一台。

我觉得如果技术成熟了就很好呀，大部分基础有机合成都是体力活，如果这个机器可以预设一大批基础的合成路线及对应的理论产率，那就可以节约很多繁琐步骤的心力以及避免一些实验操作上的失误。而且机器的重复率相对也更可信一些。