有機化學家不必再親自做常規合成了嗎?會導致相關領域人員失業還是解放?

2018 年 11 月 26 日,國際頂級雜誌 Science 發表的一篇新論文報道了來自英國格拉斯哥大學研究人員 Leory Cronin 的開創性成果:在一種價格合理的模塊化化學機器人系統中實現重要藥物分子的合成,該系統被稱為「Chemputer」——化學計算機。

原文

Science:化學計算機問世,藥物合成進入自動化時代?

mp.weixin.qq.com圖標

原文鏈接:

http://science.sciencemag.org/content/early/2018/11/28/science.aav2211?

science.sciencemag.org


這個工作最大的意義,我猜,在於解決了實驗的可重複性的問題…這將是化學語言標準化上的有益嘗試

而不是什麼自動合成神器啊,讓偽化生小將失業啊之類的。

你們,對我們這些,真?搬磚工的實力一無所知…這機器,不是用來給有機化學家做合成的

關於自動化這部分,多的懶得展開,你以為那麼多化工專業的人都是喫白飯的麼?自動合成從來都是化學家追求的方向,大到化工廠的反應釜和蒸餾塔,小到精細化工的微通量反應器,哪個不是自動化?哪個不厲害?

那這個Chemputer用處在哪裡?

用於大規模生產上,我認為基本接近一無是處。最大的用處,在於可能可以整合化學反應數據,規範化學語言

打個比方,假設我們創造性地合成了化合物A,現在有機化學家通常會這麼描寫實驗步驟:

"在-78攝氏度的冷浴中,將B緩慢加入C中,隨後回溫至室溫過夜,加入D中止反應,柱分離提純可得A"

你可能覺得你每個字都看懂了,超簡單。相信我,沒有有機化學博士帽子,基本上90%的人重複不出來的…

否則每年國際化學競賽還考實驗做什麼?實驗要是這麼簡單還可能搞的一大票人痛苦得要死麼?

原因不在於造假,而在於省略了大量的細節。

比如"緩慢加入",多慢算緩慢?回溫?是撤去冷浴自然回溫,還是不撤去冷浴的自然回溫,還是架熱水來回溫?等等等等,不一而足。

這些,都要合成老司機帶路纔不會翻車。

至於為什麼不寫的更詳細,主要是大家都這麼寫,約定俗成了。

你要是突然蹦出一句"5分鐘加入",合成老司機們估計慌得一匹。

這作者為什麼強調"5分鐘"?是不是6分鐘會發生點別的什麼?是不是4分鐘的話有什麼副反應?

所以不好弄。

我們經常開玩笑,假設文獻報導產率95%,能做出60%就算是有機合成水平合格,做出80%全是熟手。要是您是隔壁非做合成的?能有10%算您水平高。

再加上有些人沒有學術良心,極其可惡,經常謊報收率,導致合成類文章的SI驚喜連連,坑得小白一愣一愣。

其實像我這種合成老司機是無所謂的,坑不坑一眼可知。

但是這不利於跨學科合作。比如一個做物理的,突然對某個新發現分子產生了濃厚興趣,自己又不會合成,學了幾天又被文獻坑到死,怎麼解決?

這個Chemputer就可以很好的解決這個問題。

自然語言有其模糊性,每個人根據經驗理解都不一樣。但是機器代碼就不同了,執行下來必然是精確和一致的。

如果一個反應,實驗步驟可以轉化成Chemputer代碼,運行後,由機器得到目標產物。那麼這就意味著這個反應的可重複性得到了完美保證。有了這一層背書,老司機們可以放手動手合成放大,乃至優化推廣了。

如果不擅長做有機反應,可以學校買一臺,下載合成步驟,交由機器生產。在各種研究的初試階段,這個成本完全可以接受。

這樣,化學家們合成的新分子才更容易進入別人的實驗室,而不是躺在自己的實驗室成為炫技的手段。

我見了好多跨學科合作者,問他,為什麼不用我這個分子?根據你的理論,我這個分子難道不是更優秀的候選者嗎?

"不好意思,我合成不出來…買又買不到,讓你幫我做,你又沒空…只能放棄了…"

所以這玩意要是能推廣,對跨學科合作,算是不小的助力。


Cronin去年來我們組做報告,瞭解了一些關於自動合成機器人的事情。

其實這個機器背後還有一個更深層目的,就是暴力窮舉各種化學反應,然後用這些數據做一些研究。

比如說用化學反應數據構成化學反應網路,這樣就可以用網路科學、圖論的一些工具來處理;進一步的,可以研究分子的複雜性是如何提升的、生命起源這樣的大問題。

(別問我怎麼知道的……我們老闆天天遙控他們實驗室的一個博後……)

Twitter上有機器運行的視頻(theChemputer):

The Chemputer

這是發展的趨勢和潮流,很高興看到這樣的進步。這樣的工作有兩個意義,一是提高實驗的可重複性,二是解放研究人員的勞動力。

拿最熱的計算機技術做對比吧,畢竟經濟形勢不好金融都快涼了。大家都知道計算機技術發展迅猛,創造了很多價值,也提供了高薪就業。但這些都是基於什麼呢?計算機技術的發展依賴於計算機體系的可重複性,一段代碼在海量的機器上運行的結果完全相同。計算機技術創造的價值依賴於大大節省了人力勞動,提高了效率。否則的話,研究啥機器視覺,人眼一張一張看最準確了。

化學和生物處於什麼階段呢?我們還是以計算機為例比較一下。加入你買了一個手機,然後別人介紹你說,有個軟體叫知乎你玩一下吧,裡面的人個個都是人才。OK,下面怎麼辦呢?你首先去下載知乎的源代碼,然後呢,對著源代碼在你自己的手機上一行一行的編程測試。因為你的機器和源代碼發布者的機器是不一樣的,你要實驗每一行代碼的參數。OK,過了兩個月一年,你調試好了代碼,終於用上知乎了。然後別忙,趕緊存一份的機器上的代碼,等下回你手機關機了,還要對著重寫一遍。如果計算機技術是這樣的,還有這麼多app可以用麼?還有這麼多it產業麼?顯然不可能。

但現在生物化學就處在這樣的階段。你在paper上看到的結果,重複需要大量時間和金錢,然後才能做一點點改進。想像你每次做神經網路訓練前都需要重寫一遍tensorflow框架,你的模型迭代還能那麼快麼?更重要的是,無意義的重複和參數優化佔據了研究人員大量的時間和精力,導致根本沒有時間考慮自己在幹什麼。

因此說,機器代替人力做一些包括有機合成在內的實驗,是非常有利於提高重複性和減少無意義的勞動的。想像一下以後大家發表的文獻都帶一份腳本,把腳本輸入實驗機器人裡面,實驗機器就根據腳本完美重複paper中的實驗,想要改進實驗,只需要改動腳本就可以,多麼美妙。

如果你覺得這樣的實驗機器人的出現會搶了你的工作,那說明你這部分工作本來就是在浪費生命啊親!


Lee Cronin超級贊的。這個工作好像去年就大概成型了,想不到現在纔出來。

很多人說計算機(人工智慧)只想不會做,不過cronin的一直都會做!真的是未來的希望。

對了,基於採訪,部分化學家認為這樣的全合成/方法學是沒有靈魂的。有沒有靈魂,是不是隻會背數據的傻瓜,下個十年可能就可以見分曉了。

小道消息:可能國內會合作搭一臺。


我覺得如果技術成熟了就很好呀,大部分基礎有機合成都是體力活,如果這個機器可以預設一大批基礎的合成路線及對應的理論產率,那就可以節約很多繁瑣步驟的心力以及避免一些實驗操作上的失誤。而且機器的重複率相對也更可信一些。


推薦閱讀:
相關文章