撰文 | 《環球科學》特約記者 陳耕石

1887年,攝影師埃德沃德·邁布里奇拍攝了一組特殊的照片。當時,從加州州長到眾多畫家都被一個問題所困擾:馬在奔跑時四隻蹄能否同時離地?為此,邁布里奇將多台照相機固定在賽道邊上,由拴在賽道上的繩索固定快門,當馬衝過繩子時快門被觸發。他將這組照片合成了一套原始的動畫,解決了這個「世紀難題」。更重要的是,這是人類首次實現動態攝影。而在130年後,這段名為《奔跑中的馬》的視頻見證了另一個突破:科學家將視頻信息存儲在一個特殊的媒介——DNA中。

用DNA儲存信息的想法並不是第一次出現。一些生物學家已經利用DNA編碼一些文字信息,比如世界第一種合成生物「辛西婭(Synthia)」的創作者Vente,就曾經通過三聯體密碼子代表的氨基酸順序在他的合成生物基因組中加入了不少的「水印」,內容包括有參與科學家的姓名,科研機構名稱,甚至還有詩歌的片段。但這些還只是科學家的自娛自樂,Shipman等人則從理論上探索了將DNA改造為數據存儲介質的可能性。

在一項發表於《自然》期刊的最新研究中,來自哈佛大學醫學院的科學家應用CRISPR-Cas基因編輯工具,將編碼了圖像甚至是視頻影像的DNA序列導入了大腸桿菌的基因組,並從活體細菌細胞的基因組中讀出了相應的圖像和視頻資料。

CRISPR-Cas系統是近年來炙手可熱的基因編輯技術的主要工具。這套細菌在進化過程中演化出的機制本來是對抗外源遺傳物質-比如噬菌體-「非法侵入」自身基因組的一種防禦機制。最近幾年時間內,聰明的分子生物學家們發現利用細菌的這套系統稍加改動,就可以按照人們預想的方式在活細胞內進行各種對DNA分子的「編輯」,比如定點刪除或插入一段序列,修改原有DNA序列等等。近年來各種相關的研究報道,應用專利出現了大量井噴。

在這項研究中,Shipman和同事,包括正在「復活猛獁象」的生物學家George Church,將圖像文件分解為像素,並通過適當的編碼手段用DNA序列片段表達了像素的信息(例如,一個圖像像素的信息可以由X坐標、Y坐標和顏色來表示)。再通過CRISPR-Cas系統,將編碼了像素的DNA片段整合進大腸桿菌(E.coli)的基因組。待大腸桿菌繁殖後,研究人員通過測定這部分基因的序列,解碼並將圖像/視頻信息重新呈現出來。

Shipman最先實驗的是嘗試將一個56 X 56像素的人手四色黑白影像轉入大腸桿菌基因組。在其中一種編碼方式中,每個像素需要由28個鹼基編碼(整體圖像大小為784位元組)。科學家將所有的像素整合為112個獨立的DNA片段,再將像素信息連同編碼CRISPR-Cas系統需要的酶系統轉入大腸桿菌群體。之後通過高通量測序的方法讀取培養的大腸桿菌基因組信息,可以發現,隨著大腸桿菌繁殖代數的增加,其基因組中可以讀取到的圖像像素信息越完整。

原始圖像(左側)與還原後的圖像(右側)

另一項編碼gif的試驗更具挑戰性。Shipman等利用同樣的系統以每天1幀的速度,將《奔跑中的馬》中的5幀影像編碼進大腸桿菌的基因組。而在研究人員重新讀取的視頻片段中,信息還原度達到了90%。

原始gif(左側)與還原後的gif(右側)

CRISPR-Cas系統在基因組編輯位點上的特異性優勢,大大方便了後期基因測序分析等工作,使得Shipman等將圖像等「大」文件導入活體細胞基因組的想法得以實現。作為早期實驗,接近90%的信息還原度已經是了不起的成就了。

科學家們費盡周折將大小只有幾百位元組的文件「存入」細菌基因組,目前看來有些顯得得不償失。但這就是科學和技術的魅力所在,今天看來十分笨拙的方法也許將在未來改變世界的面貌。Shipman本人就十分看好自己研發的技術:DNA分子的穩定性非常好,如果我們需要永久性地保存文件且並不需要隨時讀取時,DNA將是一種非常優秀的存儲介質。而且,將來我們可以將文件數據存儲進活體細胞而實現存儲,複製等功能。

論文鏈接:

https://www.nature.com/nature/journal/vaop/ncurrent/full/nature23017.html

轉載請聯繫:[email protected]


推薦閱讀:
查看原文 >>
相关文章