非編碼RNA,是腫瘤治療性靶標巨大的儲備庫。一直以來RNAi技術是篩選與腫瘤相關的lncRNA靶標的常規手段,隨著CRISPR/Cas9技術日漸成熟,它不但應用於編碼基因的功能性篩選,伴隨技術的完善也已經成為篩選特定腫瘤相關的lncRNA的強大工具。本文介紹lncRNA CRISPR/Cas9文庫篩選的基本知識,供廣大lncRNA研究者探討。
腫瘤表型相關的lncRNA
圖1:左邊為癌lncRNA,右邊為抑癌lncRNA,它們分別引起腫瘤四種表型(生長抑制,凋亡,增值,侵襲),其中綠色箭頭代表正調控,紅色箭頭代表負調控;不同顏色的橢圓代表RNA結合蛋白
癌lncRNA(Onco-lncRNA):促進癌症表型的lncRNA,例如:HOTAIR、NEAT、ANRIL1和MALAT1。這些Onco-lncRNA在腫瘤中高表達,將它們導入腫瘤細胞會改變生長和侵襲等,而且它們在健康細胞中也參與核心生物過程。
抑癌lncRNA(Tumor-suppressor lncRNA):抑制癌症表型的lncRNA,例如:GAS5、MEG3、NBAT和LINC-PINT。這些Tumor-suppresor lncRNA在腫瘤中低表達,將它們導入腫瘤細胞抑制生長和侵襲等,而且它們也參與關鍵的生物過程。
腫瘤相關LncRNA研究方法和工具
圖2:LncRNA功能研究方法集錦
RNA幹擾(RNA interference):siRNA和shRNA方法,常規的轉染試劑或者病毒包裝。這類方法主要用於細胞質定位的lncRNA。(艾博思提供優質的細胞質lncRNA解決方案),缺點在於RNAi的表型效應較為複雜。
RNA降解(RNA degradation):ASO(Antisense oligos)方法,常規的轉染試劑導入細胞。這類方法主要用於細胞覈定位的lncRNA。(艾博思提供優質的細胞核lncRNA解決方案),缺點在於ASO較短,脫靶效應較為嚴重。
轉錄抑制(Transcriptional inhibition):主要是小分子抑製劑,基因組範圍的轉錄抑制,並不具有特異性。
轉錄阻遏和轉錄激活(Transcriptional repression &Transcriptional activation)
圖3:當使用dCas9蛋白與不同的效應結構域連接,而gRNA與我們想要抑制或激活的靶基因區域互補時,我們就可以利用CRISPR/Cas9系統來調節靶基因的表達了。
CRISPRi:也稱為CRISPR幹擾 (CRISPR interference or inhibition) 。dCas9與轉錄抑制子連接,如KRAB(Kruppel associated box),dCas9-KRAB融合蛋白在gRNA指引下,結合到靶基因TSS位點,抑制轉錄起始,沉默靶基因的表達。
圖4:CRISPRi系統示意圖。
CRISPRa: CRISPR激活(CRISPR activation) 。催化失活的Cas9(dCas9)連上轉錄激活子,可以有效促進基因組特定位點的轉錄,這一工具被稱為CRISPRa
圖5:CRISPRa系統示意圖。
基於CRISPR/Cas9 lncRNA研究系統
圖6:CRISPR/Cas9系統示意圖
表1:基於CRISPR文庫篩選系統篩選案列
lncRNA CRISPR文庫篩選技術指南
圖7:CRISPR-Del lncRNA池篩選流程示意圖
A.篩選前思考的問題
a)CRISPRa(激活)、CRISPRi(幹擾)、CRISPR-Del(缺失)選擇哪一種技術?
b)sgRNA篩選庫的選擇,靶向哪些lncRNA?
c)細胞模型和表型分析的選擇?
B.文庫篩選技術
文庫篩選技術可以讓研究者以低成本高通量的方式一次性分析成百上千的lncRNA。這種方法是基於shRNA篩選技術的開發而衍生出來的,通過嚴格的設計獲得了高度的靈敏度和特異性。
文庫篩選技術又稱為基因功能的表型到基因型的評價「phenotype-to-genotype」。如圖7篩選主要分為三步結構:1.擾動(perturbation)2.篩選(selection)3.靶標的識別(hit identification)
在lncRNA篩選擾動模式時候一定要考慮lncRNA的特殊性。如果你感興趣的lncRNA在選擇的目標細胞系中是有表達的,那麼通過CRISPR-del或者CRISPRi的功能喪失(Loss of function,LOF)工具更合理。然後即使你的lncRNA在目標細胞系中不表達,功能獲得性(Gain of function,GOF)工具CRISPRa更加合理。但是考慮到目前有效的lncRNA治療藥物為反義核酸(ASO),基於未來藥物研發應用考慮功能喪失比功能獲得方法更具有吸引力。作為一個剛剛開始做CRISPRS篩選的平臺,CRISPRi是首選。
C.文庫選擇和設計
在實踐中一般有兩種文庫可以選擇,一種是預製的文庫;一種是定製的文庫。
預製的文庫可以參考使用AddGene收集的文庫集:
https://www.addgene.org/crispr/libraries/ (見表1)這種文庫適合與做初級實踐,剛剛開始篩選時候摸索經驗。
定製的文庫具有一定挑戰性,需要大量生物信息學分析以及精細考量和權衡。庫的設計主要有以下步驟:
1.靶標基因的選擇
對於lncRNA選擇主要有兩個原則,一個是選擇重要疾病相關,例如腫瘤有關的,選擇的lncRNA如果與某種腫瘤具有強烈相關性我們一定會優先考慮。一個是特定的基因屬性,它們在基因組中位置,一般我們都會選擇基因間隔區的lncRNA,減少了與編碼基因的重疊,減少了脫靶負效應。
然而,合理的對照基因是一個實驗設計成功的必要保障。
陽性對照:靶向mRNA,或者已知表型的lncRNA;
陰性對照:靶向非基因的基因組區域;
非靶向對照:不靶向任何基因組區域。
2.轉錄起始位點的確定
對於lncRNA的轉錄起始經常會被錯誤的注釋。而正確的轉錄起始位點的確定對於CRISPR-del和dCas9來說就顯得更為關鍵了。目前GENCODE的lncRNA注釋與試驗結果相結合可以輔助預測轉錄起始。還有就是CAGE(Cap Analysis of Gene Expression)數據挖掘。CAGE最早是由日本科學家Hayashizaki等發表在《PNAS》雜誌上的。顧名思義,它是有關5』帽子的分析。CAGE是一種使用在分子生物學中的技術,能產生樣品中mRNA的5』端快照。這種技術實現了高通量的基因表達分析以及轉錄起點的圖譜分析。除此之外,在對染色質進行DNaseI處理,切割將先發生在少數特異性位點上,這些特異性位點叫做DNaseI超敏感位點。這些處於活性轉錄的區域對核酸酶是十分敏感的。當一個lnRNA處於轉錄活性狀態時,含有這個lncRNA的染色質區域對DNase(一種內切塊酶)降解的敏感性要比無轉錄活性區域高得多。
3.設計最優化的sgRNA。
sgRNA設計典型的是選擇20mer的序列,最大增強尋靶效率而減少脫靶效應。典型的文庫一般針對1個lncRNA設計3-10個特異的位點。不同的設計軟體對於sgRNA位置、組成、長度和RNA熱動力學參數進行優化和組合來獲取最高效靈敏的sgRNA位點。
對於lncRNA的尋靶來說,相當於轉錄起始位點的位置效應也許更加重要。CRISPRi和CRISPRa需要設計位置接近轉錄起始位點(TSS),一般在TSS的上游150-75bp或者TSS下游25-250bp。
對於sgRNA設計來說,最大的障礙就是構建大規模的sgRNA文庫的生物信息學工具。然而網上工具基本上都是一些低通量的服務,比如針對CRISPRi/a/del的GPP Web Potal(https://portals.broadinstitute.org/gpp/public/).MIT的CRISPR-del和CRISPOR。CRISPRETa(http://crispeta.crg.eu/)是一個不錯的大規模設計的在線工具但是目前只為CRISPR-del的sgRNA設計。
4.細胞模型
細胞系的選擇對於高通量篩選至關重要。細胞系必須滿足易培養、快速擴繁而且穩定表達的特性,所以盡量選擇模式細胞系。而且這些模式細胞繫有相應的基因組數據,例如RNA-seq、CAGE、組蛋白修飾數據。選用ENCODE和Cancer Cell Atlas資料庫細胞最為有利。
5.表型分析
CRISPR篩選與高通量表型分析相結合才能高效準確判斷。目前表型分析從簡單的增值到複雜的藥物抗性、遷移和標記物的基因表達等等。
CRISPR-Cas9 文庫高通量篩選常用模式可以分為陽性篩選 (Positive selection screen) 和陰性篩選 (Negative selection screen)。陽性篩選是對已成功整合 sgRNA 的細胞文庫施加一定的篩選壓力,僅使少數目的表型的細胞能夠存活,達到富集關鍵基因的目的。陰性篩選與之相反,存活的細胞並不是目的表型細胞,因此需要比較不同時間點 sgRNA 的丰度找出差異 sgRNA 來確定關鍵基因。兩種篩選方式通常都需要與高通量測序技術結合,通過高通量測序獲得樣品中細胞的sgRNA 序列信息,再通過生物信息學分析排除假陽性結果繼而確定可能的候選基因。CRISPR 系統後續分析同樣是影響實驗結果的重要問題, Chuai 等同樣整理了7 種用於後續結果分析的平臺。例如 MAGeCK 是 Li 等開發的用來分析 CRISPR 高通量篩選結果的演算法,之後Li 等又將其拓展為 MAGeCK-VISPR 演算法,為CRISPR 高通量篩選提供了綜合質控、分析及可視化的數據分析方法。
參考文獻:
1. Esposito R, Bosch N, Lanzós A, Polidori T, Pulido-Quetglas C, Johnson R. (2019) Hacking the Cancer Genome: Profiling Therapeutically Actionable Long Non-coding RNAs Using CRISPR-Cas9 Screening. Cancer Cell.
推薦閱讀: