【佳學基因檢測】基因檢測中如何進行非編碼RNA和全轉錄組聯(lián)合分析
根據(jù)基因解碼體系,人體基因組即包括全外顯子測序中的主要組成部分編碼區(qū),也包括非蛋白質(zhì)編碼部分。人類基因組不到2%屬于編碼區(qū),超過98%的區(qū)域為非編碼區(qū)?;蚪獯a表明,人類基因組非編碼區(qū)至少80%是有生物活性的,并非基于數(shù)據(jù)庫比較的基因檢測所認為的非編碼區(qū)是人體內(nèi)的"垃圾"DNA,沒有檢測的和分析的意義。從狹義上來說,轉錄組是指轉錄出來的所有mRNA的集合;從廣義上來說,轉錄組是指細胞內(nèi)所有轉錄產(chǎn)物的集合(包括mRNA和非編碼RNA)。
miRNA, circRNA以及l(fā)ncRNA作為一類具有調(diào)控功能的非編碼RNA,是基因解碼體系中的重要內(nèi)容,并且調(diào)控對象均與mRNA有關。佳學基因解碼為了更好地普及除全外顯子基因檢測以外的基因信息知識,特以此為概述非編碼RNA分子信息在人體疾病發(fā)生、發(fā)展及正常生理過程中的作用,同時介紹基因解碼知識體系中的ceRNA理論以及相關的全轉錄組聯(lián)合分析建庫和分析策略。
非編碼RNA概述
1.1 miRNA
miRNA是存在于人體內(nèi)一類具有調(diào)控功能的內(nèi)源性非編碼RNA, 其大小約18~25個核苷酸。基因解碼信息資源miRBase數(shù)據(jù)庫(www.mirbase.org)收集了已經(jīng)進行過同行評議研究的miRNA序列及生物學功能解釋 ,是采用數(shù)據(jù)庫比對技術可以借鑒的miRNA常用的數(shù)據(jù)庫。
成熟的 miRNAs 是由較長的初級轉錄物經(jīng)過一系列核酸酶的剪切加工而產(chǎn)生的(首先miRNA基因通過RNA聚合酶II轉錄生成初級miRNA (pri-miRNA),pri-miRNA 在核酸酶 Drosha 的作用下,形成了 miRNA 的前體(pre-miRNA),pre-miRNA 在轉運蛋白作用下轉運至細胞質(zhì),Dicer酶將pre-miRNA的莖-環(huán)結構剪切成為長約22個核苷酸的雙鏈RNA片段,賊后其中一條鏈被降解,另一條鏈形成成熟的miRNA),隨后組裝進 RNA 誘導的沉默復合體(RISC),通過堿基互補配對的方式識別靶標mRNA,并根據(jù)互補程度的不同指導沉默復合體降解靶標mRNA 或者抑制靶標mRNA 的翻譯,從而參與人體的正常生理過程。miRNA及其調(diào)節(jié)靶序列的基因突變,即使不影響蛋白質(zhì)的結構,也會通過影響蛋白質(zhì)的表達時空及組織特異性,而參與疾病的發(fā)生,對這一過程的理解和掌握是目前基因解碼技術所特有的。是基因信息分析超出普通過數(shù)據(jù)庫比對的地方。在人體,一般成熟miRNA的種子序列(5'端到3'端的2-8位核苷酸)與mRNA的3' UTR不有效互補配對,從而抑制mRNA的翻譯。
miRNA作用機理
1.2 circRNA
circRNA是一類具有閉合環(huán)狀結構的非編碼RNA分子, 沒有5'帽子結構和3' poly(A)尾巴結構,廣泛存在于人體的各種組織、生理及病理過程的多個階段。circRNA不容易被核酸外切酶(RNase R)降解,比線性RNA更穩(wěn)定,使得circRNA在開發(fā)疾病新型診斷與治療方法上具有巨大潛力。基因解碼數(shù)據(jù)庫中circBase數(shù)據(jù)庫(http://www.circbase.org)收集了人、小鼠等多個物種的circRNA信息。
根據(jù)circRNA來源的基因組區(qū)域,可以將circRNA分為外顯子circRNA(ecircRNA), 內(nèi)含子circRNA(ciRNA), 外顯子-內(nèi)含子circRNA(EIciRNA)和基因間區(qū)circRNA,其中外顯子circRNA是人體內(nèi)賊普遍的一類circRNA。外顯子circRNA來源于pre-mRNA 發(fā)生的反向剪切,在反向剪切的過程中,5’剪切位點下游與 3’剪切位點上游連接在一起形成 3’,5’磷酸二酯鍵。
基因解碼清晰地揭示出,circRNA可以充當miRNA和蛋白質(zhì)的分子海綿、影響轉錄、干擾mRNA前體的正常剪接、調(diào)控mRNA分子翻譯、形成環(huán)形RNA蛋白質(zhì)復合體、與mRNA競爭性結合蛋白質(zhì)等機制,參與免疫、代謝、神經(jīng)系統(tǒng)發(fā)育和細胞增殖等生物學過程中。
cirRNA的功能和生物醫(yī)學應用
1.3 lncRNA
lncRNA是指一類長度大于200nt的長鏈非編碼RNA。根據(jù)與編碼基因的相對位置,可將lncRNA分為基因間型(intergenic lncRNAs)、內(nèi)含子型(intronic lncRNAs)、反義型(antisense lncRNAs)、正義重疊型(Sense-overlapping lncRNAs)類型。
大多數(shù)lncRNA由RNA聚合酶II (Pol II) 轉錄產(chǎn)生,具有5'帽子結構和3' poly(A)尾巴結構,但是其加工剪接效率較低,并且呈現(xiàn)出明顯的細胞核定位現(xiàn)象。定位在細胞核的lncRNA,可以與DNA、RNA、蛋白質(zhì)等多種分子相互作用,調(diào)控染色體結構和功能;通過順式(cis)或反式(trans)調(diào)控基因的轉錄,影響mRNA的剪接、穩(wěn)定和翻譯等。剪接加工有效的lncRNA轉運至細胞質(zhì),在轉錄后水平反式調(diào)控基因表達(如調(diào)節(jié)mRNA翻譯和降解等)。
lncRNA轉錄水平調(diào)控
02 ceRNA假說
哈佛醫(yī)學院Pier Paolo Pandolfi研究小組于2011年提出了競爭性內(nèi)源RNA(ceRNA)假說,假說認為內(nèi)源性RNA分子(如circRNA,lncRNA,假基因等)具有miRNA作用位點,可以競爭性地與miRNA結合,從而間接調(diào)控miRNA靶基因的表達。
當ceRNA表達沉默時,mRNA在miRNA介導的沉默復合體(RISC)作用下被降解或翻譯被抑制;而當ceRNA表達激活后,可競爭性結合miRNA的RISC復合物,降低miRNA降解mRNA或抑制翻譯的功能,從而上調(diào)基因的表達量。
ceRNA機制(a.假基因沉默,b.假基因激活)
03 全轉錄組聯(lián)合分析
在生物體內(nèi),任何一類RNA分子都不是孤立的,它們行使不同的生物學功能,共同參與生物體復雜的調(diào)控機制。全轉錄組關聯(lián)分析的原理是基于非編碼RNA分子可以參與調(diào)控mRNA的表達以及ceRNA 假說。全轉錄組聯(lián)合分析是指針對一份樣品同時分析mRNA, lncRNA, circRNA和miRNA之間的聯(lián)合調(diào)控關系,構建全面精細的RNA調(diào)控網(wǎng)絡,更好地闡明生物學相關的問題。
3.1 建庫策略
建兩個庫:分別建Total RNA(包含mRNA, circRNA, lncRNA)的文庫和建miRNA的文庫,缺點是環(huán)狀RNA有效數(shù)據(jù)量低,不易檢測到低豐度的環(huán)狀RNA。
建三個庫:分別建Total RNA(包含mRNA, circRNA, lncRNA)的文庫,miRNA的文庫和富集circRNA的文庫。富集circRNA的文庫利用環(huán)狀RNA可以抵御核酸外切酶降解的特點,往樣本中加入核酸外切酶,去除線性RNA而僅保留環(huán)狀RNA,從而排除了線性RNA的干擾,提高了環(huán)狀RNA的有效數(shù)據(jù)量。
3.2 聯(lián)合分析策略
全轉錄組聯(lián)合分析策略分為WTS和共表達分析。
WTS分析是基于差異比較組合之間差異表達的RNA分子序列信息,預測差異表達RNA分子兩兩間的靶向關系(考慮序列的互補配對和結合自由能等),構建非編碼RNA分子和mRNA的調(diào)控網(wǎng)絡。
共表達分析是基于多個樣本(大于5個)的不同分子的表達量進行表達相關性分析,篩選顯著相關的靶向關系(其中miRNA與靶標基因呈負相關) 構建非編碼RNA分子與mRNA的共表達網(wǎng)絡??蛻艨筛鶕?jù)自身需要以及實驗的樣本情況,選擇合適的分析方法或整合兩種方法。