【佳學基因檢測】基因檢測數(shù)據(jù)庫中的新發(fā)突變數(shù)據(jù)庫denovo-db
人類基因檢測數(shù)據(jù)庫導讀:
全外顯子組和全基因組測序及其與基因解碼的聯(lián)合應用促進了可以導致疾病發(fā)生的大量新發(fā)突變的發(fā)現(xiàn)。在基因解碼技術引入的賊實階段,通過下一代測序進行的大多數(shù)從頭發(fā)現(xiàn)都集中在先天性心臟病和神經(jīng)發(fā)育障礙 (NDD) 上。 根據(jù)《人類基因序列變化及其疾病表征》的大數(shù)據(jù)分析,從頭變異是神經(jīng)發(fā)育障礙 (NDD) 賊重要的風險因素之一,涉及多個神經(jīng)發(fā)育障礙 (NDD) 的基因中的相互重疊。為了促進更好地使用已發(fā)布的數(shù)據(jù)、提供注釋的標準化并提高可訪問性,國際基因解碼學家創(chuàng)建了 denovo-db (http://denovo-db.gs.washington.edu),這是一個人類從頭變異的數(shù)據(jù)庫。 截至 2016 年 7 月,denovo-db 包含 40 項不同的研究和來自 23,098 個基因檢測人聯(lián)組的 32,991 個新發(fā)基因突變。 數(shù)據(jù)庫收錄的基本信息包括基本變異染色體位置、變化、類型; 轉錄本和蛋白質水平的詳細注釋; 嚴重性分數(shù); 頻率; 驗證狀態(tài); 賊重要的是,攜帶有這些基因突變的患者的臨床物征。 該數(shù)據(jù)庫提供了從網(wǎng)頁上下載數(shù)據(jù)的,可以下載任何查詢結果,包括帶有基因突變詳細信息的完整數(shù)據(jù)庫的可下載文件。 denovo-db 為研究人員提供了必要的信息,可以將他們的數(shù)據(jù)與具有相同表型的其他個體進行比較,也可以與對照進行比較,從而更好地了解 de novo 變異的生物學特性及其對疾病的貢獻。
denovo-db數(shù)據(jù)庫的官方介紹
denovo-db是一個從人類基因組胚系突變中鑒定的新發(fā)突變數(shù)據(jù)庫。新發(fā)突變是只存在于兒童,但是不存在于兒童的生物學父母的基因突變。新發(fā)突變一般來說是在胚胎發(fā)育過程中產(chǎn)生的突變。
隨著全外顯子組和全基因組測序的進步,將會有更多的新發(fā)突變被收錄?,F(xiàn)有的新發(fā)突位點是根據(jù)已發(fā)表的基因檢測文獻收錄的。
許多大型外顯子組和基因組研究都集中在神經(jīng)發(fā)育障礙上,但是denovo-db不僅收錄新發(fā)突變,也收錄其他基因突變所引起的疾病表征。
denovo-db 中存在的信息類型已經(jīng)過改進,包括與遺傳和基因信息研究高度相關的內(nèi)容(例如基本功能注釋、CADD 分數(shù)和驗證狀態(tài))。
設立denovo-db數(shù)據(jù)庫的目標是提供所有從頭變體的介紹,以使更大的研究人員社區(qū)受益,并允許研究人員提出各種科學問題,例如:
1. 人類基因組中的哪些位點具有新生突變?
2. 哪些位點對從頭突變高度易變?
3. 新生變異的一般特征和疾病特征是什么?
4. de novo 變異代表了哪些表型?
為什么要建立de novo基因檢測數(shù)據(jù)庫?
每個人都包含其父母中都不存在的新的基因突變,這些變體被稱為從頭突變、新發(fā)突變或者是從頭變體、新發(fā)變體。 根據(jù)基因解碼的大數(shù)據(jù)分析在每一個基因組中有大約 70 個從頭單核苷酸變異和小插入/缺失 (indel)。大多數(shù)這些突變并沒有明顯的表型影響,但在某些情況下這些從頭變異會導致疾病。 其中的一個例子是在FGFR3 中發(fā)生的突變,可以導致軟骨發(fā)育不全和 Rett 綜合征。在大多數(shù)情況下,變異在 MECP2 中重新出現(xiàn)。 隨著下一代測序通過全外顯子組或全基因組測序研究人類基因的完整補充,研究人員正在更清楚地了解這些變異對“復雜”疾病(如自閉癥和 精神分裂癥 )發(fā)生的影響。 例如,在自閉癥中,新生單核苷酸變異和插入缺失占可歸因分數(shù)的 7%,占該疾病單純病例的 21%。 還注意到具有導致多種神經(jīng)發(fā)育障礙 (NDD) 的新生變異的基因之間存在相當大的重疊。
雖然有關致病性新生突變的基因解碼研究目前主要存在于神經(jīng)系統(tǒng)疾病和先天性心臟病,但其他表型也積累了少量的例例。 隨著全基因測序技術、全外顯子組測序技術及更先進的基在解碼應用于其他障礙和疾病,人類基因檢測數(shù)據(jù)庫會積累更的突變位點與基因序列的關系。 denovo-db 的設計目標是整合所有已發(fā)布的 de novo 種系變異,無論表型如何,并使用標準化分析流程進行系統(tǒng)注釋。 這為基因解碼提供了一個一站式獲取臨床數(shù)據(jù)的機會,用于評估特定基因或突變與其感興趣的表型相關的重要性。 然后,研究人員可以提出與疾病相關的問題,例如使用 denovolyzeR等工具,在基因中觀察到的新生變異的數(shù)量是否具有統(tǒng)計學意義,或者可以詢問在基因中觀察到的變異是否跨越許多根據(jù)使用 CLUMP 等工具的對照數(shù)據(jù),個體在疾病中的聚集程度要高于預期。 研究人員還可以通過在許多個體中收集的新發(fā)變異模式提出與疾病無關的問題,這可能為人類基因組中新突變的生物學提供新的見解。 因此,denovo-db 為有關從頭突變的特定和一般分析提供了資源。
新發(fā)突變數(shù)據(jù)庫的創(chuàng)新性
根據(jù)基因檢測數(shù)據(jù)庫,目前已有的數(shù)據(jù)庫有兩個類似于 denovo-db 的數(shù)據(jù)庫。 這兩個數(shù)據(jù)庫都專注于神經(jīng)疾病障礙,與denovo-db新發(fā)突變數(shù)據(jù)庫不同,這些數(shù)據(jù)庫只收集有關從頭變異的信息,而不考慮表型。 比如 NPdenovo,它只收集與神經(jīng)疾病有關的相關的新發(fā)變異。 denovo-db 數(shù)據(jù)的收集不限制在神經(jīng)精神疾病。 第二個是發(fā)育性腦障礙 (DBD) 基因數(shù)據(jù)庫,它收集有關發(fā)育性腦障礙變異的信息。 特別是,它只保留 LGD 事件,例如剪接供體、剪接受體、停止增益和移碼突變。 該數(shù)據(jù)庫提供每個基因與神經(jīng)系統(tǒng)疾病的相關性。 從頭突變數(shù)據(jù)庫的不同之處在于收集新變體的變異,而不考慮表型和功能類別。 denovo-db 旨在成為所有 de novo 變體的簡單介紹,并且不會對研究人員對數(shù)據(jù)的使用做出任何假設。
佳學博士基礎知識介紹:什么是新發(fā)突變(de novo mutation)?
新發(fā)突變(de novo mutation)是指在生殖細胞分裂過程中發(fā)生的、沒有繼承自父母的新突變。這種突變通常發(fā)生在生殖細胞的分裂過程中,可能由于DNA復制錯誤、環(huán)境因素、化學物質等原因引起。這種突變將在后代個體的所有細胞中存在,并且可以對其發(fā)育、健康和疾病風險產(chǎn)生影響。
在人類基因組研究中,新發(fā)突變也被稱為“新基因突變”或“新生代突變”,通常被用于解釋遺傳疾病的發(fā)生和遺傳模式的解釋。新發(fā)突變在人類基因組中很常見,并且可以對某些疾病的發(fā)生起到重要作用,例如自閉癥和智力障礙等。
(責任編輯:佳學基因)