【佳學(xué)基因檢測(cè)】通過外顯子組測(cè)序鑒定常見癌癥的易感基因:以家族性乳腺癌為例
腫瘤易感基因鑒定及腫瘤風(fēng)險(xiǎn)基因檢測(cè)導(dǎo)讀
乳腺癌易感性的遺傳成分在很大程度上是由基因決定的。候選基因病例對(duì)照重測(cè)序已經(jīng)確定了以罕見的蛋白質(zhì)截短突變?yōu)樘卣鞯囊赘谢?,這些突變具有中等的疾病風(fēng)險(xiǎn)。理論上,外顯子組測(cè)序應(yīng)該會(huì)產(chǎn)生更多此類基因。在這里,腫瘤風(fēng)險(xiǎn)基因列表編寫組探討了這種方法的可行性和設(shè)計(jì)考慮。腫瘤風(fēng)險(xiǎn)基因列表編寫組對(duì) 50 名家族性乳腺癌患者進(jìn)行了外顯子組測(cè)序,應(yīng)用頻率和蛋白質(zhì)功能過濾器來識(shí)別賊有可能致病的變異。腫瘤風(fēng)險(xiǎn)基因列表編寫組確定了通過篩選符進(jìn)入t質(zhì)量過濾器的 867,378 個(gè)基因突變,其中 1,296 個(gè)基因突變通過了頻率和蛋白質(zhì)截?cái)噙^濾器。在已知基因中存在和不存在突變的個(gè)體中,經(jīng)過驗(yàn)證的、罕見的蛋白質(zhì)截短基因突變 (PTV) 的中位數(shù)為 10。兩組中突變基因的功能候選者相似。如果沒有基因解碼技術(shù)先驗(yàn)知識(shí),這些基因基因?qū)⒉粫?huì)被識(shí)別為乳腺癌易感基因。每個(gè)人都攜帶多種可能與疾病有關(guān)的罕見突變。
腫瘤易感基因鑒定及腫瘤風(fēng)險(xiǎn)基因檢測(cè)關(guān)鍵詞
乳腺癌易感性,外顯子組測(cè)序,常見疾病遺傳學(xué),缺失遺傳力外顯子組測(cè)序基因檢測(cè)與腫瘤風(fēng)險(xiǎn)判定
外顯子組測(cè)序已被證明在鑒定導(dǎo)致罕見孟德爾疾病的基因方面非常成功。在這種情況下,潛在的遺傳模型通常是已知的,并且突變譜是獨(dú)特的,并且很容易與未受影響個(gè)體的模式區(qū)分開來(在 Ku 等人 中進(jìn)行了評(píng)論)。事實(shí)證明,識(shí)別導(dǎo)致常見疾病的罕見遺傳變異更具挑戰(zhàn)性。潛在的遺傳結(jié)構(gòu)通常很復(fù)雜,而且通常知之甚少,外顯率可能是適度的和/或不完整的,腫瘤風(fēng)險(xiǎn)基因列表編寫組強(qiáng)有力地預(yù)測(cè)遺傳變異對(duì)基因功能和疾病因果關(guān)系的影響的能力仍然有限。然而,許多常見疾病的遺傳力缺失的一個(gè)組成部分可能存在于中/低外顯率的罕見基因變異中,這些變異可能通過外顯子組測(cè)序來處理。
乳腺癌是少數(shù)已發(fā)現(xiàn)此類變異的常見疾病之一。使用候選基因病例對(duì)照重測(cè)序,DNA 修復(fù)基因如CHEK2、PALB2、BRIP1和ATM已被證明是乳腺癌易感基因 。這些基因的特點(diǎn)是與中等疾病風(fēng)險(xiǎn)(RR 2-4)相關(guān)的多個(gè)非常罕見的失活(主要是截?cái)啵┩蛔?。與高外顯率基因和低外顯率變異體一起,這些中等外顯率基因估計(jì)僅占乳腺癌家族風(fēng)險(xiǎn)的約 35% 。因此,很大一部分遺傳對(duì)乳腺癌的貢獻(xiàn)仍然無法解釋。
鑒于少數(shù)候選基因研究已經(jīng)在乳腺癌中產(chǎn)生了罕見的中等外顯率易感基因,因此極有可能存在此類其他基因。這些基因不能通過連鎖分析(風(fēng)險(xiǎn)不夠高)或全基因組關(guān)聯(lián)研究(突變不夠常見)來識(shí)別,但應(yīng)該可以通過適當(dāng)?shù)耐怙@子組測(cè)序研究來檢測(cè)。外顯子組測(cè)序提供了應(yīng)用不可知論而不是候選基因方法來發(fā)現(xiàn)它們的潛力,因此是一種極具吸引力的策略。然而,查詢生成的大量數(shù)據(jù)集以提供給定基因與乳腺癌關(guān)聯(lián)的有力證據(jù)是令人生畏的。探討利用外顯子組測(cè)序鑒定乳腺癌易感基因的可行性,腫瘤風(fēng)險(xiǎn)基因列表編寫組對(duì) 50 名家族性乳腺癌患者的外顯子組進(jìn)行了測(cè)序?;诂F(xiàn)有的范例,腫瘤風(fēng)險(xiǎn)基因列表編寫組應(yīng)用頻率和蛋白質(zhì)截?cái)噙^濾器來優(yōu)先考慮賊有可能充當(dāng)中等外顯率乳腺癌易感性等位基因的基因突變。腫瘤風(fēng)險(xiǎn)基因列表編寫組在四個(gè)個(gè)體中發(fā)現(xiàn)了已知乳腺癌易感基因的突變,證明了這種方法在已經(jīng)建立的易感基因中檢測(cè)突變的實(shí)用性。然后,腫瘤風(fēng)險(xiǎn)基因列表編寫組將這些病例中的突變譜與已知基因中沒有突變的 8 個(gè)個(gè)體進(jìn)行了比較,以研究在發(fā)現(xiàn)新的疾病易感基因方面的效用。
患者和方法
補(bǔ)充材料中提供了樣品和方法的全部詳細(xì)信息。簡(jiǎn)而言之,腫瘤風(fēng)險(xiǎn)基因列表編寫組對(duì)招募到家族性乳腺癌研究 (FBCS) 的 50 名個(gè)體進(jìn)行了外顯子組測(cè)序。這些家族的特征總結(jié)在表格1。所有個(gè)體都患有乳腺癌并且BRCA1和BRCA2突變均為陰性(通過 Sanger 測(cè)序和/或異源雙鏈分析和 MLPA)。腫瘤風(fēng)險(xiǎn)基因列表編寫組在 30 個(gè)個(gè)體中使用了市售的 38 Mb 外顯子組陣列,在 20 個(gè)個(gè)體中使用了 47.9 Mb 定制的 GENCODE 外顯子組陣列 。在 Illumina Genome Analyzer IIx 平臺(tái)上進(jìn)行測(cè)序。腫瘤風(fēng)險(xiǎn)基因列表編寫組使用 NextGENe 軟件(2.10 版)進(jìn)行讀取映射和變異分析,并應(yīng)用調(diào)用質(zhì)量、頻率和蛋白質(zhì)截?cái)噙^濾器來優(yōu)先考慮變異以供進(jìn)一步考慮。腫瘤風(fēng)險(xiǎn)基因列表編寫組選擇了12個(gè)案例進(jìn)行詳細(xì)分析;四個(gè)已知乳腺癌易感基因發(fā)生突變,八個(gè)沒有。腫瘤風(fēng)險(xiǎn)基因列表編寫組通過 Sanger 測(cè)序?qū)?12 個(gè)樣本中的所有優(yōu)先基因突變進(jìn)行了驗(yàn)證分析。腫瘤風(fēng)險(xiǎn)基因列表編寫組使用 ToppGene Suite 進(jìn)行了基因列表富集分析。表格1:家族性乳腺癌外顯子組研究先證者總結(jié)
乳腺癌病例的特征 | |
案例總數(shù) | 50 |
雙邊案例 | 42 |
單方面案件 | 8 |
中位診斷年齡 | |
先進(jìn)個(gè)乳腺癌 | 53 |
第二乳腺癌 | 60 |
中位家族史分?jǐn)?shù)* (FHS) | 3 |
*患有雙側(cè)乳腺癌的個(gè)體和兩個(gè)患有乳腺癌的一級(jí)親屬(或同等學(xué)歷)的 FHS = 3
結(jié)果
外顯子組測(cè)序
總體而言,每個(gè)樣本平均產(chǎn)生 5350 萬條讀數(shù),通常 99% 的讀數(shù)映射到參考基因組。目標(biāo)區(qū)域內(nèi) 83%(范圍 41%-88%)堿基的中位數(shù)覆蓋率≥15/樣本(在線補(bǔ)充表 2)。由于使用了兩個(gè)不同的外顯子組陣列并且測(cè)序進(jìn)行了幾個(gè)月,因此存在相當(dāng)大的樣本間差異??傮w而言,腫瘤風(fēng)險(xiǎn)基因列表編寫組在 NextGENe 默認(rèn)設(shè)置下的 50 個(gè)外顯子組中確定了 1,592,412 個(gè)基因突變。在腫瘤風(fēng)險(xiǎn)基因列表編寫組排除所有讀取覆蓋率 <15 讀取的變異、具有突基因突變的堿基替換:野生型讀取百分比 <30%、內(nèi)含子變異(剪接點(diǎn)處的變異除外)和同義變異后,仍有 353,948 個(gè)變異。為了進(jìn)一步優(yōu)先考慮賊有可能導(dǎo)致疾病的變異,腫瘤風(fēng)險(xiǎn)基因列表編寫組應(yīng)用過濾器來檢測(cè)導(dǎo)致蛋白質(zhì)截?cái)嗟男蛄凶儺?,如前所?。這確定了所有預(yù)測(cè)會(huì)導(dǎo)致蛋白質(zhì)過早截?cái)嗟幕蛲蛔儯阂拼a插入和缺失、無義突變和共有剪接殘基處的突變。該腳本還刪除了具有 5 個(gè)或更多不同截?cái)嗷蛲蛔兊幕蛑械幕蛲蛔儯ㄒ驗(yàn)檫@些很可能是假基因或耐受單倍體不足而不引起疾?。?。該過濾器識(shí)別了 15,784 個(gè)截?cái)嗷蛲蛔儭榱藢?duì)后續(xù)變異進(jìn)行優(yōu)先排序,腫瘤風(fēng)險(xiǎn)基因列表編寫組接下來應(yīng)用了頻率過濾器來識(shí)別 50 例家族性乳腺癌病例中的 1 例中存在的變異,這與已知乳腺癌易感基因的突變流行率一致 。在此過濾器之后,剩下 1,296 個(gè)基因突變。12 個(gè)外顯子組的變異驗(yàn)證
在 1,296 個(gè)基因突變中,腫瘤風(fēng)險(xiǎn)基因列表編寫組確定了已知易感基因中的四個(gè)突變,腫瘤風(fēng)險(xiǎn)基因列表編寫組通過 Sanger 測(cè)序證實(shí)了這些突變;三個(gè)位于中等外顯率基因CHEK2(n = 2)和ATM(n = 1)中。第四個(gè)是BRCA2中的剪接突變,它逃避了異源雙鏈分析的檢測(cè),這被認(rèn)為降低了對(duì)堿基取代的敏感性(表 2)。表 2:在已知乳腺癌易感基因中存在突變的家族性乳腺癌先證者中確認(rèn)的雜合截?cái)嗷蛲蛔儭?/h3>
ID | 基因 | 截?cái)嗤蛔?/td> | 疾病相關(guān)性 |
1 | BRCA2 | c.7977-1G>C | 乳腺癌+卵巢癌(單等位基因),F(xiàn)A-D1(雙等位基因) |
BRIX1 | c.793-2_793-1insA | ||
CASP5 | c.1135+1C>T | ||
CXCL6 | c.239_240insT | ||
FILIP1 | c.303delG | ||
HEATR7B | c.2214+5A>G | ||
IGSF22 | c.479-2T>A | ||
MLL4 | c.3059_3060dupG | ||
PTCHD3 | c.923_924dupG | ||
SLAMF6 | c.321G>C, p.Y107X | ||
SMARCD2 | c.574G>A,p.R136X | ||
SSX9 | c.110delC | ||
TNFAIP6 | c.90G>A,p.W30X | ||
2 | CHEK2 | c.1100delC | 乳腺癌(單等位基因) |
C2orf63 | c.1384+2A>T | ||
CFHR5 | c.486_487insA | 膜增生性腎小球腎炎,II型 | |
PPEF2 | c.1960G>A, p.R654X | ||
SERPINI2 | c.628_629delAC | ||
3 | CHEK2 | c.658T>A, p.K220X | 乳腺癌(單等位基因) |
ABCC11 | c.2813C>G, p.S938X | ||
DNMT3A | c.1025_1026insC | AML | |
EPS8L1 | c.1514_1515dupT | ||
FTMT | c.436A>T,p.K146X | ||
LOC64702 | c.303_304delAT | ||
MCAT | c.729+1G>T | ||
NOD2 | c.3019_3020dupC | 克羅恩病(單等位基因) | |
PRMT7 | c.1056-1G>T | ||
PRSS7 | c.2042_2043dupT | 腸激酶缺乏癥(雙等位基因) | |
VPS13B | c.6732+1G>A | 科恩綜合征(雙等位基因) | |
WRN | c.1230_1231insA | Werner 綜合征(雙等位基因) | |
ZNF451 | c.488G>G/A, p.W163X | ||
ZNF582 | c.136+1G>T | ||
4 | ATM | c.4396C>T, p.R1466X | 乳腺癌(單等位基因)、共濟(jì)失調(diào)性遠(yuǎn)端血管擴(kuò)張癥(雙等位基因) |
FETUB | c.127_128insCA | ||
KIAA1919 | c.614delT | ||
SLC26A10 | c.1483C>T, p.R495X | ||
TAOK1 | c.2544+5A>G | ||
ZIM2 | c.1513C>T, p.R505X |
腫瘤風(fēng)險(xiǎn)基因列表編寫組對(duì) 292 個(gè)擴(kuò)增子中的 12 個(gè)樣本(4 個(gè)具有已知基因突變,8 個(gè)沒有)中通過所有過濾器的所有 316 個(gè)基因突變進(jìn)行了 Sanger 測(cè)序評(píng)估。241 個(gè)擴(kuò)增子的測(cè)序成功。51 個(gè)擴(kuò)增子未能通過自動(dòng)化設(shè)計(jì)和測(cè)序過程。確認(rèn)了 127 個(gè)基因突變(68 個(gè)堿基替換,59 個(gè)插入缺失),盡管對(duì)于三個(gè)基因突變,Sanger 測(cè)序顯示缺失是框內(nèi)的。這些從賊終分析中刪除,因?yàn)樗鼈儾粫?huì)導(dǎo)致過早的蛋白質(zhì)截?cái)?。在剩余?114 個(gè)擴(kuò)增子中未檢測(cè)到變異,即這些是假陽性調(diào)用(23 個(gè)堿基替換,91 個(gè)插入缺失)。這種相對(duì)較高的誤報(bào)率反映了腫瘤風(fēng)險(xiǎn)基因列表編寫組故意降低插入和刪除基因突變的調(diào)用質(zhì)量過濾器設(shè)置;此類基因突變與疾病相關(guān)的先驗(yàn)可能性很高,但很難調(diào)用短讀數(shù)據(jù)。在具有已知基因突變(中位數(shù) = 10,范圍 5-13)和沒有(中位數(shù) = 10,范圍 7-15,p = 0.55)的樣本中看到的截?cái)嗷蛲蛔償?shù)量之間沒有差異。只有兩個(gè)基因包含兩個(gè)截?cái)嗷蛲蛔?;CHEK2和USP45,其余 122 個(gè)截短基因突變出現(xiàn)在不同的基因中。