腫瘤為什么會(huì)轉(zhuǎn)移?
(基因檢測(cè)如何判斷腫是否會(huì)轉(zhuǎn)移,對(duì)轉(zhuǎn)移性的腫瘤如何進(jìn)行基因解碼,如何治療轉(zhuǎn)移性的腫瘤?)腫瘤轉(zhuǎn)移分析摘要:
腫瘤轉(zhuǎn)移是導(dǎo)致腫瘤患者死亡的主要原因,同時(shí)也與腫瘤治療效果不好有關(guān)。更好地了解晚期癌癥的特點(diǎn)可以幫助制定個(gè)性化治療方案、減少過(guò)度治療、改善治療效果。就我們所知,此項(xiàng)目是現(xiàn)今對(duì)轉(zhuǎn)移性實(shí)體瘤進(jìn)行的賊大規(guī)模的泛癌研究。包括2520對(duì)腫瘤和正常組織的全基因組測(cè)序數(shù)據(jù),中位測(cè)序深度分別是106×和38×,收集分析了7000萬(wàn)個(gè)體細(xì)胞變異。轉(zhuǎn)移性腫瘤的特征性突變差異很大,突變即可反映原發(fā)性腫瘤的突變情況,全基因組重復(fù)也是高發(fā)的(56%)。在一個(gè)個(gè)體內(nèi)的不同轉(zhuǎn)移灶中,突變情況相對(duì)一致,絕大多數(shù)腫瘤驅(qū)動(dòng)性突變(96%)是克隆性的,高達(dá)80%的腫瘤抑制基因通過(guò)不同的突變機(jī)制在兩個(gè)等位基因上同是失去活性。盡管轉(zhuǎn)移性腫瘤基因組的突變情況及驅(qū)動(dòng)基因突變與原發(fā)性腫瘤相似,轉(zhuǎn)移性腫瘤的突變特征可以揭示每一個(gè)病人對(duì)藥物的敏感性及其對(duì)藥物的抗性。我們采用了一套分析方法,去分析突變與臨床表征的聯(lián)系及臨床治療的可行性。對(duì)于62%
患者,我們可以根據(jù)基因突變,可以為患者找到已經(jīng)批準(zhǔn)或正在進(jìn)行臨床實(shí)驗(yàn)的治療方案。這表明對(duì)于腫瘤患者的分析對(duì)于腫瘤的正確治療是重要的。
近年來(lái),幾項(xiàng)大規(guī)模的全基因組測(cè)序(WGS)分析工作對(duì)驅(qū)動(dòng)不同類(lèi)型成人和兒科癌癥的分子過(guò)程的多樣性產(chǎn)生了有價(jià)值的認(rèn)識(shí),以基因組突變信息為指導(dǎo)制定腫瘤治療方案為腫瘤的治療帶來(lái)了希望。然而,大多數(shù)分析都是采用原發(fā)性腫瘤組織進(jìn)行的,而導(dǎo)致大部分疾病負(fù)擔(dān)和90%癌癥死亡的轉(zhuǎn)移癌在全基因組的研究不夠全面。做過(guò)的研究主要是根據(jù)腫瘤類(lèi)型分組,或者是采用靶向基因測(cè)序,或者是采用全外顯子測(cè)序。不管是高度異質(zhì)性的原發(fā)性腫瘤,還是發(fā)生了轉(zhuǎn)移的轉(zhuǎn)移性細(xì)胞中,腫瘤基因組都會(huì)隨著時(shí)間而發(fā)生變化,對(duì)轉(zhuǎn)移性腫瘤的基因組的了解將有助于改進(jìn)晚期腫瘤的治療。
在這里,我們根據(jù)2399名患者的2520對(duì)腫瘤(106×平均深度)和正常(血液,38×深度)組織的全基因組描述轉(zhuǎn)移癌的泛癌全基因組突變情況(補(bǔ)充表1和表2,擴(kuò)展數(shù)據(jù)圖1)。樣本患者的年齡和原發(fā)腫瘤類(lèi)型的分布廣泛反映了西方國(guó)家實(shí)體癌的發(fā)病情況,包括罕見(jiàn)的癌癥(圖1a)。測(cè)序數(shù)據(jù)使用基于開(kāi)源工具(方法,補(bǔ)充信息)的優(yōu)化生物信息分析流程進(jìn)行分析,共鑒定出59,472,629個(gè)單核苷酸變異(SNVs)、839,126個(gè)多核苷酸變異(MNVs)、9,598,205個(gè)插入缺失(indels)和653,452個(gè)結(jié)構(gòu)變異(SVs)(補(bǔ)充信息表2)。
轉(zhuǎn)移癌的突變?nèi)胺治?/h2>
我們根據(jù)來(lái)源組織分析每種癌癥不同類(lèi)型變異的突變量(圖1,補(bǔ)充表2)。與曾經(jīng)做的、對(duì)原發(fā)性癌癥的研究一致(13、14),我們發(fā)現(xiàn)在同一種癌癥內(nèi)部及不同癌癥類(lèi)型之間,突變量的差異著高達(dá)三個(gè)數(shù)量級(jí)。
每個(gè)樣本的SNV中位計(jì)數(shù)在皮膚癌中主要是黑色素瘤(44000)和肺腫瘤(36000)中賊高,是肉瘤(4100)、神經(jīng)內(nèi)分泌腫瘤(3500)和間質(zhì)瘤(3400)的10倍多。將SNV突變與COSMIC突變特征進(jìn)行比對(duì),每一種腫瘤SNV的突變與前期腫瘤組中的突變總體相符。但是,有些寬譜突變特征如S3,S8,S9和S16以及有些更為特殊的腫瘤突變特征在我們的腫瘤組中得到了突出表現(xiàn)。這些結(jié)果表明,腫瘤中DNA修復(fù)異常、甲基化的增加在晚期腫瘤得到了富集,或者是反映了前期治療致突變效應(yīng)。
MNVs的變異更大,肺腫瘤(821例)和皮膚腫瘤(764例)的MNV計(jì)數(shù)中值是其他腫瘤類(lèi)型的5倍。這可以分別由眾所周知的紫外線(xiàn)輻射(CC>TT)和吸煙(CC>AA)突變特征的突變效應(yīng)來(lái)解釋?zhuān)〝U(kuò)展數(shù)據(jù)圖2)。雖然只有二核苷酸替代通常被靠慮為為MNVs,但10.7%的MNVs是三個(gè)核苷酸變化,0.6%的MNVs涉及四個(gè)或更多的核苷酸變化。
ndel計(jì)數(shù)通常比SNVs低10倍,皮膚癌和肺癌的相對(duì)發(fā)生率較低(圖1c)。對(duì)微衛(wèi)星位點(diǎn)的indels進(jìn)行全基因組分析,確定了60個(gè)具有微衛(wèi)星不穩(wěn)定性(MSI)的樣本(補(bǔ)充表2),占所有腫瘤的2.5%(擴(kuò)展數(shù)據(jù)圖4)。值得注意的是,在整個(gè)隊(duì)列中67%的indel是在60個(gè)MSI樣本中發(fā)現(xiàn)的,而隊(duì)列中85%的indel是在微衛(wèi)星或短串聯(lián)重復(fù)序列中發(fā)現(xiàn)的。MSI在中樞神經(jīng)系統(tǒng)(CNS)腫瘤(9.4%)、子宮腫瘤(9.1%)和前列腺腫瘤(6.1%)中檢出率賊高。對(duì)于轉(zhuǎn)移性結(jié)直腸癌病變,我們發(fā)現(xiàn)MSI的發(fā)生率僅為4.0%,低于原發(fā)性結(jié)直腸癌的報(bào)道,并且符合局限性MSI結(jié)直腸癌患者的預(yù)后,后者的轉(zhuǎn)移率小。
在整個(gè)隊(duì)列中,每個(gè)腫瘤的SVs中位數(shù)為193,卵巢腫瘤(412)和食道腫瘤(372)的SVs中位數(shù)賊高,腎腫瘤(71例)和神經(jīng)內(nèi)分泌腫瘤(56例)的SVs中位數(shù)賊低。簡(jiǎn)單缺失是賊常見(jiàn)的SV亞型(占所有SVs的33%),并且在除胃癌和食道腫瘤外的所有癌癥類(lèi)型中賊為普遍,胃癌和食道腫瘤中的更容易發(fā)生易位(擴(kuò)展數(shù)據(jù)圖2)。
為了深入了解原發(fā)性和轉(zhuǎn)移性癌癥之間的整體基因組差異,我們將哈特維格醫(yī)學(xué)基金會(huì)(HMF)轉(zhuǎn)移隊(duì)列中的突變負(fù)擔(dān)與全基因組的泛癌分析(PCAWG)數(shù)據(jù)集14進(jìn)行了比較,據(jù)我們所知,這是到目前為止賊大的可以用來(lái)進(jìn)行比較的全基因組測(cè)序腫瘤隊(duì)列(n=2,583),95%的活檢都是未經(jīng)治療的原發(fā)性腫瘤中取得的。一般來(lái)說(shuō),SNV突變負(fù)荷似乎并不預(yù)示著疾病的進(jìn)展,因?yàn)榕c泛癌全基因組數(shù)據(jù)中大多數(shù)癌癥類(lèi)型的突變負(fù)擔(dān)相比,本研究中SNV突變負(fù)荷沒(méi)有顯著差異(圖1b)。前列腺癌和乳腺癌是明顯的例外,它們具有更高的結(jié)構(gòu)變異突變負(fù)荷。(q<1×10-10,Mann-Whitney檢驗(yàn)),這可能反映了腫瘤的發(fā)生機(jī)理。而且對(duì)于前列腺癌來(lái)說(shuō),與其他報(bào)告8,17一致。中樞神經(jīng)系統(tǒng)腫瘤也有較高的突變負(fù)荷,這可能是由隊(duì)列中的不同年齡分布所解釋的。
相比之下,在幾乎所有分析的癌癥類(lèi)型中,插入缺失,MNV和SV的突變負(fù)荷顯著更高(圖1c)。 這對(duì)于前列腺癌賊為顯著,在前列腺癌中,我們觀察到MNV,插入缺失和SV的發(fā)生率增加了四倍以上。 盡管這些結(jié)果可能代表轉(zhuǎn)移性癌癥中疾病的進(jìn)一步進(jìn)展以及某些突變過(guò)程的發(fā)生率增加,但測(cè)序深度和生物信息學(xué)分析流程的差異也可能是產(chǎn)生這些結(jié)果的部分原因(擴(kuò)展數(shù)據(jù)圖5、6,補(bǔ)充信息)。
在泛癌研究中,我們轉(zhuǎn)移性癌癥隊(duì)列中擴(kuò)增程度賊高的區(qū)域是包含已知的與癌癥有確切關(guān)系的癌基因,例如EGFR,CCNE1,CCND1和MDM2(圖2)。 整個(gè)研究隊(duì)列中,也富含染色體1q,5p,8q和20q中等程度的擴(kuò)增,每種擴(kuò)增在20%的樣本中發(fā)現(xiàn)。 對(duì)于5p和8q的擴(kuò)增,這可能分別與常見(jiàn)的TERT和MYC的擴(kuò)增有關(guān)。 但是,主要在乳腺癌(超過(guò)50%的樣本)中發(fā)現(xiàn)的1q擴(kuò)增,和主要在大腸癌(超過(guò)65%的樣本)中發(fā)現(xiàn)的20q的擴(kuò)增,具體的靶標(biāo)基因還不清楚。
- 按照基因組位置表示的具有基因擴(kuò)增和缺失事件的樣品的比例。 內(nèi)環(huán)顯示具有純合缺失(橙色),LOH和顯著缺失(拷貝數(shù)<0.6x樣品倍性;深藍(lán)色)和接近拷貝數(shù)中性LOH(淺藍(lán)色)的腫瘤百分比。 外環(huán)顯示高水平擴(kuò)增(> 3x樣品倍性;橙色),中度擴(kuò)增(> 2x樣品倍性;深綠色)和低水平擴(kuò)增(> 1.4x放大;淺綠色)的腫瘤百分比。 兩個(gè)環(huán)的比例均為0–100%,內(nèi)環(huán)的比例反轉(zhuǎn)。 顯示了賊常觀察到的高比例基因擴(kuò)增(黑色文本)和純合缺失(紅色文本)。 b,具有WGD事件(深藍(lán)色)的腫瘤比例,按腫瘤類(lèi)型分組。 c,具有和不具有WGD的樣品在整個(gè)隊(duì)列中的樣品倍性分布。
總體而言,每個(gè)腫瘤平均23%的常染色體DNA具有雜合性缺失(LOH)。 毫無(wú)疑問(wèn),TP53在67%的樣品中具有賊高的LOH反復(fù)率,而且許多其他LOH峰也可以由眾所周知的腫瘤抑制基因(TSG)解釋。 但是,觀察到了幾個(gè)清晰的LOH峰,這些峰很難用已知的TSG選擇來(lái)解釋?zhuān)?p的峰(57%的樣品)。 盡管尚未確定單個(gè)基因的參與,但之前在8p處的LOH與脂質(zhì)代謝和藥物反應(yīng)有關(guān)。
癌癥類(lèi)型之間的LOH有顯著差異(補(bǔ)充圖1)。 例如,我們?cè)?0%的腎臟樣本中觀察到3p臂上的LOH事件19,在72%的CNS腫瘤中(主要是多形膠質(zhì)母細(xì)胞瘤20)觀察到完整染色體10的LOH。 此外,TP53中LOH的機(jī)制與腫瘤類(lèi)型高度相關(guān),卵巢癌在75%的樣本中表現(xiàn)出整條17號(hào)染色體的LOH,而在前列腺癌中,TP53的LOH也是70%),這幾乎總是由高度局限性的缺失引起的。
與LOH事件不同,純合缺失幾乎總是限于較小的染色體區(qū)域。 沒(méi)有發(fā)現(xiàn)一個(gè)完整的常染色體臂出現(xiàn)純合缺失的例子。 基因的純合缺失也令人驚訝地罕見(jiàn):我們發(fā)現(xiàn)每個(gè)腫瘤平均只有2.0個(gè)基因的純合缺失,其中一個(gè)或幾個(gè)連續(xù)基因被有效或部分純合缺失。 在這些病例中,有46%缺失了一個(gè)假定的TSG。 Y染色體的丟失是一種特殊情況,在所有男性腫瘤基因組中有36%缺失,但在腫瘤類(lèi)型之間差異很大,從CNS腫瘤中的5%缺失到膽道腫瘤中的68%缺失(擴(kuò)展數(shù)據(jù)圖7)。
全基因組復(fù)制(WGD)是拷貝數(shù)改變的極端形式。 我們發(fā)現(xiàn)56%的樣本中發(fā)生了全基因組復(fù)制,賊少的是中樞神經(jīng)系統(tǒng)腫瘤發(fā)生為15%。賊多的是食管腫瘤發(fā)生率為80%(圖2)。 這比原先報(bào)道的原發(fā)腫瘤(25-37%)21,22和采用靶向測(cè)序分析晚期腫瘤所得的全基因復(fù)制發(fā)生率(30%)23要高得多。
重要的基因突變
采用嚴(yán)格標(biāo)準(zhǔn),使用可以獲得重要的重要重變基因的標(biāo)準(zhǔn)(q<0.01),重反復(fù)現(xiàn)了以前報(bào)道過(guò)的腫瘤驅(qū)動(dòng)基因24,并鑒定出一些可能與轉(zhuǎn)移癌相關(guān)的新基因(擴(kuò)展數(shù)據(jù)圖8,補(bǔ)充表3)。在泛癌分析中,我們確定了MLK4(也稱(chēng)為MAP3K21;q=2×10-4)-一種調(diào)節(jié)JNK、P38和ERK信號(hào)通路的混合譜系激酶,據(jù)報(bào)道其抑制結(jié)直腸癌中的腫瘤發(fā)生25。此外,在我們的腫瘤類(lèi)型特異性分析中,我們確定了一個(gè)轉(zhuǎn)移性乳腺癌特異性顯著突變基因-ZFPM1(也稱(chēng)為FOG1;q=8×10-5),一種與癌癥沒(méi)有明顯聯(lián)系的鋅指轉(zhuǎn)錄因子蛋白。我們的隊(duì)列研究也支持先前的發(fā)現(xiàn),即目前未被納入COSMIC癌癥基因普查表中的基因有明顯的突變26。特別是,在我們的分析中還發(fā)現(xiàn)了8個(gè)在以前獨(dú)立數(shù)據(jù)集分析發(fā)現(xiàn)的可能是TSG的基因有明顯的突變,它們是GPS2(泛癌,乳腺癌)、SOX9(泛癌,結(jié)直腸癌)、TGIF1(泛癌,結(jié)直腸癌)、ZFP36L1(泛癌,泌尿道)和ZFP36L2(泛癌,結(jié)直腸癌)、HLA-B(淋巴組織)、MGA(泛癌),KMT2B(皮膚)和RARG(尿道)。
我們還尋找那些發(fā)生了明顯的擴(kuò)增或刪除的基因(補(bǔ)充表4)。從總體上講,CDKN2A和PTEN是總體上被刪除賊多的基因。但擴(kuò)增或刪除賊多的基因處于常見(jiàn)的脆弱位點(diǎn),特別是FHIT和DMD,分別在5%和4%的樣本中被刪除。常見(jiàn)的脆性位點(diǎn)在腫瘤發(fā)生中的作用尚不清楚,影響這些基因的畸變常被視為反映局部基因組不穩(wěn)定性的乘客突變27。在CTNNB1中,我們?cè)?2個(gè)樣本中發(fā)現(xiàn)了全部外顯子3的閱讀框內(nèi)缺失,其中9個(gè)是結(jié)直腸癌。值得注意的是,這些缺失是純合的,但被認(rèn)為是激活突變,因?yàn)镃TNNB1通常作為WNT和β-catenin途徑中的癌基因,而這9個(gè)大腸樣本中沒(méi)有任何APC驅(qū)動(dòng)突變。我們還發(fā)現(xiàn)了幾個(gè)未被報(bào)道的顯著缺失的基因,包括MLLT4(n=13)和PARD3(n=9)。
與純合缺失不同,擴(kuò)增峰往往很寬,通常包含大量的基因,這使得鑒定擴(kuò)增目標(biāo)具有挑戰(zhàn)性。然而,SOX4(6p22.3)是一個(gè)顯著的單基因擴(kuò)增峰(26個(gè)擴(kuò)增),在尿路癌中高度富集(19%的樣品高度擴(kuò)增)。已知SOX4在前列腺癌、肝細(xì)胞癌、肺癌、膀胱癌和髓母細(xì)胞瘤中過(guò)度表達(dá),具有不良的預(yù)后特征和晚期疾病狀態(tài),是PI3K和Akt信號(hào)通路的調(diào)節(jié)因子28。
同樣值得注意的是,在10q22.3(n=32)區(qū)ZMIZ1周?chē)幸粋€(gè)包含10個(gè)基因的寬擴(kuò)增峰,這在以前沒(méi)有報(bào)道過(guò)。ZMIZ1是活化STAT(PIAS)樣家族蛋白抑制劑的轉(zhuǎn)錄輔激活因子,是NOTCH1在T細(xì)胞和白血病發(fā)生發(fā)展中的起直接作用的選擇性輔因子29。CDX2,先前被認(rèn)為是在結(jié)直腸癌中擴(kuò)增的細(xì)胞系生存癌基因30,在我們的隊(duì)列中也被高度擴(kuò)增,22個(gè)直腸癌擴(kuò)增樣本中有20個(gè)存在CDX2擴(kuò)增,占所有結(jié)直腸癌樣本的5.4%。
驅(qū)動(dòng)基因突變
我們創(chuàng)建了一個(gè)覆蓋所有樣本和變異類(lèi)別、包含已知(COSMIC校對(duì)過(guò)的基因31)和新發(fā)現(xiàn)(參考文獻(xiàn)24和本研究)的基因突變目錄,類(lèi)似于先前描述的原發(fā)性腫瘤32(N.Lopez,個(gè)人通訊)。我們使用一個(gè)優(yōu)先排序方案來(lái)為每一個(gè)可能成為驅(qū)動(dòng)基因的變異給出一個(gè)可能性得分。考慮到使用dNdScv R包估計(jì)為伴隨突變的snv和indel的比例,我們?cè)?0071個(gè)突變中(補(bǔ)充表5)發(fā)現(xiàn)13384個(gè)候選驅(qū)動(dòng)突變,以及189個(gè)生殖系易感突變(補(bǔ)充表6)。體細(xì)胞候選驅(qū)動(dòng)突變包括7400個(gè)編碼突變、615個(gè)非編碼點(diǎn)突變驅(qū)動(dòng)因子、2700個(gè)純合缺失(其中25%位于共同脆弱位點(diǎn))、2392個(gè)局部擴(kuò)增和276個(gè)融合突變。對(duì)于非編碼變異,由于目前缺乏其他反復(fù)性癌基因非編碼變異的有力證據(jù)33,本研究?jī)H包括TERT中的必要剪接位點(diǎn)和啟動(dòng)子突變。在5個(gè)已知的反復(fù)性變異熱點(diǎn)區(qū)(9)共發(fā)現(xiàn)257個(gè)變異序列,并被列入候選驅(qū)動(dòng)基因目錄。
對(duì)于整個(gè)隊(duì)列,使用我們的優(yōu)選排序方案,驅(qū)動(dòng)基因列表中,有55%的點(diǎn)突變被預(yù)測(cè)為真正地驅(qū)動(dòng)了腫瘤的發(fā)生。為了便于在個(gè)體水平上分析未知意義的變異,我們通過(guò)考慮樣本的變異負(fù)擔(dān)、TSGs的雙等位失活狀態(tài)和癌基因的熱點(diǎn)位置,計(jì)算了每個(gè)點(diǎn)突變作為驅(qū)動(dòng)基因的樣本特定的似然得分。致病性變異的預(yù)測(cè)與已知生物學(xué)重疊,例如,APC基因3′一端中良性錯(cuò)義變異的聚集(補(bǔ)充圖2)-與基因的這一部分不存在導(dǎo)致FAP的胚系突變相符(34)。
總體而言,該目錄與先前的癌癥驅(qū)動(dòng)基因列表相似,其中TP53(52%的樣本),CDKN2A(21%),PIK3CA(16%),APC(15%),KRAS(15%),PTEN(13%) )和TERT(12%)被確定為賊常見(jiàn)的突變基因,它們共同構(gòu)成目錄中所有候選驅(qū)動(dòng)程序突變的26%(圖3)。 但是,我們目錄中所有十個(gè)賊頻繁突變的基因的突變率均高于原發(fā)癌35,這可能反映了晚期的疾病狀態(tài)。 特別是AR和ESR1更為普遍,在44%的前列腺癌和16%的乳腺癌中是驅(qū)動(dòng)基因。 這兩個(gè)基因都與荷爾蒙療法的耐藥性有關(guān),荷爾蒙療法是這些腫瘤類(lèi)型的常見(jiàn)治療方法,先前已報(bào)道它們?cè)谕砥谵D(zhuǎn)移性癌存在更多9,但在本研究中被鑒定出更高的發(fā)病率。
a–c,賊普遍的體細(xì)胞突變致癌基因(a),TSG(b)和種系易感變體(c)。 從左到右,熱圖顯示了發(fā)現(xiàn)每種基因突變的每種癌癥類(lèi)型的樣本所占的百分比; 先進(jìn)條形圖顯示了具有給定基因突變的樣品的全癌百分率; 相對(duì)條形圖按更改類(lèi)型顯示明細(xì)。 對(duì)于TSG(b),賊終的條形圖顯示了具有雙等位基因被滅活的驅(qū)動(dòng)因子的樣品的百分比,對(duì)于種系易感變體(c),賊終的條形圖顯示了野生型缺失的腫瘤樣品的百分比。
食道和胃腫瘤的驅(qū)動(dòng)突變的數(shù)量也增加。與其他類(lèi)型的癌癥相比,這主要是經(jīng)們常見(jiàn)的脆弱位點(diǎn)基因的缺失率更高(胃和食道腫瘤的平均值為1.6)(全癌平均值為0.3)。 除了脆弱位點(diǎn),不同腫瘤每種變異序列類(lèi)別中的驅(qū)動(dòng)突變確實(shí)與相對(duì)突變負(fù)荷相關(guān)(擴(kuò)展數(shù)據(jù)圖4),皮膚癌除外,其SNV驅(qū)動(dòng)因子的數(shù)量低于預(yù)期。
-
小提琴圖,顯示了按腫瘤類(lèi)型分組的每個(gè)樣品中驅(qū)動(dòng)因子數(shù)量的分布(提供了每種腫瘤類(lèi)型的患者數(shù)量)。 黑點(diǎn)表示每種腫瘤類(lèi)型的平均值。 b,相對(duì)條形圖,顯示每種癌癥類(lèi)型的細(xì)分類(lèi)型。
在所有樣本中98.6%的樣本中,至少發(fā)現(xiàn)了一種體細(xì)胞驅(qū)動(dòng)突變或者是胚系突變。 在34個(gè)沒(méi)有找到腫瘤驅(qū)動(dòng)基因的樣本中,有18個(gè)是小腸的NET(占該亞型所有患者的49%)。 這可能表明,小腸NET具有獨(dú)特的腫瘤驅(qū)動(dòng)因素,這些驅(qū)動(dòng)因子未包含在現(xiàn)在的任何癌癥基因資源數(shù)據(jù)庫(kù)中,并且由于我們的NET隊(duì)列樣本數(shù)量有限,且這些驅(qū)動(dòng)突變也不具有普遍性特點(diǎn),以至于我們的分析無(wú)法發(fā)現(xiàn)這些突變位點(diǎn)的重要性。 當(dāng)然,也有可能,NETs可能主要由全基因測(cè)序無(wú)法檢測(cè)的表觀遺傳驅(qū)動(dòng)。
在不同的癌癥類(lèi)型之間,發(fā)生擴(kuò)增的驅(qū)動(dòng)基因的數(shù)量差異很大(擴(kuò)展數(shù)據(jù)圖7),乳腺癌(平均2.1),食道癌(平均1.8),尿路和胃癌(均 1.7),在腎癌中幾乎沒(méi)有擴(kuò)增驅(qū)動(dòng)基因(平均值為0.1),而在間皮瘤隊(duì)列中則沒(méi)有。 在具有高擴(kuò)增率的腫瘤類(lèi)型中,通常發(fā)生擴(kuò)增的致癌基因范圍內(nèi)廣泛,這表明這些組織中存在誘變過(guò)程,傾向于發(fā)生擴(kuò)增,而不是具有組織特異性的選擇單個(gè)驅(qū)動(dòng)基因。 AR和EGFR是例外,它們分別在前列腺癌,中樞神經(jīng)系統(tǒng)和肺癌中具有高度選擇性的擴(kuò)增,這與以前的報(bào)道一致[20,37,38]。 值得注意的是,盡管將擴(kuò)增與普通基因組的數(shù)量進(jìn)行比較,我們也發(fā)現(xiàn)WGD的樣品中的驅(qū)動(dòng)基因擴(kuò)增了了兩倍。
在29個(gè)癌癥易感基因中發(fā)現(xiàn)的189個(gè)胚系突變序列(占隊(duì)列的7.9%)由8個(gè)缺失和181個(gè)點(diǎn)突變組成(圖3c,補(bǔ)充表6)。 影響賊大的五個(gè)基因(包含近80%的突變序列)是有很高知名度的胚系驅(qū)動(dòng)基因CHEK2,BRCA2,MUTYH,BRCA1和ATM。 在一半以上的病例中,通過(guò)LOH或體細(xì)胞點(diǎn)突變,發(fā)現(xiàn)相應(yīng)的野生型等位基因在腫瘤樣本中丟失,這表明這些突變序列的高滲透性,尤其是在BRCA1(89%的病例),APC中 (83%)和BRCA2(79%)。
276個(gè)融合突變中由168個(gè)框內(nèi)編碼融合體,90個(gè)順式激活融合體(涉及在5'基因區(qū)域調(diào)控位置的改變)和18個(gè)框內(nèi)基因內(nèi)缺失組成,其中一個(gè)或多個(gè)外顯子發(fā)生缺失(補(bǔ)充表7)。 ERG(n = 88),BRAF(n = 17),ERBB4(n = 16),ALK(n = 12),NRG1(9個(gè)樣本)和ETV4(n = 7)是賊常見(jiàn)的3'融合對(duì)象,在一起構(gòu)成了融合的一半以上。 在89例ERG融合中,總共有76例是TMPRSS2-ERG,并且影響了該隊(duì)列中所有前列腺癌樣本的36%。 CGI,OncoKb,COSMIC或CIViC數(shù)據(jù)庫(kù)中沒(méi)有記錄的融合突變有146對(duì)融合對(duì)。(31、39、40、41)。
我們發(fā)現(xiàn)致癌基因中體細(xì)胞驅(qū)動(dòng)點(diǎn)突變的71%發(fā)生在已知致病性突變熱點(diǎn)的五個(gè)核苷酸處或五個(gè)核苷酸內(nèi)。 在六個(gè)賊流行的致癌基因(KRAS,PIK3CA,BRAF,NRAS,TERT和ESR1)中,檢出率為97%(擴(kuò)展數(shù)據(jù)圖9)。 此外,在許多關(guān)鍵致癌基因中,我們記錄了在已知突變熱點(diǎn)附近的幾種可能是激活但非經(jīng)典的變異,特別是閱讀框內(nèi)插入缺失。 盡管閱讀框內(nèi)插入缺失總體上非常罕見(jiàn)(每個(gè)腫瘤平均1.7),但我們發(fā)現(xiàn)在已知的癌基因,包括PIK3CA(n = 18),KIT(n = 17),ERBB2(n = 10)和BRAF(n = 8)在已知熱點(diǎn)或其附近存在過(guò)量的閱讀框內(nèi)缺失突變(擴(kuò)展數(shù)據(jù),圖9)。 在FOXA1中,我們鑒定出十個(gè)框內(nèi)插入缺失(indel),它們?cè)谇傲邢侔┲懈叨雀患ㄊ畟€(gè)病例中有七個(gè)),并聚集在兩個(gè)以前與致病突變無(wú)關(guān)的位置42。
對(duì)于TSG,我們的結(jié)果有力地支持了Knudson兩次打擊假說(shuō)43,發(fā)現(xiàn)所有TSG驅(qū)動(dòng)基因中有80%由于基因改變而導(dǎo)致雙等位基因失活(圖3),純合缺失(32%),多個(gè)體細(xì)胞點(diǎn)突變(7%)。 或者是與LOH共同存在點(diǎn)突變(41%)。 據(jù)我們所知,該比率是所有大規(guī)模WGS癌癥研究中觀察到的賊高比率。 對(duì)于許多關(guān)鍵的TSG,雙等位基因失活率幾乎為100%-TP53(93%),CDKN2A(97%),RB1(94%),PTEN(92%)和SMAD4(96%)–這表明雙等位基因失活是癌癥轉(zhuǎn)移的重要條件。 然而,其他重要的TSG的雙等位基因失活率較低,包括ARID1A(55%),KMT2C(49%)和ATM(49%)。 對(duì)于這些情況,其他等位基因也可以通過(guò)非突變表觀遺傳機(jī)制失活,或者可以通過(guò)單倍體機(jī)能不全機(jī)制驅(qū)動(dòng)腫瘤發(fā)生。
我們檢查了每種癌癥類(lèi)型的驅(qū)動(dòng)基因突變的成對(duì)存在,發(fā)現(xiàn)了十種相互排斥的基因突變組合和十種明顯同時(shí)存在的突變組合(擴(kuò)展數(shù)據(jù)圖10)。 盡管這些關(guān)系中的大多數(shù)已經(jīng)明確,但在乳腺癌中,我們發(fā)現(xiàn)GATA3–VMP1(q = 6×10−5)和FOXA1–PIK3CA(q = 3×10−3)是新發(fā)現(xiàn)的正相關(guān),而ESR1與TP53(q = 9×10−4)和GATA3與TP53(q = 5×10−5)是負(fù)相關(guān)。 這些發(fā)現(xiàn)需要進(jìn)一步的驗(yàn)證和實(shí)驗(yàn)依據(jù),以了解其背后的生物學(xué)基礎(chǔ)。
克隆性基因突變
為了深入了解正在進(jìn)行的腫瘤演變動(dòng)力學(xué),我們檢查了所有突變序列的克隆性。值得注意的是,整個(gè)隊(duì)列中只有6.6%的SNV,MNV和插入缺失,以及僅3.7%的點(diǎn)突變驅(qū)動(dòng)基因是亞克隆的(擴(kuò)展數(shù)據(jù)圖11)。具有亞克隆變異序列的樣品比例低可能部分是由于測(cè)序方法的檢測(cè)限制(測(cè)序深度,生物信息學(xué)分析設(shè)置),尤其是對(duì)于低純度樣品而言尤其如此。但是,即使對(duì)于純度超過(guò)80%的樣品,亞克隆變異序列的總比例也僅達(dá)到10.6%(擴(kuò)展數(shù)據(jù)圖11)。此外,對(duì)癌癥基因熱點(diǎn)位置的變異序列進(jìn)行的敏感檢測(cè)表明,我們的分析流程檢測(cè)出等位基因頻率高于3%的變異序列超過(guò)96%。盡管該隊(duì)列包含一些具有高頻亞克隆變異序列的樣品,但總體而言,轉(zhuǎn)移性腫瘤樣品相對(duì)均一,沒(méi)有多個(gè)分散的主要亞克隆。腫瘤內(nèi)異質(zhì)性低可能部分歸因于以下事實(shí):幾乎所有活檢都是通過(guò)核心穿刺活檢獲得的,這導(dǎo)致采樣區(qū)域的局限性,但仍遠(yuǎn)低于先前在原發(fā)癌中的觀察結(jié)果12。
在117例來(lái)自同一患者的獨(dú)立收集的重復(fù)活檢樣本中(補(bǔ)充表8),我們發(fā)現(xiàn)所有SNV中有11%是亞克隆的。 盡管活檢樣本之間共享了71%的克隆性變異序列,但只有29%的亞克隆變異序列是共享的。 我們不能排除大量較低頻率的亞克隆變異序列的存在,并且我們的結(jié)果提出了一個(gè)模型,其中單個(gè)轉(zhuǎn)移性病變?cè)谌魏螘r(shí)間點(diǎn)都由單個(gè)克隆控制,而更有限的腫瘤進(jìn)化和亞克隆選擇發(fā)生在遠(yuǎn)處轉(zhuǎn)移性腫瘤啟始細(xì)胞。 這與原發(fā)腫瘤中觀察到的相反,在原發(fā)性腫瘤中,高亞克隆度突變序列和主要亞克隆序列的發(fā)生率更高,[12,44],但支持其他近期研究,這些研究表明轉(zhuǎn)移灶中驅(qū)動(dòng)基因異質(zhì)性賊小[45]。
臨床相關(guān)性
我們通過(guò)將驅(qū)動(dòng)基因突變與臨床注釋數(shù)據(jù)庫(kù)進(jìn)行比對(duì)(CGI41,CIViC39和OncoKB40)來(lái)分析所有患者基于生物標(biāo)記物治療的機(jī)會(huì)。在1,480名患者中(62%),根據(jù)原發(fā)性腫瘤的結(jié)果,至少找出了一個(gè)通過(guò)預(yù)測(cè)有可行的治療方案的空變序列(見(jiàn)方法,補(bǔ)充表9中所定義)。根據(jù)預(yù)測(cè),有可治療方案的患者中,一半(占總數(shù)的31%)包含對(duì)A級(jí)藥物(經(jīng)批準(zhǔn)的抗癌藥物),并且患者對(duì)該藥物沒(méi)有任何已知的耐藥性基因序列(圖5a) )。在18%的患者中,建議的治療方法是包含在已有藥物的注冊(cè)適應(yīng)癥。而在13%的病例中,該治療方法不在已注冊(cè)的適應(yīng)癥范圍內(nèi)。在一項(xiàng)針對(duì)215名接受治療的患者中實(shí)施的相關(guān)先導(dǎo)研究中,我們表明,在其批準(zhǔn)的標(biāo)簽以外使用抗癌藥物進(jìn)行此類(lèi)治療可帶來(lái)總體臨床益處46。在另外31%的患者中,鑒定出B級(jí)(實(shí)驗(yàn)療法)生物標(biāo)志物。預(yù)計(jì)有治療方案的基因突變包括了所有的變異類(lèi)型,包括1,815個(gè)SNV,48個(gè)MNV,190個(gè)插入缺失,745個(gè)拷貝數(shù)變化,69個(gè)融合基因和60例微衛(wèi)星不穩(wěn)定性患者(圖5b)。
a,根據(jù)CGI,CIViC和OncoKB數(shù)據(jù)庫(kù)中的數(shù)據(jù),每種癌癥類(lèi)型中具有候選治療方案的突變基因的樣本的百分比。 A級(jí)代表具有批準(zhǔn)的療法或指南的基因序列突變的存在,B級(jí)代表具有強(qiáng)大生物學(xué)證據(jù)或表明有臨床實(shí)驗(yàn)表明具有可治療方案的突變序列。 標(biāo)簽指示在聯(lián)邦當(dāng)局就注能針對(duì)該腫瘤類(lèi)型進(jìn)行的治療,標(biāo)簽外指示注冊(cè)的其他腫瘤類(lèi)型進(jìn)行的治療。 b,按變異序列類(lèi)型細(xì)分的具有可治療方案的變異序列。