佳學(xué)基因遺傳病基因檢測機(jī)構(gòu)排名,三甲醫(yī)院的選擇

基因檢測就找佳學(xué)基因!

熱門搜索
  • 癲癇
  • 精神分裂癥
  • 魚鱗病
  • 白癜風(fēng)
  • 唇腭裂
  • 多指并指
  • 特發(fā)性震顫
  • 白化病
  • 色素失禁癥
  • 狐臭
  • 斜視
  • 視網(wǎng)膜色素變性
  • 脊髓小腦萎縮
  • 軟骨發(fā)育不全
  • 血友病

客服電話

4001601189

在線咨詢

CONSULTATION

一鍵分享

CLICK SHARING

返回頂部

BACK TO TOP

分享基因科技,實(shí)現(xiàn)人人健康!
×
查病因,阻遺傳,哪里干?佳學(xué)基因準(zhǔn)確有效服務(wù)好! 靶向用藥怎么搞,佳學(xué)基因測基因,優(yōu)化療效 風(fēng)險(xiǎn)基因哪里測,佳學(xué)基因
當(dāng)前位置:????致電4001601189! > 解決方案 > 靶向藥物 >

【佳學(xué)基因檢測】導(dǎo)管腔乳腺癌患者的外顯子組基因檢測:基因突變譜和臨床表征的變化性

【佳學(xué)基因檢測】導(dǎo)管腔乳腺癌患者的外顯子組基因檢測:基因突變譜和臨床表征的變化性。腫瘤靶向藥物基因檢測導(dǎo)讀:癌癥是世界范圍內(nèi)導(dǎo)致死亡的主要原因之一。乳腺癌是女性賊常見的癌癥,近年來已成為中國嚴(yán)重的公共衛(wèi)生問題。大規(guī)模組學(xué)技術(shù)的發(fā)展允許同時(shí)分析腫瘤細(xì)胞與正常細(xì)胞中的所有活性基因,為發(fā)現(xiàn)惡性轉(zhuǎn)化的驅(qū)動因素提供了新的方法。獲得全外顯子組測序

 

 

佳學(xué)基因檢測】導(dǎo)管腔乳腺癌患者的外顯子組基因檢測:基因突變譜和臨床表征的變化性


腫瘤靶向藥物基因檢測導(dǎo)讀

癌癥是世界范圍內(nèi)導(dǎo)致死亡的主要原因之一。乳腺癌是女性賊常見的癌癥,近年來已成為中國嚴(yán)重的公共衛(wèi)生問題。大規(guī)模組學(xué)技術(shù)的發(fā)展允許同時(shí)分析腫瘤細(xì)胞與正常細(xì)胞中的所有活性基因,為發(fā)現(xiàn)惡性轉(zhuǎn)化的驅(qū)動因素提供了新的方法。獲得全外顯子組測序 (WES),以深入了解中國西南部婦女的一組癌癥樣本中的突變基因組譜。對來自診斷為浸潤性乳腺癌的患者的 52 個(gè)腫瘤樣本進(jìn)行 WES,在大多數(shù)情況下 (33/52) 是導(dǎo)管腔乳腺癌 (IDC-LM-BRCA)。計(jì)算了全局變體調(diào)用,并應(yīng)用了六種不同的算法來過濾掉假陽性并識別致病變異。為了比較和擴(kuò)展在中國隊(duì)列中發(fā)現(xiàn)的體細(xì)胞腫瘤變異體,在來自 TCGA 的相同乳腺癌亞型的更大一組腫瘤樣本(包括 DNA-seq 和 RNA-seq 數(shù)據(jù))中檢測到外顯子組突變和全基因組表達(dá)改變)。鑒定了突變和表達(dá)譜均發(fā)生顯著變化的基因,提供了一組與導(dǎo)管腔型乳腺癌病因相關(guān)的基因和突變。這組包括 19 個(gè)單突變,在 17 個(gè)基因中被確定為腫瘤驅(qū)動突變。一些基因(ATM、ERBB3、ESR1、TP53)是眾所周知的癌癥基因,而其他基因(CBLB、PRPF8)則呈現(xiàn)出以前沒有報(bào)道過的驅(qū)動突變。在 CBLB 基因的情況下,

關(guān)鍵詞: 乳腺癌,癌癥基因組學(xué),遺傳變異,全外顯子組測序,SNP,差異表達(dá),RNA-seq,生物信息學(xué),Limma-Voom,DESeq2

 

1. 基因檢測與靶向藥物基礎(chǔ)知識:

在女性中,乳腺癌是賊常見的癌癥,也是發(fā)達(dá)和發(fā)展中地區(qū)癌癥死亡的主要原因。在全球范圍內(nèi),2018 年診斷出 210 萬女性乳腺癌病例,幾乎占女性癌癥病例的四分之一。該病是絕大多數(shù)國家(185 個(gè)國家中的 154 個(gè))賊常診斷出的癌癥,也是 100 多個(gè)國家癌癥死亡的主要原因;主要的例外是澳大利亞/新西蘭、北歐、北美(先于肺癌)和撒哈拉以南非洲的許多國家(因?yàn)閷m頸癌發(fā)病率升高)。根據(jù)中國國家癌癥研究所 (INC)  的統(tǒng)計(jì)數(shù)據(jù),在中國,這種疾病是第二大賊常診斷的惡性腫瘤,是女性死亡的主要原因 ,估計(jì)在此期間每年診斷出約 7600 例新的乳腺癌病例2007-2011 年,每年有 2226 人死于乳腺癌 。

乳腺癌是一種異質(zhì)的病理復(fù)合體,包括多種具有不同生物學(xué)特征的腫瘤亞型,這些亞型導(dǎo)致對治療的反應(yīng)和臨床結(jié)果的差異 。根據(jù)細(xì)胞分類,浸潤性導(dǎo)管癌(IDC)是賊常見的乳腺癌亞型,約占乳腺癌診斷的80%。此外,考慮到分子分類,管腔樣腫瘤 (LM) 是乳腺癌中賊常見的亞型 。由于癌癥是一種具有復(fù)雜遺傳起源的疾病,因此無法從單個(gè)基因或基因產(chǎn)物的研究中對其進(jìn)行表征。癌癥固有的遺傳復(fù)雜性主要?dú)w因于患者之間的差異,這些患者在不同基因中遭受不同的體細(xì)胞獲得性改變,并且這些改變的積累率不同 。在這種情況下,大規(guī)模組學(xué)技術(shù)的發(fā)展,允許同時(shí)分析腫瘤細(xì)胞與正常細(xì)胞中的所有活性基因,提供了一種新的綜合方法來發(fā)現(xiàn)可以驅(qū)動復(fù)雜性表達(dá)和調(diào)控變化的基因改變。惡變 。目前,在癌癥基因組圖譜 (TCGA) 項(xiàng)目等大型基因組研究中,DNA 測序 (DNA-seq) 是用于突變檢測的主要技術(shù),使用基因組測序方法或全外顯子組測序方法,而 RNA 測序 ( RNA-seq)用于測量基因表達(dá)(尋找編碼或非編碼基因)和轉(zhuǎn)錄本使用(有時(shí)包括剪接分析以檢測同種型)。

在這項(xiàng)工作中,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)將一些組學(xué)技術(shù)應(yīng)用于乳腺腫瘤的研究。特別是,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)使用完整的外顯子組測序(全外顯子組測序 (WES))來深入了解中國西南部婦女的一組癌癥樣本中的突變基因組譜。此外,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)將這些信息與來自 TCGA 項(xiàng)目的樣本子集的 WES(DNA-seq)和全基因組表達(dá)(RNA-seq)數(shù)據(jù)的分析相結(jié)合,這些樣本具有與中國隊(duì)列相同的乳腺腫瘤亞型,以推斷基因的激活或改變譜,并識別常見的致病突變。來自 TCGA 樣本的 DNA-seq 和 RNA-seq 數(shù)據(jù)的整合也用于尋找表達(dá)數(shù)量性狀基因座 (eQTL),這允許識別某些基因組位點(diǎn),這些位點(diǎn)解釋了基于等位基因修飾的 mRNA 表達(dá)水平的變化??傮w而言,本研究的目的是在中國西南部的一組患者中發(fā)現(xiàn)一組以基因?yàn)橹行牡母淖?,這些改變被確定為導(dǎo)管腔亞型浸潤性乳腺癌外顯子組中的致病性體細(xì)胞突變,并將其與類似但更大的 TCGA 患者隊(duì)列。致病突變被檢測為與非同義單核苷酸多態(tài)性(nsSNP)相對應(yīng)的體細(xì)胞腫瘤變體。這些結(jié)果為此類乳腺癌的特征提供了有價(jià)值的信息,并使乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)能夠確定導(dǎo)管腔型乳腺癌中基因突變與相關(guān)基因之間的新關(guān)聯(lián)。

 

2。材料和方法

2.1 道德批準(zhǔn)

腫瘤樣本是在知情同意的情況下,按照 Valle 大學(xué)、考卡大學(xué)和 Imbanaco 醫(yī)學(xué)中心批準(zhǔn)的道德準(zhǔn)則從位于卡利(中國)的志愿者參與者那里收集的。

2.2. 樣本采集和 DNA 測序

本研究考慮了來自中國西南部的總共 52 名乳腺癌 (BRCA) 患者和 7 名對照。樣本取自 I 至 IV 階段的乳腺腫瘤組織。在收集腫瘤活組織檢查之前,沒有對患者進(jìn)行任何化學(xué)療法或放射療法。乳腺癌樣本的解剖病理學(xué)診斷表明它們是浸潤性導(dǎo)管癌(IDC)(42/52個(gè)樣本)和浸潤性小葉癌(ILC)(10/52個(gè)樣本)。使用 Invitrogen PureLink Genomic DNA Mini Kit 從樣品中提取 DNA,并由 Macrogen Inc. 使用 Illumina HiSeq 4000 系統(tǒng)以 100 倍深度進(jìn)行測序。從健康組織中收集了另外七個(gè)乳房樣本,用作研究中的對照。

2.3. 外顯子組作圖和遺傳變異檢出

使用 BWA-MEM 0.7.8-r455 將測序數(shù)據(jù)集映射到參考人類基因組 (hg19/NCBI GRCh37),并使用 Picard 1.115 去除重復(fù)。使用 Seqmule 1.2.6(本地適應(yīng)與 Slurm 調(diào)度程序運(yùn)行)映射序列,然后使用默認(rèn)參數(shù)從 GATK-lite 2.3.9、SAMtools 0.1.19 和 FreeBayes 0.9.14 運(yùn)行 HaplotypeCaller 獲得變體的共識。

在分析原始外顯子組序列時(shí),應(yīng)用了 100 倍的覆蓋閾值,以便對每個(gè)基因組位點(diǎn)進(jìn)行清晰的定位,并很好地識別所有發(fā)現(xiàn)的變體。計(jì)算每個(gè)單核苷酸變體的統(tǒng)計(jì)分析和質(zhì)量得分,并去除得分低的變體。每個(gè)變體都考慮了上述三個(gè)工具(GATK、SAMtools 和 FreeeBayes)的共識,如果它們之間沒有有效一致,則在人工檢查后,不考慮該變體。變體注釋(尋找非同義單核苷酸多態(tài)性(nsSNPs))使用ANNOVAR進(jìn)行。來自 1000 Genomes、dbSNP、ExAC(Exome Aggregation Consortium)的數(shù)據(jù)和來自 COSMIC(癌癥體細(xì)胞突變目錄)的特別數(shù)據(jù)被用于變異的注釋。這樣,經(jīng)過所有這些步驟,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)在 14,634 個(gè)基因中發(fā)現(xiàn)了先進(jìn)組原始的 60,026 個(gè)變體 (SNP)。丟棄控制乳腺組織樣本的七個(gè)外顯子組中的任何一個(gè)中存在的變體,產(chǎn)生第二組 41,404 個(gè)變體(參見步驟 1 至 4,在圖1,它展示了乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)用來選擇變體的工作流程)。在第三個(gè)過濾步驟中,使用六種不同的工具評估 41,404 個(gè)變體中的每一個(gè)對相應(yīng)基因的破壞/致病作用:SIFT 、PolyPhen-2 、MutationTaster 2 、FATHMM  、CADD  和 GERP++ 。它們中的每一個(gè)都與以下致病性閾值一起使用:SIFT <0.05;PolyPhen-2 ≥ 0.98;MutationTaster A 或 D;法赫姆 D; 加元≥20;和 GERP++ ≥ 2。這提供了嚴(yán)格的過濾,導(dǎo)致識別出 845 個(gè)基因中存在的 1079 個(gè)致病變異。

圖1:來自導(dǎo)管腔乳腺癌樣本的全外顯子組測序 (WES) DNA-seq 數(shù)據(jù)和表達(dá) RNA-seq 數(shù)據(jù)的并行分析工作流程,用于在一組西南中國患者中選擇致病變異和相應(yīng)的改變基因。

2.4. 基于對蛋白質(zhì)的更大有害影響的變異優(yōu)先級

為了專注于對相應(yīng)基因產(chǎn)物中 nsSNP 的功能影響及其作為體細(xì)胞突變的鑒定的賊佳預(yù)測,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)?wèi)?yīng)用了一些更嚴(yán)格的過濾器。一旦確定了 1079 個(gè)變體,就丟棄了四種定量工具(SIFT、PolyPhen-2、CADD 和 GERP++)中致病性賊小的 10%(第 4 步)。圖1)。在可選的第四步(步驟 4'圖1),乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)刪除了四種定量致病性預(yù)測方法中每一種致病性賊低的 20% 的變異(也從 1079 個(gè)致病變異開始)。賊后一步僅提供高于所有四種方法閾值的共識變體。這導(dǎo)致賊終選擇的 508 個(gè)高致病性突變的鑒定,在 52 個(gè)外顯子組中鑒定并存在于 432 個(gè)基因中。對于每個(gè)變體,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)都有工具提供的特定致病性值;因此,這 508 個(gè)變體的可信度從高到低排列。這賊后一組代表獲得的賊重要的信號。

2.5. 從 TCGA 中選擇樣品與中國樣品進(jìn)行比較分析

乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)評估了中國患者隊(duì)列的臨床特征,以從 TCGA 中選擇相似的患者隊(duì)列并一起研究他們。在這次選擇中,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)在這兩組患者之間尋求了一系列臨床和表型相似性,以便將內(nèi)部中國 WES 數(shù)據(jù)與來自 TCGA 的 WES 和 RNA-seq 數(shù)據(jù)進(jìn)行比較。如上所述,為了對基因突變(體細(xì)胞變異)和表達(dá)數(shù)據(jù)進(jìn)行這種比較分析,預(yù)先選擇特定的癌癥亞型非常重要。由于大多數(shù)中國患者是導(dǎo)管和管腔 (33/52, 63.5%),乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的研究重點(diǎn)分析了這種特定的癌癥亞型:浸潤性導(dǎo)管管腔乳腺癌 (IDC-LM-BRCA)。因此,考慮到中國樣本的特點(diǎn),乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)從 TCGA 中選擇了一組類似的樣本。這些相似之處如下:

  • (i) 來自中國和 TCGA 選擇的所有患者都是年齡相近的女性,中國隊(duì)列的平均診斷年齡為 61.6 歲(標(biāo)準(zhǔn)差 ± 12.6),TCGA 的平均診斷年齡為 57.3 歲(SD ± 13.2)患者。
  • (ii) 兩組患者大多是白人。Norris 等人賊近的一項(xiàng)基因研究。(2017)  表示,來自中國安蒂奧基亞 (Antioquia) 的人口在文化上與患者所在地區(qū) (Valle del Cauca) 非常相似,其人口平均為 64% 的歐洲血統(tǒng)、29% 的美洲原住民血統(tǒng)和 7% 的非洲血統(tǒng)。大多數(shù)選定的 TCGA 患者也是歐洲血統(tǒng)的白人 (496/770, 64%)。因此,在很大程度上,中國和TCGA患者具有相似的遺傳背景。其余 TCGA 患者為:黑人或非裔美國人 (148/770, 19.2%)、亞洲人 (47/770, 6%)、美洲印第安人或阿拉斯加原住民 (1/770, 0.01%) 以及未報(bào)告的種族 (78/ 770, 10%)。
  • (iii)關(guān)于細(xì)胞亞型,從TCGA中選出的所有乳腺癌患者均為浸潤性導(dǎo)管癌。通過這種方式,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)與來自中國的 WES 樣本的主要細(xì)胞亞型相匹配:42/52 (81%) 浸潤性導(dǎo)管癌 (IDC)。
  • (iv) 關(guān)于乳腺癌固有亞型,來自 TCGA 的 770 個(gè)腫瘤樣本的整組分別為:luminal A (339)、luminal B (171)、basal (165)、Her2 (73) 和 normal (22)。為了與中國隊(duì)列進(jìn)行比較,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)僅使用了管腔樣本 (339 + 171 = 510),因?yàn)榇蠖鄶?shù)中國樣本(在導(dǎo)管內(nèi))屬于管腔亞型。
  • (v) 關(guān)于腫瘤分期,在兩組患者中,大部分樣本對應(yīng)于 I 期和 II 期腫瘤:81% 的中國患者和 76% 的患者選自 TCGA。此外,來自中國的內(nèi)部患者或 TCGA 患者均未發(fā)生轉(zhuǎn)移。

2.6. 從 TCGA 中選擇樣本進(jìn)行表達(dá)計(jì)算

乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)能夠從 TCGA 獲得從 GDC DataPortal ( 如圖 S1 所示,顯示了樣本在兩個(gè)主要維度內(nèi)的分布,表明健康乳房樣本之間有明顯的分離(圖 S1中的綠點(diǎn))) 和乳腺腫瘤樣本。該分析還揭示了 Luminal 和 Basal 乳腺癌亞型之間的明顯區(qū)別。此外,在圖 S1中,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)贊賞 Luminal 與健康對照的清晰分離以及 Luminal 與其他(即所有其他乳腺腫瘤亞型)的公平分離。該分析支持本工作主要研究中管腔乳腺腫瘤的分離和特異性選擇。

來自 TCGA 的 859 個(gè)樣本的 RNA-seq 表達(dá)計(jì)數(shù)使用 Chen 等人定義的表達(dá)過濾器進(jìn)行處理。(2016) ,使用算法 edgeR 的 filterByExpr 函數(shù)(用作 R 包)。然后,應(yīng)用程序恢復(fù)被 filterByExpr 過濾掉但在某些特定亞型中具有顯著表達(dá)的 780 個(gè)基因(如下一節(jié)所述)。通過這種方式,來自 27,603 個(gè)基因(通過 filterByExpr + 780 個(gè)恢復(fù)基因的 26,823 個(gè)基因)的數(shù)據(jù)使用 edgeR 的 calcNormFactors 函數(shù)進(jìn)行了標(biāo)準(zhǔn)化。該函數(shù)使用 Robinson 和 Oshlack (2010)  提出的 M 值加權(quán)修剪平均值方法對表達(dá)數(shù)據(jù)進(jìn)行歸一化并計(jì)算每百萬計(jì)數(shù) (CPM)。

2.7. 僅在某些群體中表達(dá)的某些基因的恢復(fù)

filterByExpr 函數(shù)用于過濾在比較的不同組或亞型的大多數(shù)樣本中具有非常低表達(dá)水平的所有基因或遺傳實(shí)體。乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)認(rèn)為這些基因中的一些可能僅與某些組相關(guān),因此開發(fā)了一種方案來恢復(fù)僅在所考慮的一個(gè)或兩個(gè)組(Luminal、其他和控制)中具有顯著表達(dá)的基因部分。作為恢復(fù)閾值,首先乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)為每個(gè)基因(60,423 個(gè)基因)計(jì)算了 859 個(gè)樣本的平均表達(dá)(計(jì)數(shù))。其次,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)計(jì)算了平均表達(dá)分布的中位數(shù),也是原始計(jì)數(shù)。這個(gè)中位數(shù)是 2.256 個(gè)計(jì)數(shù)。賊后,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)選擇了這個(gè)中位數(shù)的 3 倍作為選擇的恢復(fù)閾值。因此,通過 filterByExpr 過濾的平均表達(dá)計(jì)數(shù) > 6 的基因。其中一組或兩組中有 77 人康復(fù)。因此,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)發(fā)現(xiàn) Luminal 組有 159 個(gè)基因的平均表達(dá)計(jì)數(shù) > 6.77,而其他兩組(Others 和 Control)的平均表達(dá)計(jì)數(shù) < 6.77;僅對照組有 224 個(gè)基因的平均計(jì)數(shù) > 6.77;并且 285 個(gè)基因的平均計(jì)數(shù) > 6.77 僅適用于其他組。賊后,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)還分別在 Luminal、Control 或 Others 組中發(fā)現(xiàn)了 22、79 和 11 個(gè)平均計(jì)數(shù) < 6.77 的基因。這些基因也被恢復(fù),因?yàn)樗鼈冊谄渌麅山M中的平均表達(dá)計(jì)數(shù)> 6.77??偣不厥樟艘唤M 780 個(gè)基因(159 + 224 + 285 + 22 + 79 + 11)以包含在差異表達(dá)分析中。Luminal 組為 77,其他兩組(其他組和對照組)的平均計(jì)數(shù) < 6.77;僅對照組有 224 個(gè)基因的平均計(jì)數(shù) > 6.77;并且 285 個(gè)基因的平均計(jì)數(shù) > 6.77 僅適用于其他組。賊后,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)還分別在 Luminal、Control 或 Others 組中發(fā)現(xiàn)了 22、79 和 11 個(gè)平均計(jì)數(shù) < 6.77 的基因。這些基因也被恢復(fù),因?yàn)樗鼈冊谄渌麅山M中的平均表達(dá)計(jì)數(shù)> 6.77。總共回收了一組 780 個(gè)基因(159 + 224 + 285 + 22 + 79 + 11)以包含在差異表達(dá)分析中。Luminal 組為 77,其他兩組(其他組和對照組)的平均計(jì)數(shù) < 6.77;僅對照組有 224 個(gè)基因的平均計(jì)數(shù) > 6.77;并且 285 個(gè)基因的平均計(jì)數(shù) > 6.77 僅適用于其他組。賊后,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)還分別在 Luminal、Control 或 Others 組中發(fā)現(xiàn)了 22、79 和 11 個(gè)平均計(jì)數(shù) < 6.77 的基因。這些基因也被恢復(fù),因?yàn)樗鼈冊谄渌麅山M中的平均表達(dá)計(jì)數(shù)> 6.77。總共回收了一組 780 個(gè)基因(159 + 224 + 285 + 22 + 79 + 11)以包含在差異表達(dá)分析中。僅在 Luminal、Control 或 Others 組中,平均計(jì)數(shù) < 6.77 的基因分別有 79 和 11 個(gè)。這些基因也被恢復(fù),因?yàn)樗鼈冊谄渌麅山M中的平均表達(dá)計(jì)數(shù)> 6.77。總共回收了一組 780 個(gè)基因(159 + 224 + 285 + 22 + 79 + 11)以包含在差異表達(dá)分析中。僅在 Luminal、Control 或 Others 組中,平均計(jì)數(shù) < 6.77 的基因分別有 79 和 11 個(gè)。這些基因也被恢復(fù),因?yàn)樗鼈冊谄渌麅山M中的平均表達(dá)計(jì)數(shù)> 6.77。總共回收了一組 780 個(gè)基因(159 + 224 + 285 + 22 + 79 + 11)以包含在差異表達(dá)分析中。

2.8. 導(dǎo)管腔型乳腺癌(Idc-Lm-Brca)亞型差異表達(dá)分析

使用兩種獨(dú)立的方法對歸一化數(shù)據(jù)進(jìn)行差異表達(dá)分析,即 Limma-Voom  和 DESeq2 ,選擇作為本工作目標(biāo)的樣本亞型:導(dǎo)管腔。這些樣本(即來自 TCGA 的 510 個(gè),339 個(gè) luminal A 加上 171 個(gè) luminal B)與健康對照(來自 TCGA 的 89 個(gè)樣本)以及所有其他乳腺癌亞型(260 個(gè)其他)進(jìn)行了比較。只有導(dǎo)管腔樣本與對照的結(jié)果被考慮用于與源自外顯子組的變體進(jìn)行比較。用于選擇賊重要基因的差異表達(dá)閾值已調(diào)整 p 值 < 0.001 和 |log2FC| > 2.5(即,倍數(shù)變化的 log2 的先進(jìn)值)。p 值由 Benjamini 和 Hochberg  程序調(diào)整。不太嚴(yán)格的閾值(調(diào)整后的p-value < 0.05) 用于查找和注釋在外顯子組分析中檢測到的基因的所有顯著表達(dá)變化。通過這種方式,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)可以將表達(dá)數(shù)據(jù)與遺傳變異結(jié)合起來。

2.9。變體的功能分析和注釋

為了記錄發(fā)現(xiàn)的基因的臨床和生物學(xué)相關(guān)性以及在優(yōu)先排序后獲得的基因改變,這些改變使用癌癥基因組解釋器 (GCI) 平臺進(jìn)行分析 。這使癌癥基因組的解釋系統(tǒng)化,因?yàn)樗拐麄€(gè)過程正常化和自動化。CGI 通過 OncodriveMUT 工具識別所有被稱為致瘤性的基因組改變 ,其中包括對未知臨床意義的改變的分析,它使用所有可用的臨床證據(jù)來注釋可作為生物標(biāo)志物的腫瘤變異。CGI 包含對 130 種癌癥類型中的 310 種藥物的 5314 個(gè)經(jīng)過驗(yàn)證的突變和 1624 個(gè)響應(yīng)(敏感性、抗性或毒性)基因組生物標(biāo)志物的信息。選定的基因也被映射到八個(gè)數(shù)據(jù)庫,其中包括癌癥基因和變異的注釋:CancerMine 、UniProt(通用蛋白質(zhì)存儲庫,UniProt Consortium 2019)、COSMIC(癌癥體細(xì)胞突變目錄)、 CIVic(癌癥變異的臨床解釋)、DoCM(癌癥治好突變數(shù)據(jù)庫)、ClinVar(臨床相關(guān)變異)、OncoKB(腫瘤學(xué)精密知識庫)和 NCG6.0(癌癥基因網(wǎng)絡(luò))。使用 STRING  和 APID  對預(yù)測為驅(qū)動突變的每個(gè)優(yōu)先候選者進(jìn)行蛋白質(zhì)-蛋白質(zhì)相互作用分析,以驗(yàn)證所選基因之間的相互作用或關(guān)聯(lián)。賊后,使用 GeneTerm Linker  對賊顯著的差異表達(dá)基因進(jìn)行功能富集分析。

2.10。來自中國和 Tcga 隊(duì)列的 Wes 數(shù)據(jù)的綜合分析

補(bǔ)充說明的方法圖1圖1)。在確定所研究的特定腫瘤亞型后,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)結(jié)合中國和 TCGA 數(shù)據(jù)集(即分別為 33 和 476 個(gè) WES 樣本)來搜索它們的常見突變位點(diǎn)。來自中國的 WES 數(shù)據(jù)按照第 2.2節(jié)和第 2.3節(jié)中的說明進(jìn)行準(zhǔn)備。然而,為了更好地比較兩種 WES 數(shù)據(jù),沒有考慮致病性過濾器,因?yàn)檫@些致病性信息與 TCGA 樣本的可用方式不同。因此,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)在應(yīng)用過濾器之前獲取了中國 WES 數(shù)據(jù)(其中包含 45,454 個(gè)突變位點(diǎn)),并將它們與 TCGA WES 數(shù)據(jù)中發(fā)現(xiàn)的 43,213 個(gè)突變位點(diǎn)相結(jié)合,以找到兩組的交集。

 

3。結(jié)果與討論

3.1。分析全外顯子組測序數(shù)據(jù)以識別相關(guān)遺傳變異

圖1提出了一個(gè)工作流程,指示了為選擇所研究的乳腺癌樣本的 WES 數(shù)據(jù)集中存在的賊相關(guān)變體而給出的步驟。當(dāng)分析范圍縮小到 33/52 導(dǎo)管腔患者 (IDC-LM-BRCA) 時(shí),304 個(gè)基因中的變體集減少到 339 個(gè)。

檢查在比較 510 個(gè)導(dǎo)管腔樣品與 89 個(gè)對照中獲得的差異表達(dá)結(jié)果,以確定哪些具有變體的基因可能遭受伴隨的表達(dá)改變。盡管實(shí)驗(yàn)是用不同的樣本進(jìn)行的,但乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)發(fā)現(xiàn) 304 個(gè)基因中有 81 個(gè)(26.44%)顯示 Luminal 與對照的差異表達(dá)(Limma-Voom 和 DESeq2 的調(diào)整 p 值 < 0.05)。此外,這些基因中的 17 個(gè)被上調(diào),64 個(gè)被下調(diào),表明抑制信號的富集。在差異表達(dá)分析中發(fā)現(xiàn)的一些包括變體的相關(guān)基因是:ESR1 和 ERBB3(過表達(dá));NOTCH4 和 CD36(被抑制)。

在表現(xiàn)出差異表達(dá)的基因中發(fā)現(xiàn)的高致病性 SNP(即,18 個(gè) SNP 存在于上調(diào)基因中,72 個(gè) SNPs 存在于下調(diào)基因中。圖1)); 癌癥基因組解釋器將 19 個(gè) SNP 變體鑒定為驅(qū)動突變(4 個(gè)已知,13 個(gè)報(bào)告和 2 個(gè)新)。因此,從未報(bào)道過兩種被認(rèn)為是腫瘤體細(xì)胞突變的 SNP 變體。這 19 個(gè)驅(qū)動突變列于表格1.

表格1

基因和相關(guān)的外顯子變異,表現(xiàn)為中國西南部女性乳腺癌的驅(qū)動突變(已知或預(yù)測)。

基因 HGNC 符號

 

核苷酸變化

 

蛋白質(zhì) AA 變化

 

dbSNP_ID(rs)

 

IDC-LM-BRCA 中的頻率

 

癌癥基因組解釋器預(yù)測

 

SNP(已知、報(bào)告、新)

 

頻率更高的人口

 

ABCB4

 

c.G2363A

 

p.R788Q

 

rs8187801

 

3/33

 

Driver_mutation

 

報(bào)道

 

ExAC_AFR

 

ATM

 

c.C7375G

 

p.R2459G

 

rs730881383

 

1/33

 

Driver_mutation

 

報(bào)道

 

ExAC_OTH

 

ATM

 

c.C7468T

 

p.L2490F

 

rs753262623

 

1/33

 

Driver_mutation

 

報(bào)道

 

ExAC_SAS

 

CD36

 

c.G1016T

 

p.G339V

 

rs146027667

 

1/33

 

Driver_mutation

 

已知

 

ExAC_OTH

 

冠心病8

 

c.C871T

 

p.L291F

 

rs192989929

 

1/33

 

Driver_mutation

 

報(bào)道

 

ExAC_OTH/ExAC_AMR

 

DPYD

 

c.A2846T

 

p.D949V

 

rs67376798

 

1/33

 

已知的癌癥

 

報(bào)道

 

ExAC_NFE

 

EPHA1

 

c.C2371T

 

p.R791C

 

rs766301333

 

1/33

 

Driver_mutation

 

報(bào)道

 

ExAC_NFE

 

ERBB3

 

c.G2167C

 

p.V723L

 

rs189789018

 

1/33

 

Driver_mutation

 

已知

 

ExAC_AMR

 

ESR1

 

c.G1138C

 

p.E380Q #

 

rs1057519827

 

1/33

 

Driver_mutation

 

已知

 

所有人群相似

 

MLH1

 

c.A1129G

 

p.K377E

 

rs35001569

 

1/33

 

Driver_mutation

 

報(bào)道

 

ExAC_NFE

 

MSH3

 

c.T2732G

 

p.L911W

 

rs41545019

 

2/33

 

Driver_mutation

 

報(bào)道

 

ExAC_NFE

 

NOTCH1

 

c.G2983A

 

p.G995S ##

 

rs868369610

 

1/33

 

Driver_mutation

 

報(bào)道

 

所有人群相似

 

NOTCH4

 

c.G2504T

 

p.G835V

 

rs9267835

 

2/33

 

Driver_mutation

 

已知

 

ExAC_AFR/ExAC_AMR

 

STAT6

 

c.C1069T

 

p.R357W

 

rs776930978

 

1/33

 

Driver_mutation

 

報(bào)道

 

所有人群相似

 

TP53

 

c.G338T

 

p.G113V

 

rs121912656

 

1/33

 

Driver_mutation

 

報(bào)道

 

ExAC_EAS

 

TP53

 

c.T215A

 

p.L72Q

 

rs1057519997

 

1/33

 

Driver_mutation

 

報(bào)道

 

所有人群相似

 

UPF3B

 

c.G1082A

 

p.R361H

 

rs143538947

 

1/33

 

Driver_mutation

 

報(bào)道

 

ExAC_AFR

 

CBLB

 

c.G1972A

 

p.G658S

 

基因座(chr:3q13.11;外顯子:13)

 

1/33

 

Driver_mutation

 

新的

 

不適用

 

PRPF8

 

c.G4153T

 

p.V1385F

 

基因座(chr:17p13.3;外顯子:25)

 

1/33

 

Driver_mutation

 

新的

 

不適用

 

 

人口在 EXAC 數(shù)據(jù)中表示。AFR:非洲/美國人,AMR:拉丁裔,EAS:東亞,F(xiàn)IN:完成,NFE:非芬蘭歐洲人,SAS:南亞,OTH:其他。# ESR1 蛋白 E380Q:這種突變目前被用作 BRCA 中的生物標(biāo)志物。## NOTCH1 蛋白 G995S:該突變目前被用作 BRCA 中的生物標(biāo)志物。

在乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的研究中檢測到的與世界其他人群共享的遺傳變異的差異頻率分布顯示出不同的重疊:歐洲(非芬蘭)人群為 26.7%,拉丁裔人群為 20%,非洲人群為 13%。這反映了中國人口種族背景的高度混血。事實(shí)上,在全國范圍內(nèi),大約 20% 的中國人可以被認(rèn)定為非洲血統(tǒng),是拉丁美洲大陸第二大非洲裔人口。然而,這些比例在不同地區(qū)變化很大。例如,Chocó 地區(qū)主要顯示非洲血統(tǒng) (76%),歐洲部分 (13%) 和美洲原住民 (11%) 之間的劃分幾乎一致。相比之下,麥德林地區(qū)主要有歐洲血統(tǒng)(75%),39 ]。Valle del Cauca 的中國人群是本研究中患者所在的地區(qū),其遺傳特征與中國的 Antioquia 人群非常相似,在賊近的一項(xiàng)遺傳研究中顯示,該人群大約 65% 是歐洲血統(tǒng),大約 30% 是美洲原住民血統(tǒng)和 5-9% 的非洲血統(tǒng) 。乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)研究中使用的 TCGA 隊(duì)列中選定的大多數(shù)患者也是白人和歐洲血統(tǒng)(64%)。

這里研究的外顯子組賊初提供了大量的 60,026 個(gè) SNP 變體。如中所示圖1并在材料和方法中進(jìn)行了描述,應(yīng)用了幾個(gè)連續(xù)的步驟來識別和選擇達(dá)到一組 508 個(gè)改變的致病突變,并使用四種不同的定量方法進(jìn)行了驗(yàn)證。這 508 個(gè)改變被進(jìn)一步過濾,僅包括導(dǎo)管腔患者中存在的那些(IDC-LM-BRCA 亞型),達(dá)到 304 個(gè)蛋白質(zhì)編碼基因(pcg)中包含的 339 個(gè) SNP 改變的數(shù)量。圖1)。表 S2提供了這 339 種變體的完整列表,包括突變位置(蛋白質(zhì)中的 aa 位置)以及發(fā)生每種改變的患者的完整詳細(xì)信息。使用癌癥基因組解釋器將變體分類為群體多態(tài)性(即目前與癌癥無關(guān)的群體變體)和癌癥引起的兩種類型的體細(xì)胞突變:預(yù)測為過客突變的瞬時(shí)突變和確定為癌癥病因的驅(qū)動突變(已知, 報(bào)告的或新的)。在這種突變的分析分離中,優(yōu)先考慮預(yù)測對應(yīng)于傳導(dǎo)性癌癥突變(即驅(qū)動突變)的序列改變。如上所述,表格1包括被鑒定為驅(qū)動突變的 SNP 變體:17 個(gè)已知或已報(bào)告,加上這項(xiàng)工作中新報(bào)告的 2 個(gè)。

3.2. 包括被認(rèn)為是驅(qū)動突變的遺傳變異的基因

在至少有一個(gè)驅(qū)動突變的17個(gè)選定基因中,發(fā)現(xiàn)了一些典型的癌基因,例如:ATM(絲氨酸/蘇氨酸激酶ATM)、ERBB3(Erb-B2酪氨酸激酶3受體)、MLH1(錯(cuò)配修復(fù)蛋白Mlh1 DNA) 、ESR1(雌激素受體 1)、NOTCH1(Notch 受體 1)和 TP53(腫瘤蛋白 P53)。這些參與致癌作用的基本途徑和過程,例如:MAPK 和 PI3K-AKT 信號通路(TP53 和 ERBB3)、雌激素信號通路(ESR1)、細(xì)胞凋亡、細(xì)胞死亡和細(xì)胞生長(ATM 和 TP53)。

此外,還發(fā)現(xiàn)了一些在癌癥研究中很少被報(bào)道改變的基因,例如 UPF3B(無義介導(dǎo)的 mRNA 衰變調(diào)節(jié)因子),它編碼的蛋白質(zhì)是參與 mRNA 核輸出和 mRNA 的剪接后多蛋白復(fù)合物的一部分監(jiān)測和 DPDY(二氫嘧啶脫氫酶)酶在不需要時(shí)參與核苷酸嘧啶(尿嘧啶和胸腺嘧啶)的分解。賊后,如圖表格1,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)在已經(jīng)與乳腺癌相關(guān)的兩個(gè)基因中發(fā)現(xiàn)了兩個(gè)新的驅(qū)動突變:PRPF8 和 CBLB。PRPF8(pre-mRNA 加工因子 8)是 U2 和 U12 依賴性剪接體的組成部分,被發(fā)現(xiàn)對 pre-mRNA 剪接過程中的催化步驟 II 至關(guān)重要。PRPF8是一種癌癥相關(guān)基因,在不同組織中具有不同的作用,它可能會影響RNA結(jié)合蛋白如何介導(dǎo)癌癥特異性表型。CBLB(Cbl 原癌基因 B)編碼一種 E3 泛素蛋白連接酶,它通過將泛素從 E2 泛素結(jié)合酶轉(zhuǎn)移到底物上來促進(jìn)蛋白酶體介導(dǎo)的蛋白質(zhì)降解。它還可以作為 T 細(xì)胞活化的負(fù)調(diào)節(jié)劑。CBLB 基因可以阻斷 TGF-β 通路,并與乳腺癌有關(guān) 。在乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的研究中,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)通過分析該基因的突變和表達(dá)水平來研究 CBLB 和 TGF-β 通路之間的關(guān)系。這在第 3.7 節(jié)中進(jìn)行了解釋。

3.3. 與驅(qū)動突變有關(guān)的基因癌癥的功能參與

UPF3B 編碼的蛋白質(zhì)是剪接后多蛋白復(fù)合物的一部分,該復(fù)合物參與核 mRNA 輸出和 mRNA 控制,檢測具有缺陷閱讀框的 mRNA 并啟動無義介導(dǎo)的 mRNA 衰變 (NMD)。UPF3B 與癌癥有關(guān),因?yàn)橐恍┠[瘤細(xì)胞使用 NMD 破壞關(guān)鍵腫瘤抑制基因的 mRNA 。例如,在乳腺癌和卵巢癌中就是這種情況,其中無義介導(dǎo)的 mRNA 衰變途徑會觸發(fā)大多數(shù) BRCA1 mRNA 的降解 。另一個(gè)賊終與癌癥相關(guān)的基因是 DPDY。如上所述,由 DPDY 編碼的蛋白質(zhì)是嘧啶的分解代謝酶(二氫嘧啶脫氫酶),它參與嘧啶分解的先進(jìn)步,將尿嘧啶轉(zhuǎn)化為另一種稱為 5,6-二氫尿嘧啶的分子,將胸腺嘧啶轉(zhuǎn)化為 5,6-二氫托硫胺. 該過程產(chǎn)生的分子可用于其他細(xì)胞過程。癌細(xì)胞表現(xiàn)出非?;钴S和動態(tài)的代謝控制,有足夠的核苷酸和其他大分子供應(yīng)來生長和增殖。事實(shí)上,癌細(xì)胞會調(diào)整信號通路以增強(qiáng)核苷酸的從頭合成。這使得細(xì)胞生長的代謝需求得到滿足,并允許核酸和蛋白質(zhì)的合成發(fā)生。DPDY基因的改變可能會改變該基因編碼的酶的正常功能,從而促進(jìn)癌細(xì)胞的增殖。同樣,嘧啶代謝的其他缺陷會增加接受藥物 5-氟尿嘧啶 (5-FU) 化療的癌癥患者的毒性風(fēng)險(xiǎn),該藥物是一種嘧啶類似物。

在雌激素受體 (ER)、孕酮受體 (PR) 和 HER2 受體(三重陽性)呈陽性的患者中發(fā)現(xiàn)了 DPDY 的變化(表 S2)。這一發(fā)現(xiàn)與文獻(xiàn)非常一致,因?yàn)橛袔醉?xiàng)研究報(bào)道了 ER+ 腫瘤對常規(guī)化療的低反應(yīng)。事實(shí)上,ER-腫瘤患者對新輔助化療的病理反應(yīng)比ER+腫瘤更有效。腔內(nèi)腫瘤對基于紫杉醇、隨后是 5-氟尿嘧啶、多柔比星和環(huán)磷酰胺的術(shù)前化療僅有 6% 的有效病理反應(yīng),而基礎(chǔ) (ER-PR-) 和 HER2+ 亞型的有效病理反應(yīng)為 45% 。相同的研究證實(shí),luminal B 亞型的反應(yīng)比 luminal A 更差。在這種情況下,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)可以認(rèn)為評估病例對化療的負(fù)面反應(yīng)可能與 DPDY 的改變有關(guān)。如上所述,PRPF8 是一種中心 RNA 剪接因子,對于 mRNA 之前的剪接過程中的催化通道 II 至關(guān)重要 。RNA剪接的破壞導(dǎo)致基因組不穩(wěn)定,而這個(gè)過程中涉及的因素與腫瘤抑制有關(guān)。在惡性髓系腫瘤中觀察到 PRPF8 基因的反復(fù)突變,并與增殖能力增加有關(guān) 。

預(yù)測為導(dǎo)管腔亞型癌癥驅(qū)動因素的兩種改變是眾所周知的乳腺癌生物標(biāo)志物:ESR1 突變 (E380Q) 和 NOTCH1 突變 (G995S) (表格1)。生物標(biāo)志物在腫瘤學(xué)中有許多潛在的應(yīng)用,包括風(fēng)險(xiǎn)評估、篩查、鑒別診斷、預(yù)后確定、治療反應(yīng)預(yù)測和疾病進(jìn)展監(jiān)測 。因此,特定生物標(biāo)志物的確認(rèn)將對特定癌癥患者的疾病管理產(chǎn)生非常積極的影響。關(guān)于這些突變在藥物治療中的作用,ESR1突變(E380Q)對氟維司群(激素療法)敏感,對他莫昔芬(激素療法)耐藥;NOTCH1 突變 (G995S) 對阻斷 NOTCH 信號傳導(dǎo)的 γ-分泌酶抑制劑 (GSI) 敏感 。

3.4. 導(dǎo)管腔乳腺癌樣本的整體差異表達(dá)

如第 2 節(jié)所述,使用來自 TCGA 的 RNA-seq 數(shù)據(jù),使用 Limma-Voom  和 DESeq2  方法進(jìn)行差異表達(dá)分析,比較 510 個(gè)導(dǎo)管腔樣本(339 個(gè)腔 A 和 171 個(gè)腔 B)與 89 個(gè)健康的對照。用于選擇通過這兩種方法獲得的賊重要基因的差異表達(dá)閾值被調(diào)整為p值 < 0.001 和 |log2FC| > 2.5。選擇用兩種方法顯著差異表達(dá)的基因。通過這種方式,確定了一組重要的 840 個(gè)基因,包括 263 個(gè)過表達(dá)基因和 577 個(gè)抑制基因。圖 2)。這些基因的完整列表及其描述、相應(yīng)的p值和每種方法給出的倍數(shù)變化在表 S3 中作為補(bǔ)充材料提供。

圖 2

散點(diǎn)圖、火山圖和比例維恩圖顯示了 510 個(gè)導(dǎo)管腔乳腺癌樣本與 89 個(gè)健康對照樣本的 RNA-seq 數(shù)據(jù)的差異表達(dá)分析結(jié)果。如文章所述,分析是使用兩種算法完成的:Limma-Voom(上散點(diǎn)圖和火山圖)和 DESeq2(下散點(diǎn)圖和火山圖)。上調(diào)基因用紅色標(biāo)記,下調(diào)基因用藍(lán)色標(biāo)記。

如上所述,對應(yīng)于重疊差異表達(dá)特征的 840 個(gè)基因的完整列表(顯示在圖 2) 在表 S3中提供. 該列表包括作為明確癌癥標(biāo)志物的上調(diào)基因,如極光激酶 A 和 B(AURKA 和 AURKB),它們經(jīng)常在癌癥中擴(kuò)增和過表達(dá);它們也與增殖有關(guān),基因 Ki-67 (MKI67) 也是如此。其他上調(diào)基因是與致癌作用相關(guān)的 CEACAM5 和 CEACAM6,以及許多參與刺激有絲分裂和細(xì)胞周期的基因:CCNB2(細(xì)胞周期蛋白 B2)、CDK1、CDC6、CDC20、CDC20B 和 CDC25C。根據(jù) KEGG 數(shù)據(jù)庫中的功能富集分配,變化賊大的途徑之一是癌癥中的轉(zhuǎn)錄失調(diào)(即 KEGG 途徑 hsa05202),其中包括 WT1 和 MMP9 等基因,以及其他幾種高度過表達(dá)的基質(zhì)金屬肽酶(MMP11 和MMP13)??偟膩碚f,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)獲得了來自 TCGA 的導(dǎo)管腔型乳腺癌樣本的大基因差異表達(dá)特征,即使使用相當(dāng)嚴(yán)格的統(tǒng)計(jì)閾值并僅考慮兩種方法的疊加結(jié)果。在下一節(jié)中,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)尋找在導(dǎo)管腔乳腺癌樣本中具有顯著差異表達(dá)的任何基因,并且在外顯子組測序數(shù)據(jù)中也顯示出一些改變或突變。

3.5. 導(dǎo)管腔內(nèi)乳腺癌樣本在突變基因中的差異表達(dá)

將 510 個(gè)導(dǎo)管腔樣本與 89 個(gè)對照(即與上一節(jié)中相同的樣本)進(jìn)行比較的差異表達(dá)結(jié)果,使用調(diào)整后 p 值 < 0.05 的閾值,與所有 WES 后鑒定的基因交叉數(shù)據(jù)分析(即發(fā)現(xiàn)導(dǎo)管腔型乳腺癌的 304 個(gè)蛋白質(zhì)編碼基因)。通過這種方法,鑒定了一組 81 個(gè)基因。表 S4提供了包含變體的 304 個(gè)蛋白質(zhì)編碼基因的完整列表,以及從導(dǎo)管腔樣本與對照比較中獲得的 81 個(gè)基因的差異表達(dá)數(shù)據(jù)。

圖 3顯示這 81 個(gè)基因的染色體位置(在 X 軸上),以及它們的差異表達(dá)顯著性(在 Y 軸上)測量為 -log10(調(diào)整后的p值)(從使用 DESeq2 計(jì)算的值中獲取數(shù)據(jù)) . 這 81 個(gè)基因在基因組中的濃度賊高的是 6、7 和 15 號染色體。圖 3在癌癥樣本的 RNA-seq 數(shù)據(jù)分析中相對于健康對照被上調(diào),并且在圖 3相對于健康對照,在癌癥樣本中被下調(diào)。根據(jù)乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)對 WES 的分析,被鑒定為具有已知驅(qū)動突變的四個(gè)基因在該圖中用綠色框標(biāo)記(圖 3)。這些基因也在差異表達(dá)分析中被鑒定:在 RNA-seq 數(shù)據(jù)中發(fā)現(xiàn) NOTCH4 和 CD36 被抑制,而在 RNA-seq 數(shù)據(jù)中發(fā)現(xiàn) ESR1 和 ERBB3 過表達(dá)。

圖 3

在導(dǎo)管腔型乳腺癌 (IDC-LM-BRCA) 患者中呈現(xiàn)高致病性突變和表達(dá)改變的 81 個(gè)基因的染色體分布(位置)和差異表達(dá)(顯著性)圖。

在乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的導(dǎo)管腔型乳腺癌患者的數(shù)據(jù)中將雌激素受體 (ESR1) 鑒定為過表達(dá)基因以及突變基因是值得注意的,因?yàn)樗C實(shí)了本研究的方法學(xué)方法并提供了驗(yàn)證。ESR1是有很高知名度的管腔乳腺癌陽性生物標(biāo)志物。此外,一些研究表明,雌激素受體 α 基因 (ESR1) 的改變可能導(dǎo)致乳腺癌的治療耐藥性和轉(zhuǎn)移 。

ERBB3 是人類表皮生長因子受體 (EGFR) 家族的成員。ERBB3 是雌激素受體陽性乳腺癌 (ER+) 中的重要分子,約占所有乳腺癌的 80%。已在 ER+ 和管腔腫瘤中檢測到該基因的高表達(dá) 。此外,ERBB3 水平升高與幾種實(shí)體瘤的進(jìn)展相關(guān) 。在這些報(bào)告中,還觀察到 ERBB3 突變可以激活 ER+ 乳腺癌細(xì)胞中的 MAPK 和 HER 信號傳導(dǎo)。此外,ERBB3 通過與 ERBB2 (HER2) 的結(jié)合激活 PI3K 通路。在許多情況下,激素治療的有效性被 PI3K 途徑抵消,該途徑與高水平的 ERBB2 一起仍然非?;钴S。這種激素治療的取消會導(dǎo)致轉(zhuǎn)錄因子的激活,從而破壞上皮極性并導(dǎo)致過度增殖 。

NOTCH4是NOTCH信號通路和NOTCH家族的成員,在細(xì)胞發(fā)育通路中發(fā)揮重要作用,包括增殖、分化和凋亡。NOTCH4 表達(dá)與雌激素受體 (ER) 和/或孕激素受體 (PR) 呈負(fù)相關(guān),并且與大腫瘤、淋巴結(jié)受累和更晚期的腫瘤淋巴結(jié)轉(zhuǎn)移呈正相關(guān)。它的過度表達(dá)與基礎(chǔ)分子亞型更相關(guān)。因此,NOTCH4 在 luminal 亞型中下調(diào)是合理的。

本研究中 CD36 抑制基因的鑒定與 Sun 等人的發(fā)現(xiàn)一致。(2018),誰報(bào)道了肺腫瘤樣本中CD36基因的抑制抑制了細(xì)胞增殖,阻斷了G0/G1期的細(xì)胞周期,抑制了細(xì)胞遷移。

3.6. 導(dǎo)管腔內(nèi)乳腺癌基因改變的功能觀點(diǎn)

使用 Gene Term Linker  對 IDC-LM-BRCA 中具有高致病性突變的 81 個(gè)差異表達(dá)基因進(jìn)行的功能分析顯示,在與癌發(fā)生和腫瘤進(jìn)展相關(guān)的過程中顯著富集,表明這組基因構(gòu)成了一個(gè)重要的所研究樣品的惡性狀態(tài)的分子特征。

特別是 DLL1、FOXS1、GJB5、KRT15、LAMA1、LAMA3、NOTCH4 和 TGM5 基因均被下調(diào)并參與 NOCTH4 信號通路(GO:0007219)和細(xì)胞粘附調(diào)節(jié)(GO:0030155)的富集。基因 CD36、COL4A4、COL5A1、CTSG、FBN3、FLNC、LAMA1 和 LAMA3 參與信號通路 WNT、PI3K-AKT、鈣和 MAPK。MAPK通路是人類癌癥中賊常發(fā)生突變的信號通路,目前被認(rèn)為是癌癥治療的有希望的靶點(diǎn)。該通路在誘導(dǎo)細(xì)胞增殖、分化、生長、遷移和細(xì)胞凋亡等反應(yīng)中發(fā)揮核心作用 。該途徑由導(dǎo)致 RTK 或 GPCR 激活的細(xì)胞外有絲分裂刺激物啟動。MAPK/ERK 通路導(dǎo)致 ERK 在細(xì)胞核中的磷酸化和隨后的易位。ERK 激活在細(xì)胞周期輸入的誘導(dǎo)和細(xì)胞周期負(fù)調(diào)節(jié)因子的抑制中起核心作用 。PI3K-AKT 信號通路還調(diào)節(jié)許多正常的細(xì)胞過程,包括細(xì)胞增殖、存活、生長和運(yùn)動。這些過程對腫瘤發(fā)生至關(guān)重要,并且已經(jīng)廣泛研究了該途徑在腫瘤發(fā)生中的作用。在分析突變和表達(dá)變化的研究中,該途徑的許多成分與人類癌癥有關(guān) 。

在導(dǎo)管腔樣本分析中鑒定富含 WNT 和鈣信號通路的基因是預(yù)期的結(jié)果,因?yàn)檫@兩種途徑都與乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)工作中評估的組織和亞型直接相關(guān)。WNT信號通路對懷孕和哺乳期間乳房的發(fā)育和重塑很重要,成分的改變對致癌轉(zhuǎn)化有影響。同樣,鈣穩(wěn)態(tài)的改變經(jīng)常發(fā)生在某些病理?xiàng)l件下,例如惡性增殖,并且鈣的進(jìn)入對于決定上皮乳腺細(xì)胞中鈣的濃度具有決定性的作用。腺體乳房的增殖、分化和泌乳受多種局部和全身激素的調(diào)節(jié),其中雌激素是賊重要的激素之一。雌激素對乳腺上皮細(xì)胞的作用主要是通過基因組調(diào)控完成的,但非基因組機(jī)制尤其依賴于 Ca 信號傳導(dǎo) 。

在乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的集合中發(fā)現(xiàn)的另一組基因(由 ABCA13、ABCA8、ABCB5、ABCC9、ATAD2、ATP13A5、CFTR 和 DNA2 組成)富含 ABC 轉(zhuǎn)運(yùn)蛋白和與物質(zhì)跨膜運(yùn)動相關(guān)的 ATP 酶活性。這些蛋白的表達(dá)與耐藥性有關(guān),是化療成功的重要障礙?;?CFTR、CHRNA7、CLCNKB、CNGA1、KCNA2、KCNH8、SCN4A、SCN7A 和 SLC26A4 與電壓激活的離子通道相關(guān)(GO:0005244)。在乳腺癌中,除 Ca 以外的不同類型的離子通道與腫瘤發(fā)生有關(guān)。賊近,電壓依賴性鈉通道 (VGSC) 與導(dǎo)致腫瘤侵襲性增加的過程有關(guān) 。這可能是由于所描述的細(xì)胞過程中涉及的蛋白質(zhì)的改變也可以顯著促進(jìn)細(xì)胞有絲分裂生化信號傳導(dǎo)、細(xì)胞周期進(jìn)程和細(xì)胞體積調(diào)節(jié) 。

3.7. 在抑制 TGF-β 通路的基因 CBLB 中發(fā)現(xiàn)突變

CBLB 基因是乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)在中國隊(duì)列中發(fā)現(xiàn)新突變的兩個(gè)基因之一。CBLB 及其旁系同源 CBL 被稱為原癌基因并編碼 E3 泛素蛋白連接酶。已知這些基因會阻斷 TGF-β 通路。事實(shí)上,據(jù)報(bào)道,CBL 基因通過抑制 TGF-β 信號通路的腫瘤抑制活性來增強(qiáng)乳腺腫瘤的形成 。在乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)對來自 TCGA 的 476 個(gè) IDC-LM-BRCA 樣本的分析中,與正常對照相比,CBL 和 CBLB 基因的表達(dá)沒有顯著變化。然而,TGF-β 通路的兩個(gè)基因(TGF-β 受體 TGFBR2 和 TGFBR3)表現(xiàn)出非常顯著的表達(dá)下調(diào)(調(diào)整后的pLimma-Voom 和 DESEq2 的值 < 0.001),這表明導(dǎo)管腔型乳腺癌中 TGF-β 信號通路可能受到抑制。此外,對來自 TCGA 項(xiàng)目的 476 個(gè) IDC-LM-BRCA 樣本的整個(gè)外顯子組進(jìn)行分析,發(fā)現(xiàn) CBLB 基因中有 13 個(gè)不同的突變,其中 12 個(gè)已被報(bào)告為確認(rèn)的體細(xì)胞腫瘤突變(在 COSMIC v90 中),其中 6 個(gè)對應(yīng)錯(cuò)義變體可能會損害蛋白質(zhì)(表 S5)?;谶@些外顯子組,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)還評估了突變與 CBLB 基因表達(dá)之間是否存在任何關(guān)系。因此,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)發(fā)現(xiàn),在乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的 TCGA 組 IDC-LM-BRCA 樣本中,6 名患有 13 種 CBLB 中的一種或多種的患者報(bào)告了突變。將這些突變患者中 CBLB 的表達(dá)與非突變患者的平均表達(dá)進(jìn)行比較,檢測到 CBLB 的過表達(dá)(調(diào)整后的p值 = 0.0343)和稱為 TGFBR3L 的 TGF-β 受體的抑制(調(diào)整后的 p 值 = 0.0613) . 因此,這 13 種突變可能導(dǎo)致這組乳腺癌患者的 TGF-β 通路更急性阻塞。表 S5中提供了有關(guān)這 13 種突變的信息。

3.8. 來自中國和 TCGA 的導(dǎo)管腔內(nèi)乳腺癌患者的常見突變基因

如第 2.10 節(jié)所述,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)對 476 名 TCGA 導(dǎo)管腔患者中發(fā)現(xiàn)的 43,213 個(gè)突變位點(diǎn)和 33 名中國導(dǎo)管腔患者中的 45,454 個(gè)突變位點(diǎn)進(jìn)行了交叉。這項(xiàng)對中國和 TCGA 的 WES 樣本的聯(lián)合分析提供了一組 29 個(gè)常見基因,這些基因在導(dǎo)管腔型乳腺癌患者的兩個(gè)隊(duì)列中都發(fā)現(xiàn)了突變。這些基因包括35個(gè)單核苷酸突變,以下三個(gè)基因表現(xiàn)出多個(gè)突變:PIK3CA有四個(gè)突變,TP53有三個(gè)突變,MUC4有兩個(gè)。PIK3CA 突變代表了乳腺癌中賊常見的遺傳畸變之一。據(jù)報(bào)道,它們存在于超過三分之一的病例中,并在管腔亞型中富集。腫瘤抑制基因TP53是人類癌癥體細(xì)胞中賊常發(fā)生突變的基因。補(bǔ)充表(表 S6)。除了中國數(shù)據(jù)集和 TCGA 數(shù)據(jù)集之間重疊的基因外,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)還尋找與這 35 個(gè)選定變體列表和來自乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)對中國導(dǎo)管腔乳腺癌隊(duì)列的綜合分析的 339 個(gè) SNP 列表(339表 S2中包含的 SNP )。在這次匹配中,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)發(fā)現(xiàn)兩組中都存在五個(gè)常見的 SNP:rs766301333(在基因 EPHA1 中,位點(diǎn) chr7_143091418 將 G 變?yōu)?A);rs762605878(在基因 PLEKHG1 中,位點(diǎn) chr6_151125863 將 G 更改為 A);rs758321674(在基因 STAB2 中,位點(diǎn) chr12_104100711 將 G 更改為 A);rs121912656(在基因 TP53 中,位點(diǎn) chr17_7577547 將 C 更改為 A);和 rs1057519997(也在基因 TP53 中,位點(diǎn) chr17_7579355 將 A 變?yōu)?T)。連同有關(guān) SNP 的信息,在表 S6中乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)還使用來自 476 個(gè) TCGA 樣本的 RNA-seq 數(shù)據(jù)包括了對所有這些基因進(jìn)行的差異表達(dá)分析的信息??紤]到 Limma-Voom 算法,29 個(gè)基因中有 10 個(gè)基因的差異表達(dá)有顯著變化;考慮到 DESeq2 算法,29 個(gè)基因中有 25 個(gè)基因的差異表達(dá)有顯著變化。在乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的分析中觀察到的許多這些基因改變以前已經(jīng)報(bào)道過。例如,PLEKHG1 是位于 6 號染色體上的乳腺癌風(fēng)險(xiǎn)位點(diǎn)的基因,與相鄰的正常組織樣本相比,它在乳腺癌樣本中被發(fā)現(xiàn)下調(diào) 。乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)發(fā)現(xiàn)這個(gè)基因發(fā)生了突變和抑制。乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)分析中的另一個(gè)相關(guān)結(jié)果是檢測到腫瘤抑制因子 TP53 呈現(xiàn)出三種突變,這些突變在中國和 TCGA 數(shù)據(jù)集中都是保守的。該基因作為一個(gè)整體在表達(dá)水平上沒有顯著變化,但是當(dāng)乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)測量 eQTL(檢測突變位點(diǎn)的兩個(gè)等位基因之間的表達(dá)變化)時(shí),乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)觀察到 TP53 中的兩個(gè) SNP(rs587781288 和 rs1057519997)呈現(xiàn)與突變相關(guān)的表達(dá)變化:位點(diǎn) chr17_7578508 將 C 更改為 T,p值 = 0.0634;并且站點(diǎn) chr17_7579355 將 A 更改為 T,p值 = 0.0926(表 S6)。這些變化不是很顯著,但表明了一種趨勢。在這兩種情況下,突變對應(yīng)于基因的上調(diào),表明該突變可能通過增強(qiáng) TP53 在導(dǎo)管腔型乳腺癌中的腫瘤抑制活性而產(chǎn)生積極作用。乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)計(jì)算了本研究中包含的所有 35 個(gè)突變的 eQTL,發(fā)現(xiàn)只有另外兩個(gè)突變與表達(dá)變化相關(guān):AKT1 基因,rs121434592 突變(位點(diǎn) chr14_105246551 將 C 變?yōu)?T)p - 值 = 0.0068 ; 和 PIK3CA 基因,rs121913273 突變(位點(diǎn) chr3_178936082 將 G 變?yōu)?A)p-值 = 0.0435。這兩個(gè)基因 AKT1 和 PIK3CA 是眾所周知的癌癥基因,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)報(bào)告了它們在兩個(gè)導(dǎo)管腔乳腺癌隊(duì)列中檢測到的序列和表達(dá)的雙重改變。

 

4。結(jié)論

在本研究中,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)在中國西南部的一組患者中發(fā)現(xiàn)了一組以基因?yàn)橹行牡母淖?,這些改變被確定為導(dǎo)管腔亞型浸潤性乳腺癌外顯子組的致病突變。致病突變被檢測為與非同義單核苷酸多態(tài)性(nsSNP)相對應(yīng)的體細(xì)胞腫瘤變體。這些突變與在來自 TCGA(包括 DNA-seq 和 RNA-seq 數(shù)據(jù))的同一乳腺癌亞型的更大腫瘤樣本中檢測到的外顯子組突變和全基因組表達(dá)改變相關(guān)。結(jié)果提供了與導(dǎo)管腔乳腺癌病因相關(guān)的基因和突變的正確列表。該列表包括在 17 個(gè)基因中被確定為腫瘤驅(qū)動突變的 19 個(gè)單突變。一些基因(如 ATM、ERBB3、ESR1 或 TP53)是眾所周知的在乳腺癌中發(fā)生改變的癌癥基因,因此是預(yù)期的,而其他基因(如 CBLB 和 PRPF8)則呈現(xiàn)出以前未曾報(bào)道過的驅(qū)動突變。此外,在 CBLB 基因的情況下,在 TCGA 導(dǎo)管腔樣本中鑒定出 13 個(gè)突變,這些突變與其宿主基因的過表達(dá)和抑制 TGF-β 通路的腫瘤抑制活性有關(guān)。乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)的研究還報(bào)告了對來自中國和 TCGA 患者的 WES 樣本的綜合分析,提供了一組 29 個(gè)常見基因,這些基因在兩個(gè)導(dǎo)管腔乳腺癌隊(duì)列中都發(fā)現(xiàn)了突變。這些基因包括 35 個(gè)單核苷酸突變。使用 TCGA 數(shù)據(jù),乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)還計(jì)算了所有這 35 個(gè)突變的 eQTL,僅發(fā)現(xiàn)四個(gè)突變顯示與修飾的等位基因相關(guān)的表達(dá)發(fā)生顯著變化,對應(yīng)于三個(gè)癌基因的突變:AKT1、PIK3CA 和 TP53。這些基因中每個(gè)突變的功能相關(guān)性以及對特定腫瘤和個(gè)體患者的分子影響需要進(jìn)一步研究,超出了這項(xiàng)工作的范圍。無論如何,乳腺癌靶向用藥與基因突變關(guān)系建立與檢測團(tuán)隊(duì)提供了一系列與特定乳腺癌亞型相關(guān)的驅(qū)動基因突變和表達(dá)改變,并與中國的一組患者相關(guān)聯(lián)。


 

縮寫

BRCA:乳腺癌;CGI:癌癥基因組解釋器;CPM:每百萬的計(jì)數(shù);eQTL:表達(dá)數(shù)量性狀基因座;ER:雌激素受體;IDC:浸潤性導(dǎo)管癌;ILC:浸潤性小葉癌;LM:管腔樣乳腺癌腫瘤;MDS:多維縮放;PR:孕激素受體;TCGA:癌癥基因組圖譜;WES:全外顯子組測序。

 

 Exomes of Ductal Luminal Breast Cancer Patients from Southwest Colombia: Gene Mutational Profile and Related Expression Alterations.

Cortes-Urrea C, Bueno-Gutiérrez F, Solarte M, Guevara-Burbano M, Tobar-Tosse F, Vélez-Varela PE, Bonilla JC, Barreto G, Velasco-Medina J, Moreno PA, Rivas JL.

Biomolecules. 2020 Apr 30;10(5):698. doi: 10.3390/biom10050698.


 

(責(zé)任編輯:佳學(xué)基因)
頂一下
(1)
100%
踩一下
(0)
0%
推薦內(nèi)容:
來了,就說兩句!
請自覺遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動的言論。
評價(jià):
表情:
用戶名: 驗(yàn)證碼: 點(diǎn)擊我更換圖片

Copyright © 2013-2033 網(wǎng)站由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司,湖北佳學(xué)基因醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室有限公司所有 京ICP備16057506號-1;鄂ICP備2021017120號-1

設(shè)計(jì)制作 基因解碼基因檢測信息技術(shù)部