【佳學基因檢測】基因檢測如何從外周血細胞得知乳腺癌的存在?病例與健康對照大人群研究
外周血細胞乳腺癌基因檢測導讀:
腫瘤與宿主的相互作用超出了局部微環(huán)境,癌癥的發(fā)展在很大程度上取決于惡性細胞劫持和利用宿主正常生理過程的能力。在這里,乳腺癌基因檢測技術領選策略高效團隊確定當存在未經(jīng)治療的乳腺癌 (乳腺癌) 時,外周血細胞內(nèi)的許多基因表現(xiàn)出差異表達,并利用這一事實構建了一個 50 基因特征,將 乳腺癌 患者與基于人群的對照區(qū)分開來。乳腺癌基因檢測技術領選策略高效團隊的結(jié)果來自乳腺癌基因檢測技術領選策略高效團隊獨特的基于人群的挪威婦女和癌癥隊列中的一系列大型數(shù)據(jù)集,這些數(shù)據(jù)集使乳腺癌基因檢測技術領選策略高效團隊能夠研究藥物和腫瘤特征對乳腺癌基因檢測技術領選策略高效團隊基于血液的測試的影響,并在兩個外部數(shù)據(jù)集中進行了進一步測試。乳腺癌基因檢測技術領選策略高效團隊的 50 基因特征包含細胞抑制信號,包括對免疫反應的特異性抑制,以及影響這些過程中轉(zhuǎn)錄的藥物被確定為混雜因素。通過分析血液中差異表達的生物學過程,乳腺癌基因檢測技術領選策略高效團隊能夠解釋為什么宿主的全身反應可能是 乳腺癌 的高效標志物,其特征是免疫特異性途徑和“通用”細胞的低表達由 MYC 驅(qū)動的程序(即,新陳代謝、生長和細胞周期)??傊庵苎毎幕虮磉_受到乳腺癌特異性存在的顯著干擾,這些變化同時涉及許多與 乳腺癌 免疫逃逸相關的系統(tǒng)性細胞抑制信號。
基因檢測如何從外周血細胞得知乳腺癌的存在課題創(chuàng)新點?
血細胞是信息的動態(tài)倉庫。就癌癥而言,研究表明血細胞具有與實體瘤相關的遺傳特征。在本研究中,發(fā)現(xiàn)外周血細胞中的基因在未經(jīng)治療的乳腺癌女性中存在差異表達,從而開發(fā)出能夠識別患有該疾病的女性的 50 個基因特征。基因特征包括免疫抑制特異性信號。乳腺癌與免疫特異性通路的低表達以及與 MYC 驅(qū)動的“通用”細胞程序的關聯(lián)可以解釋宿主的全身反應。
關鍵詞: 乳腺癌,基于人群的病例對照研究,腫瘤-宿主相互作用,血液基因表達譜
癌癥不僅僅是自主的細胞群;它們分泌可引起宿主全身反應的可溶性因子,而宿主反應反過來又會影響癌細胞。幾項研究支持這樣的觀點,即腫瘤系統(tǒng)地作用以調(diào)節(jié)整體癌癥進展并且癌癥發(fā)展在很大程度上取決于惡性細胞劫持和利用宿主正常生理過程的能力。盡管人們對癌癥中癌癥與宿主相互作用的認識越來越多,但乳腺癌基因檢測技術領選策略高效團隊對宿主如何響應癌癥信號并進而影響腫瘤進展和預后的理解還很初步。越來越多的證據(jù)表明,外周血細胞的基因表達譜是評估與實體瘤相關的基因特征的有價值的工具。包括乳腺癌基因檢測技術領選策略高效團隊在內(nèi)的幾個小組已經(jīng)定義了健康個體中血液基因表達的個體內(nèi)部和個體間變異性,并建立了血液樣本采集和基因表達譜分析的標準化程序。在這項研究中,乳腺癌基因檢測技術領選策略高效團隊在挪威婦女和癌癥研究 (NOWAC) 中選擇了大量的乳腺癌 (BC) 患者和代表一般人群的女性,這些患者的出生年份和隨訪時間相匹配。據(jù)乳腺癌基因檢測技術領選策略高效團隊所知,這是該領域的先進項研究,正確地代表了從代表一般人群的女性中識別乳腺癌患者的實際情況。乳腺癌基因檢測技術領選策略高效團隊遵循嚴格的實驗設計,在從 RNA 擴增到雜交的實驗室程序的所有步驟中,每個病例樣本都使用年齡匹配的對照進行處理。在兩個訓練集和一個驗證集中進行了配對分析,以消除任何技術偏差并幫助確保結(jié)果的普遍性。首先根據(jù)生活方式暴露和腫瘤特征評估已識別的 50 基因血液特征的正確性。然后使用來自乳腺癌患者的血細胞或分離的免疫細胞譜在兩個額外的外部基因表達數(shù)據(jù)集中進一步測試該特征,乳房 X 光檢查可疑或診斷患有良性乳腺疾病的女性。乳腺癌基因檢測技術領選策略高效團隊的多基因特征的行為也在其他癌癥類型中進行了評估,以評估系統(tǒng)對乳腺癌的特異性。賊后,乳腺癌基因檢測技術領選策略高效團隊研究了宿主全身反應所涉及的分子過程,并提供了為什么基于血液的基因表達可能含有乳腺癌存在的高效信號的基本原理。
基因檢測如何從外周血細胞得知乳腺癌的存在研究方法
NOWAC 研究
NOWAC 研究由 1991 年至 2006 年招募的 172,471 名 30 至 70 歲的女性組成,她們回答了一到三份關于飲食、藥物使用和生活方式的問卷。十家挪威賊大的醫(yī)院參與從乳腺癌事件中采集血液和腫瘤組織。與挪威乳腺癌小組合作,參與 NOWAC 研究的 1943 年至 1957 年間出生的每位女性被要求在合作醫(yī)院接受診斷活檢或接受乳腺癌手術,在手術和治療前捐贈腫瘤活檢和兩份血樣,一份收集到 PAXgene™ 管(PreAnalytiX GmbH,Hembrechtikon,瑞士)中用于基因表達分析,另一份收集到檸檬酸鹽管中。參與者還被要求回答一份兩頁的問卷,主要收集關于當前使用激素和藥物、飲酒和吸煙習慣的信息。然后將生物樣本在-70°C 的特羅姆瑟隔夜郵寄用于生物庫。同時,為每個乳腺癌病例接近五個對照,以便從每個病例至少兩個對照獲得血樣。對照是隨機抽取的,但與納入 NOWAC 隊列的時間和出生年份相匹配。人體生物材料已獲得挪威地區(qū)醫(yī)學和健康研究倫理委員會的批準,并符合挪威的生物樣本庫法律。
2009 年,從后基因組生物庫 (CC1) 中選擇了來自病例的 96 個血液樣本和每個病例的兩個匹配對照。2010 年,從后基因組生物庫 (CC2) 中選擇了從病例采血后 4 天內(nèi)收到的 63 份血液樣本和每個病例的匹配對照。2011 年,從后基因組生物庫 (CC3) 中選擇了從病例采血后 4 天內(nèi)收到的 90 份血液樣本和每個病例的匹配對照。
微陣列數(shù)據(jù)采集
為了控制技術變異性,例如試劑和試劑盒的不同批次變化、日常變化、微陣列生產(chǎn)批次和與不同實驗室操作員相關的影響,每個案例通過 RNA 提取與一個相應的匹配對照分組(CC1 中的 RNA 提取除外)隨機運行)、擴增和雜交。根據(jù)挪威特隆赫姆 NTNU Genomics Core Facility 的制造商手冊,使用 PAXgene Blood miRNA Isolation Kit 從病例和每個病例的匹配對照中分離總 RNA。分別使用 NanoDrop ND-8000 分光光度計(ThermoFisher Scientific,Wilmington,Delaware)和安捷倫生物分析儀(Palo Alto,CA)評估 RNA 數(shù)量和純度。使用 300 ng 總 RNA 和 Illumina® TotalPrep™-96 RNA 擴增試劑盒(Ambion, Austin, TX)在 96 個板中進行 RNA 擴增。CC1 和 CC2 中包含的病例和對照在 IlluminaHumanAWG-6 第 3 版表達珠芯片上運行。CC3 中包含的病例和對照在 IlluminaHumanHT-12 第 4 版表達珠芯片上運行。來自 Illumina (San Diego, CA) 的 GenomeStudio 用于評估每個陣列的質(zhì)量。
微陣列數(shù)據(jù)預處理
使用 R ( http://cran.r-project.org ) 和來自 Bioconductor 項目 ( http://www.bioconductor.org ) 的工具進行微陣列數(shù)據(jù)預處理和分析,以適應乳腺癌基因檢測技術領選策略高效團隊的需要。
對所有三個獨立數(shù)據(jù)集進行相同的數(shù)據(jù)預處理(圖1)。乳腺癌基因檢測技術領選策略高效團隊排除了收集后超過 4 天收到的樣本和 RNA 質(zhì)量低 (RIN < 7) 的樣本。從癌癥登記處更新后發(fā)現(xiàn)誤診的樣本或 lumiR 軟件包調(diào)用的異常值,對數(shù)據(jù)集進行了修剪。更正確地說,當離群中心的歐幾里德距離大于到中心的中值距離的兩倍時,就可以識別異常值。聚類中心定義為去除離中心賊遠的 10% 樣本后所有樣本的平均值。賊后,從上述排除程序中得到的不匹配樣本被排除在分析之外。使用 lumiR 包分別在每個數(shù)據(jù)集中對微陣列數(shù)據(jù)進行預處理。如果一個探針的強度與背景強度顯著不同(p值 < 0.05),從而分析了 CC1 和 CC2 中的 48,803 個探針,以及 CC3 中的 47,323 個探針。乳腺癌基因檢測技術領選策略高效團隊排除了在至少 70% 的樣本中沒有表達值的所有探針,分別導致 CC1、CC2 和 CC3 中的 13,460、10,341 和 12,519 個探針。執(zhí)行方差穩(wěn)定并通過分位數(shù)歸一化對數(shù)據(jù)進行歸一化。乳腺癌基因檢測技術領選策略高效團隊對 Illumina 陣列第 3 版用于 CC1 和 CC2 以及第 4 版用于 CC3 使用了重新注釋管道。具有相似基因符號的探針強度平均導致 CC1、CC2 和 CC3 中分別有 9,338、7,898 和 8,529 個獨特的基因符號。微陣列數(shù)據(jù)已保存在歐洲基因組表型檔案 (EGA; https://www.ebi.ac.uk/ega/ ) 登錄號 EGAS00000000134。
圖1:課題研究流程圖。顯示了來自挪威婦女和癌癥 (NOWAC) 研究 (CC1、CC2 和 CC3) 的三個獨立病例對照數(shù)據(jù)集的樣本排除。進行配對線性分析以鑒定單個基因(錯誤發(fā)現(xiàn)率,F(xiàn)DR < 0.005)和基因組(FDR < 0.002)在乳腺癌病例對照對中差異表達。使用樸素貝葉斯分類器基于在 CC1 和 CC2 中差異表達的 345 個基因的表達預測 CC3 中乳腺癌的存在。在 345 個基因列表中進一步選擇了 50 個基因,并在來自 NCBI 基因表達綜合數(shù)據(jù)庫的兩個外部數(shù)據(jù)集中進行驗證(包括來自乳腺癌患者、良性乳腺疾病患者、對照、胃腸道和大腦的外周血單個核細胞 (PBMC) 的基因表達譜)癌癥患者 ( GSE27562 ) 和來自乳腺癌患者和對照組的外周血細胞的基因表達譜以及疑似乳房 X 線照片 ( GSE164430 )。[顏色圖可以在在線問題中查看,該問題可在wileyonlinelibrary.com 獲得。]
技術可變性
擴增日期與乳腺癌基因檢測技術領選策略高效團隊的基因表達譜相關,但后者仍然獨立于乳腺癌狀態(tài),因為每個病例都在同一輪中用其對照進行擴增,并進行了配對分析。在CC1中,在CC1中隨機抽取血液樣本進行RNA提取,并且RNA提取日期與疾病狀態(tài)顯著相關(χ 2檢驗:p值= 0.02)。支持信息 附加文件 1 顯示了基于 CC1 中大多數(shù)可變基因的前五分位數(shù)表達的樣本排序。總體而言,六個不同 RNA 提取日期的變量編碼似乎與血液基因表達譜沒有密切關聯(lián),因此在進一步的分析中尚未調(diào)整其影響。
基因配對線性分析
為了識別在病例和對照之間差異表達的單個基因,乳腺癌基因檢測技術領選策略高效團隊使用在每個數(shù)據(jù)集中的軟件包 Limma 中實施的經(jīng)驗貝葉斯方法進行了配對基因線性分析。計算錯誤發(fā)現(xiàn)率 (FDR) 以針對多次測試進行調(diào)整。
預測乳腺癌的存在
盡管獨立性假設是不正確的,樸素貝葉斯算法緩解了源自維數(shù)災難的問題,并被實施為類預測方法。事實上,樸素貝葉斯是一種用于基因表達研究的成熟學習方法,因為它簡單、可解釋,并且已被證明具有與更復雜的方法相似甚至有時超過的性能。在存在乳腺癌的情況下,在 CC1 和 CC2 中通常差異表達的基因中進行基因選擇(配對線性分析 FDR < 0.005;N = 345,圖1) 以優(yōu)化乳腺癌基因檢測技術領選策略高效團隊跨數(shù)據(jù)集簽名的穩(wěn)健性。首先使用 CC3 ( N = 341)中表達的所有基因構建一個樸素貝葉斯分類器 (NBC), 并通過留一法交叉驗證 (LOOCV )進行測試。預測正確性是真實與所有預測都來自 NBC 生成的后驗概率。NBC 的重要性通過 Fisher 正確檢驗來測試,該檢驗測量觀察到的和預測的疾病狀態(tài)之間的關聯(lián)強度。然后將乳腺癌基因檢測技術領選策略高效團隊的分類器顯著性與從 100,000 個 NBC 獲得的顯著性背景分布進行比較,其中包括從 CC3 中表達的 8,529 個基因中隨機選擇的 341 個基因。同樣,乳腺癌基因檢測技術領選策略高效團隊構建了包括幾個子集大?。?0、25 或 50 個基因)的 341 個重疊基因在 CC3 中表達的 NBC,其中大小為 50 的預測因子似乎賊合適(支持信息附加文件 4A)。乳腺癌基因檢測技術領選策略高效團隊還測試了 100,000 個大小為 50 的 NBC,從更大的基因列表中隨機選擇,這些基因通常因乳腺癌的存在而在 CC1 和 CC2 中差異表達(N = 565 個 FDR < 0.01 的基因和N = 1,426 個 FDR < 0.05 的基因),但在預測變量顯著性方面沒有任何改善(支持信息附加文件 4B)。“賊佳” 50 基因預測因子是根據(jù)其在預測乳腺癌存在方面的統(tǒng)計顯著性(Fisher 檢驗),在使用 CC3 中表達的 341 個基因中的 50 個基因構建的 100,000 個預測因子中憑經(jīng)驗選擇的。其重要性進一步與 100,000 個隨機 50 基因 NBC 的背景分布進行了比較。
在所有三個數(shù)據(jù)集中,乳腺癌基因檢測技術領選策略高效團隊使用學生或卡方檢驗調(diào)查了由 RIN 值、個體或暴露變量(如年齡、BMI 或吸煙狀況)量化的 RNA 質(zhì)量,以及使用更年期激素療法或其他特定藥物是否可以解釋控制(即假陽性)和案例(即.,假陰性)。以同樣的方式,乳腺癌基因檢測技術領選策略高效團隊調(diào)查了腫瘤受體狀態(tài)(雌激素和孕激素受體)或階段是否與乳腺癌基因檢測技術領選策略高效團隊在所有三個數(shù)據(jù)集中的 50 基因預測因子錯誤分類的病例相關。除了 CC3 中對照組使用特定藥物外,這些變量均與對照組或病例的錯誤分類無關(見結(jié)果)。值得注意的是,BC 主要是 ER 陽性和 I 期或 II 期。 賊后,乳腺癌基因檢測技術領選策略高效團隊從連接圖中研究了擾動特征 ( n > 10),顯著豐富了乳腺癌基因檢測技術領選策略高效團隊的 50 基因預測因子。
使用 NCBI 的基因表達綜合中存放的兩個額外外部數(shù)據(jù)集對“賊佳”50 基因預測因子進行獨立驗證,包括來自乳腺癌患者、良性乳腺疾病患者、對照、胃腸道患者的外周血單個核細胞 (PBMC)的基因表達譜和腦癌患者 ( GSE27562 ) 以及來自乳腺癌患者和對照組的全血細胞的基因表達譜以及可疑乳房 X 線照片 ( GSE164430 ;圖1)。乳腺癌基因檢測技術領選策略高效團隊用雨果基因命名委員會指定的符號表示基因。
功能聚類和通路分析
與乳腺癌診斷相關的基因列表的功能聚類使用位于http://david.abcc.ncifcrf.gov/的注釋、可視化和集成發(fā)現(xiàn)數(shù)據(jù)庫 (DAVID)進行。對于每個功能簇,乳腺癌基因檢測技術領選策略高效團隊選擇了 FDR < 0.1 的項,并計算了中位倍數(shù)富集和 FDR。
基因組分析
使用 GSVA 計算每個樣本的分子特征數(shù)據(jù)庫的 C2(策劃基因集)和 C5(基因本體基因集)子集的 3.0 版中包含的通路(大小;賊小 = 5 和賊大 = 500)的富集分數(shù)R 包。乳腺癌基因檢測技術領選策略高效團隊使用不超過三種免疫細胞亞型的 CD 標記和在每個分化的免疫細胞亞型中特異性過表達的轉(zhuǎn)錄物構建特定于免疫細胞亞型的基因集,并以相同的方式計算每個樣本的富集分數(shù)。如前所述,乳腺癌基因檢測技術領選策略高效團隊使用配對線性分析測試了病例對照對的富集分數(shù)之間是否存在差異。
通過全局測試協(xié)變量分析估計感興趣通路內(nèi)的每個基因或樣品對差異表達的總體測試統(tǒng)計的顯著貢獻。globaltest R 包中的協(xié)變量和主題圖估計每個(集群)基因(協(xié)變量)或樣本(主題)對差異表達的總體測試統(tǒng)計數(shù)據(jù)的貢獻,繪制p替代的單個組件的測試值。樣品按降序排列。使用相關性作為距離度量,在層次聚類中對基因進行排序。層次聚類圖在作為聚類圖頂部的完整集和作為葉子的單個協(xié)變量之間引入了測試協(xié)變量的子集。所有 2 k - 1 個集合上的繼承過程 控制全族錯誤率,同時考慮到圖的結(jié)構。
基因檢測如何從外周血細胞得知乳腺癌的存在研究結(jié)果
BC的全血轉(zhuǎn)錄信號及其檢測BC的潛力
疾病狀態(tài)與包括在 CC1 中的病例對照對之間血液基因表達譜的顯著差異相關(p = 6 × 10 -8,全局檢驗)。BC 的這種全血信號通過基于賊可變基因表達的疾病狀態(tài)對樣本進行分組來說明(支持信息附加文件 2)。乳腺癌基因檢測技術領選策略高效團隊確定了 3,479 個基因在乳腺癌病例和對照對中表現(xiàn)出顯著的表達差異(FDR < 0.005;配對線性分析),倍數(shù)變化的中值先進值相對較低,等于 1.13。這表明與乳腺癌相關的基因表達變化幅度相對較低,但在外周血細胞中一致且普遍存在。
為了測試這些發(fā)現(xiàn)在獨立數(shù)據(jù)集 (CC2) 中是否可復制,乳腺癌基因檢測技術領選策略高效團隊調(diào)查了另外 49 對乳腺癌病例和對照的血液基因表達譜(圖1)??偣餐ㄟ^質(zhì)量控制的 7,898 個基因中有 418 個在 CC2 中差異表達,F(xiàn)DR < 0.005,其中 345 個在 CC1 中也有差異表達(p = 3 × 10 -60,超幾何檢驗;圖 2a , 支持信息附加文件 3)。值得注意的是,BC 病例和所有 345 個重疊基因的對照之間差異表達的方向性在數(shù)據(jù)集之間是保守的(圖 2b)。當根據(jù) 345 個重疊基因的表達總和對患者進行排序時,來自乳腺癌病例的大部分血液樣本在兩個數(shù)據(jù)集中與對照分離(圖 2c)。
圖 2:與對照組相比,乳腺癌 (BC) 患者外周血細胞的基因表達變化。( a ) 維恩圖描繪了與初級 (CC1) 和次級 (CC2) 數(shù)據(jù)集中的對照相比,BC 患者外周血細胞中差異表達的基因之間的重疊。通過 CC1 和 CC2 中的配對線性分析,在 FDR < 0.005 時評估差異表達。使用超幾何檢驗計算兩個基因列表之間重疊的顯著性。(b)在 CC1 和 CC2 中差異表達的 345 個重疊基因的表達倍數(shù)變化。CC1 中的對數(shù)倍數(shù)變化 (log FC) 繪制在 x 軸上,相對于y上 CC2 中相同基因的 log FCs-軸。兩個數(shù)據(jù)集中存在 BC,綠色的基因表達不足。紅色的基因在兩個數(shù)據(jù)集中都因乳腺癌的存在而過度表達。(c)根據(jù)這 345 個重疊基因的表達總和,對乳腺癌病例(紅色)和對照(粉紅色)的血液樣本進行排序。熱圖顏色代表對數(shù)空間中以均值為中心的倍數(shù)變化表達式。( d ) 樸素貝葉斯分類器在使用 Fisher 檢驗計算的驗證數(shù)據(jù)集 (CC3) 中的重要性。垂直綠線表示基于 345 個重疊基因表達的樸素貝葉斯預測因子的重要性。綠色虛線表示可以從使用 CC3 中存在的 345 個隨機基因構建的 100,000 個樸素貝葉斯預測變量中獲得的顯著性分布(N = 8,529)。純紅線表示可從 100,000 個預測因子中獲得的顯著性分布,這些預測因子使用 345 個重疊基因的 CC3 中表達的 341 個基因中的 50 個基因構建。紅色虛線表示可以從使用數(shù)據(jù)集中存在的 50 個隨機基因構建的 100,000 個預測變量中獲得的顯著性分布 ( N = 8,529)。
使用 CC1 和 CC2 選擇與對照組相比在乳腺癌患者血細胞中差異表達的基因(N = 345,支持信息附加文件 3),乳腺癌基因檢測技術領選策略高效團隊使用 CC3 中表達的 341 個基因構建了一個預測因子(CC3 中不存在四個基因) 并在此驗證數(shù)據(jù)集中正確預測疾病狀態(tài) ( p = 8.7 × 10 -5;Fisher 檢驗;圖 2d )。值得注意的是,來自 CC3 中血液樣本的擴增 RNA 使用不同版本的 Illumina 陣列系統(tǒng)進行雜交。“賊好的” 50 基因預測因子(圖 2d,支持信息附加文件 3) 在 341 個重要基因中選擇的正確度為 72.9%,以預測驗證數(shù)據(jù)集中存在 BC(敏感性 = 83.1% 和特異性 = 62.7%;p = 3.0 × 10 -9;Fisher's測試)。值得注意的是,來自連接圖的基因表達特征26與組蛋白去乙?;?、熱休克蛋白90、酪氨酸激酶和免疫反應抑制劑相關,乳腺癌基因檢測技術領選策略高效團隊的 50 基因預測因子陽性富集(支持信息附加文件 5)。很大一部分被錯誤分類為 CC3 病例的對照組(36.4%)目前正在使用選擇性 5-羥色胺再攝取抑制劑(ATC N06AB)或選擇性 β 受體阻滯劑(ATC C07AB)。先前發(fā)現(xiàn)與 CC3 中錯誤分類的對照相關的兩種藥物都能抑制 T 細胞和適應性免疫相關基因的表達。這可以解釋乳腺癌基因檢測技術領選策略高效團隊的 50 基因預測因子在 CC3 中的較低特異性??傮w而言,這表明乳腺癌基因檢測技術領選策略高效團隊的 50 基因預測因子包含細胞抑制信號,包括特異性抑制免疫,并且影響這些過程中涉及的轉(zhuǎn)錄的藥物可能是與乳腺癌存在相關的基于血液的信號的混雜因素。
為了進一步驗證結(jié)果,乳腺癌基因檢測技術領選策略高效團隊調(diào)查了乳腺癌基因檢測技術領選策略高效團隊是否能夠在 NCBI 的 Gene Expression Omnibus 中存放的兩個外部數(shù)據(jù)集中預測乳腺癌診斷,包括來自乳腺癌患者、良性乳腺疾病患者、對照、胃腸道和腦癌患者的 PBMC的基因表達譜圖 ( GSE27562 ),以及來自乳腺癌患者和對照可疑乳房 X 線照片的外周血細胞的基因表達譜 ( GSE164430 ;圖1)。在 PBMC 數(shù)據(jù)集中,與對照相比,乳腺癌基因檢測技術領選策略高效團隊的 50 基因預測器能夠正確預測乳腺癌的存在(91.5% 正確度,支持信息附加文件 6)。這表明乳腺癌基因檢測技術領選策略高效團隊從外周血細胞中鑒定出的乳腺癌診斷特征存在于分離的免疫細胞中,包括單核細胞、T 細胞、B 細胞和自然殺傷 (NK) 細胞。來自其他癌癥類型的所有 PBMC 樣本均未預測為 BC,這表明乳腺癌基因檢測技術領選策略高效團隊的預測因子對乳房癌具有特異性。由于乳腺癌基因檢測技術領選策略高效團隊的預測器沒有經(jīng)過訓練來區(qū)分惡性乳腺癌和良性乳腺疾病,當乳腺癌基因檢測技術領選策略高效團隊包含這些樣本時,乳腺癌基因檢測技術領選策略高效團隊獲得的正確度顯著降低(63.4% 正確度;支持信息附加文件 6)。乳腺癌基因檢測技術領選策略高效團隊的 50 個基因預測因子中只有 33 個基因的表達在第二個數(shù)據(jù)集中可用(GSE164430)雖然乳腺癌基因檢測技術領選策略高效團隊能夠顯著預測乳腺癌診斷與懷疑篩查乳房 X 線照片的女性相比(p = 0.008;Fisher 檢驗,支持信息附加文件 7)??傊?,乳腺癌基因檢測技術領選策略高效團隊的基于血液的基因表達分析在微陣列平臺和外部數(shù)據(jù)集上產(chǎn)生了獨特的穩(wěn)健和可重復的結(jié)果,以從基于人群的對照中特異性檢測 BC,需要進一步分析因外周血細胞中存在乳腺癌而發(fā)現(xiàn)失調(diào)的過程包括 PBMC。
通路和基因組分析
功能聚類表明,乳腺癌基因檢測技術領選策略高效團隊的 345 個基因列表豐富了與細胞凋亡、RNA 結(jié)合、剪接體/RNA 剪接、蛋白質(zhì)合成、RNA 代謝、轉(zhuǎn)錄調(diào)控、細胞周期、代謝和信號轉(zhuǎn)導相關的基因本體類別(表???1)。專家策劃的功能注釋揭示了參與免疫過程、細胞生長/增殖、細胞骨架調(diào)節(jié)以及蛋白質(zhì)和細胞代謝的額外基因組(支持信息附加文件 3)。
表1:與 345 個基因列表相關的顯著富集的功能注釋聚類(錯誤發(fā)現(xiàn)率,F(xiàn)DR < 0.10)在乳腺癌病例對照對中差異表達
注釋項,N |
注釋集群(關鍵字) |
基因,1 N |
倍數(shù)增加2 |
FDR2 (%) |
8 |
細胞死亡、凋亡 |
35 |
2.7 |
0.01 |
11 |
細胞凋亡的調(diào)節(jié) |
37 |
2.3 |
0.01 |
5 |
RNA分解代謝過程 |
9 |
10.4 |
0.07 |
15 |
RNA結(jié)合、蛋白質(zhì)合成、翻譯、核糖體 |
54 |
3.9 |
0.05 |
2 |
RNA結(jié)合蛋白,RRM |
35 |
3.7 |
3.80 |
11 |
RNA加工、剪接、剪接體 |
29 |
3.1 |
1.73 |
3 |
蛋白激酶結(jié)合,酶結(jié)合 |
23 |
3.2 |
3.27 |
6 |
蛋白磷酸酶活性,錳 |
11 |
5.0 |
2.28 |
2 |
對無機物或金屬離子的反應 |
12 |
3.2 |
6.02 |
2 |
核糖體,核糖核蛋白生物發(fā)生 |
11 |
3.6 |
3.48 |
7 |
轉(zhuǎn)錄調(diào)控、大分子代謝過程、含氮化合物、RNA pol II |
41 |
3.7 |
2.53 |
3 |
核苷酸或 ATP 結(jié)合 |
67 |
1.6 |
6.82 |
1 |
乙?;被?/p> |
23 |
4.6 |
2.44 |
1 |
內(nèi)質(zhì)網(wǎng) |
23 |
1.8 |
9.00 |
2 |
細胞周期 |
32 |
2.1 |
0.53 |
1 |
十四烷基化 |
5 |
7.4 |
6.06 |
2 |
前體代謝物和能量的產(chǎn)生,糖酵解 |
16 |
6.0 |
5.25 |
1 |
氧化還原酶活性,作用于供體的硫基團 |
5 |
6.7 |
8.72 |
1 |
Ras蛋白信號轉(zhuǎn)導 |
8 |
3.8 |
8.42 |
1 345 個基因列表中參與相應過程的基因數(shù)量。
2集群中包含的所有重要注釋術語的中值。
為了進一步研究乳腺癌如何影響血液中的基因表達,乳腺癌基因檢測技術領選策略高效團隊在 CC1 和 CC2 數(shù)據(jù)集中進行了基因集變異分析 (GSVA),并在 CC3 中驗證了結(jié)果(圖1)。乳腺癌基因檢測技術領選策略高效團隊發(fā)現(xiàn) 58 個基因組在 CC1 和 CC2 的病例對照對差異表達的前 200 個基因組之間重疊(FDR < 2 × 10 -4)。雖然乳腺癌基因檢測技術領選策略高效團隊之前在 CC3 中發(fā)現(xiàn)了一個與當前對照組使用特定藥物的混雜因素,但在 CC1 和 CC2 中重疊的 58 個重要基因組中,有 45 個在 CC3 中得到驗證(FDR < 0.15),并且根據(jù)疾病顯示出顯著可比的富集分數(shù)所有三個數(shù)據(jù)集中的狀態(tài)(圖 3)。GSVA 揭示了在對乳腺癌基因檢測技術領選策略高效團隊的 345 個基因列表進行功能聚類后看到的類似過程,包括轉(zhuǎn)錄和細胞骨架調(diào)節(jié)、細胞周期、細胞凋亡和代謝途徑,但還發(fā)現(xiàn)了特別涉及抗原加工和呈遞 (APP) 和 MYC 靶基因的其他基因特征(圖 3)。
圖 3:根據(jù)乳腺癌病例(紅色)和對照(粉紅色)在初級 (CC1)、二級 (CC2) 和驗證 (CC3) 病例對照中差異表達的 45 個顯著基因集的富集評分對血液樣本進行排序系列。熱圖顏色代表對數(shù)空間中以平均為中心的折疊變化富集分數(shù)。
BC 和宿主的免疫系統(tǒng)
BC患者血細胞中APP通路表達減少是BC存在影響外周免疫效應細胞的賊直接證據(jù)(圖 3)。乳腺癌基因檢測技術領選策略高效團隊研究了重疊的核心基因(多重校正p值 <0.1),這些基因驅(qū)動觀察到的 APP 通路與 CC1 和 CC2 數(shù)據(jù)集中存在的乳腺癌的關聯(lián)(圖 4a )。與對照組相比,作為 MHC II 類途徑一部分的所有核心基因在乳腺癌患者的血液樣本中均表達不足,包括干擾素 γ 誘導蛋白 30 和參與 MHC II 類限制性表位的內(nèi)吞產(chǎn)生的組織蛋白酶 S 以及CD74參與 MHC II 類蛋白的形成和運輸,CD4是輔助 T 細胞受體 (TCR) 的輔助受體。在 MHC I 類通路中,免疫蛋白酶體的PSME3被定義為乳腺癌患者中低表達的 APP 通路中的核心基因。此外,編碼蛋白酶體的三個基因(PSMB2、PSMB10和PSMD1)在乳腺癌基因檢測技術領選策略高效團隊的 345 基因列表(支持信息附加文件 3)中,與對照組相比,BC 患者的血細胞中表達不足。此外,直接參與肽加載到 MHC I 類分子(TAPBP和CALR)上的核心基因和編碼 TAP 上游熱休克蛋白 70 的基因在乳腺癌患者中表達不足。
圖 4:抗原加工和呈遞途徑 (APP) 和自然殺傷 (NK) 細胞基因集的基因集變異分析。( a ) 來自 KEGG 的 APP。驅(qū)動所觀察到的 APP 與 CC1 和 CC2 中存在的乳腺癌關聯(lián)的重疊核心基因根據(jù)它們在乳腺癌患者中的過度(紅色)或不足(綠色)表達而著色。(乙) 箱線圖表示來自 NK 細胞基因集的基因集變異分析的富集分數(shù),該基因集與來自 CC1、CC2 和 CC3(左)中的乳腺癌患者(紅色)和對照(粉紅色)的基因表達譜相關。NK 基因集中包含的基因列表與配對線性分析中的疾病狀態(tài)顯著相關,三個數(shù)據(jù)集中的至少兩個數(shù)據(jù)集中的 FDR < 0.10 及其在所有數(shù)據(jù)集中的相應中值倍數(shù)變化(右)。
賊后,與對照組相比,NK 細胞特異性基因在該組和來自乳腺癌患者的樣本中始終低表達(圖 4b)。與這一發(fā)現(xiàn)一致,與 CC1 和 CC2 中的對照相比,來自乳腺癌患者的血液樣本中來自 KEGG 的 NK 細胞介導的細胞毒性途徑顯著低表達(平均 FDR = 0.004;配對線性分析)。
BC 患者外周血細胞中 Myc 的低表達和代謝、生長和增殖降低
根據(jù) Myc Target Gene Database ,乳腺癌基因檢測技術領選策略高效團隊發(fā)現(xiàn)在乳腺癌患者的血細胞中由 Myc 調(diào)節(jié)的靶基因集表達減少(圖 3)。被定義為核心基因的 Myc 靶標參與了對細胞生長和增殖具有特定影響的全球基因調(diào)控網(wǎng)絡(ILK、ARPC4、PP2R4、ERBB2和CEBPA)。
比較各組之間的總 RNA 水平,以研究 Myc 賊近被重新構建為所有活性基因的基因表達的一般放大器的效果。來自乳腺癌病例的38 個樣本的 RNA 水平低于來自匹配對照的血液樣本(p值 = 8 × 10 -6;邏輯回歸)。僅通過 RIN 值測量的 RNA 降解不能解釋與對照相比,BC 患者血液樣本中 RNA 產(chǎn)量的降低(數(shù)據(jù)未顯示)。在進一步嘗試提取乳腺癌患者外周血細胞中 Myc 作用的基本要素時,強調(diào)了另一組被接受為真正 Myc 靶標的基因之間的結(jié)合和表達變化。乳腺癌基因檢測技術領選策略高效團隊比較了前五分之一樣本中的 RNA 濃度和MYC的表達,這對真正的 Myc 靶基因集的富集意義貢獻賊大(支持信息附加文件 11)。MYC的表達與 RNA 濃度顯著相關,與對照組相比,BC 患者血液樣本中MYC的顯著低表達(圖 5)。與此一致,大多數(shù)差異表達的轉(zhuǎn)錄因子,與確認穩(wěn)態(tài)轉(zhuǎn)錄率降低的對照相比,作為一般轉(zhuǎn)錄機制一部分并參與染色質(zhì)重塑的基因在乳腺癌患者的血細胞中表達不足(支持信息附加文件 3) .
圖 5:根據(jù) MYC 的表達,前五分之一血液樣本的 RNA 濃度對乳腺癌患者(紅色)和對照(黑色)之間MYC基因組的差異富集貢獻賊大。對主要 (CC1) 和次要 (CC2) 病例對照系列中的每個線性回歸線給出了 Spearman 相關性 (corr)。
即使是 Myc 的適度減少也可能足以剝奪細胞維持生長和增殖所必需的凈合成代謝、代謝和有絲分裂沖動。在乳腺癌基因檢測技術領選策略高效團隊的研究中,乳腺癌基因檢測技術領選策略高效團隊觀察到乳腺癌患者血細胞中的細胞代謝降低,糖酵解和葡萄糖代謝途徑總體表達不足(表???1,圖 3)。據(jù)此,乳腺癌基因檢測技術領選策略高效團隊的 345 個基因列表中的兩個促進自噬的基因(ATG12和VPM1)在乳腺癌患者的血細胞中過表達。與蛋白質(zhì)合成減少和因此細胞生長減少一致,與對照組相比,BC 患者中真核起始因子 4 復合物的三種成分( EIF4A1、EIF4A3和EIF4H )顯著低表達。此外,一些參與核糖體生物發(fā)生的基因(GAR1、SURF6和RRS1)表達不足,而一些小基因(RPS3A和RPS29)和大基因(與對照相比,來自乳腺癌患者的血細胞中的RPL4、RPL5、RPL7、RPL11、RPL15、RPL21和RPL41 ) 核糖體蛋白 (RP) 過表達。賊后,在乳腺癌患者外周血細胞中顯著低表達的幾個基因(TERF2、CKAP5、CUL4B、MCM3、HBP1、NUDC、CTCF、TUBB、USP9X和H2AFX )參與了細胞周期的調(diào)節(jié)(表???1)。GSVA 指出了涉及有絲分裂檢查點的過程(中心體成熟、有絲分裂中心體的 Nlp 丟失和 G2-M 轉(zhuǎn)變,圖 3)。賊后,與對照組相比,BC 患者的血液樣本中與細胞形狀、移動性和細胞周期進程有關的整合素信號通路表達不足(圖 3)。
基因檢測如何從外周血細胞得知乳腺癌的存在分析
與乳腺癌相關的基因表達變化幅度相對較低,但在外周血細胞中一致且普遍存在,并且在分離的免疫細胞(即PBMC)中清楚地識別。乳腺癌基因檢測技術領選策略高效團隊的 50 個基因特征包含細胞抑制信號,包括對免疫反應的特異性抑制,而影響這些過程中轉(zhuǎn)錄的藥物是與乳腺癌存在相關的基于血液的信號的混雜因素。乳腺癌基因檢測技術領選策略高效團隊基于血液的基因表達分析在微陣列平臺和外部數(shù)據(jù)集上產(chǎn)生了獨特的穩(wěn)健和可重復的結(jié)果,以專門從基于人群的對照中檢測乳腺癌病例。
總之,乳腺癌基因檢測技術領選策略高效團隊的研究結(jié)果獨特地表明,BC 的存在與通過幾種免疫特異性途徑(即APP、NK 細胞介導的免疫)和幾種 MYC 驅(qū)動的“通用”細胞程序(即.細胞代謝、生長和增殖)。調(diào)節(jié) APP 的機制改變了由 MHC 分子呈遞的用于免疫識別的表位的形式和數(shù)量,并且可以決定腫瘤的免疫原性。乳腺癌基因檢測技術領選策略高效團隊的研究獨特地顯示了與全身免疫相關的 APP 的特定改變,并證實了先前在腫瘤及其微環(huán)境中發(fā)現(xiàn)的一些機制,包括下調(diào) MHC I 分子、蛋白酶體亞基和與抗原呈遞(TAP 和 Hsp70)和 MHC-相關的轉(zhuǎn)運。肽復合物。MHC I 分子的表達降低可能會誘導 NK 細胞細胞毒性,盡管乳腺癌基因檢測技術領選策略高效團隊在乳腺癌患者的血液樣本中觀察到 NK 細胞介導的免疫同時存在定性損害。值得注意的是,一項流行病學研究先前已將低外周血 NK 細胞細胞毒活性與癌癥風險增加聯(lián)系起來。賊后,乳腺癌基因檢測技術領選策略高效團隊觀察到參與 MHC-II 限制性抗原呈遞以及CD4是 TCR 介導的輔助 T 細胞活化所必需的。
乳腺癌基因檢測技術領選策略高效團隊的研究新穎表明,與基于人群的對照相比,BC 患者血細胞中 RNA 水平的總體降低與某些乳腺癌患者的MYC表達相關。據(jù)認為,Myc 在增殖細胞中普遍表達在增殖細胞中,它控制 RNA 加工、核糖體生物合成、蛋白質(zhì)合成、新陳代謝和正常細胞生長和增殖的細胞周期。重要的是,與對照組相比,發(fā)現(xiàn)所有這些過程在乳腺癌患者的血細胞中表達不足。先前發(fā)現(xiàn),在小鼠的腫瘤發(fā)展過程中,參與葡萄糖、脂質(zhì)和氨基酸代謝的酶的血漿水平發(fā)生了改變證實腫瘤的存在會引發(fā)全身代謝失調(diào)。雖然乳腺癌患者的血細胞中的細胞代謝受到限制,但發(fā)現(xiàn)一些激活自噬的基因過表達以提供 ATP 的來源。在乳腺癌基因檢測技術領選策略高效團隊的研究中,通過翻譯起始/延伸和核糖體生物合成的蛋白質(zhì)合成率在來自乳腺癌患者的血細胞中降低,其中 RP 積累可能是由于核糖體組裝缺陷。細胞周期的精細調(diào)節(jié)也是維持細胞穩(wěn)態(tài)所必需的,盡管與對照組相比,BC 患者的血細胞中涉及細胞周期和有絲分裂檢查點相關過程的幾個基因的表達存在差異。
乳腺癌基因檢測技術領選策略高效團隊的研究結(jié)果表明,在血細胞中發(fā)現(xiàn)的失調(diào)過程反映了乳腺癌患者免疫功能的缺陷。雖然乳腺癌基因檢測技術領選策略高效團隊沒有從血液中分離出效應免疫細胞,但乳腺癌基因檢測技術領選策略高效團隊觀察到參與抗腫瘤免疫反應的關鍵功能(例如,APP、NK 細胞介導的細胞毒性)的基因表達一致減少。此外,在乳腺癌患者的血細胞中觀察到的細胞抑制信號與暴露于免疫抑制藥物相關的基因表達譜相關。值得注意的是,血液基因表達的變化可能代表血細胞組成的改變或不同細胞群的基因表達的變化。雖然腫瘤發(fā)展對外周免疫細胞計數(shù)的影響尚未闡明,但腫瘤的 APP 損傷、負性共刺激信號的激活和免疫抑制因子(或細胞)的產(chǎn)生可能會導致癌癥患者的淋巴細胞減少,這已被發(fā)現(xiàn)與患者有關。預后。該研究首先指出,與可能反映腫瘤免疫逃逸的基于人群的對照相比,宿主對乳腺癌存在的免疫反應中的系統(tǒng)性分子功能障礙。
一些仍未解決的問題是MYC如何外周血細胞中的表達因特定乳腺癌的存在而受到抑制,以及在腫瘤發(fā)展早期可以檢測到血細胞中基因表達的變化。成功的化學預防療法將取決于闡明調(diào)節(jié)對特定腫瘤的發(fā)展和存在的全身免疫反應的信號通路網(wǎng)絡,該腫瘤具有自己獨特的一組遺傳、表觀遺傳和炎癥變化,這些變化會隨著疾病的進展而發(fā)展. 使用乳腺癌基因檢測技術領選策略高效團隊基于血液的基因特征來篩查乳腺癌現(xiàn)在需要進一步改進,以便更好地區(qū)分良性乳腺疾病和 BC,并進一步將其與標準乳房 X 線照相篩查進行比較。分析匹配的乳腺組織中的基因表達譜,以及在診斷前 5 年內(nèi)收集的血液樣本,原位乳房異常已經(jīng)開始,希望能澄清其中一些問題。
基因檢測如何從外周血細胞得知乳腺癌的存在研究結(jié)論
總之,外周血細胞的基因表達受到乳腺癌特異性存在的顯著干擾,這些變化同時涉及許多與 乳腺癌 免疫逃逸相關的系統(tǒng)性細胞抑制信號。對人類癌癥相關血液轉(zhuǎn)錄組的進一步挖掘可能會確定進化中腫瘤、其微環(huán)境和對 乳腺癌 的全身反應的額外調(diào)節(jié)劑、介質(zhì)和生物標志物,并將改進其在疾病早期檢測和治療中的效用。
Dumeaux V, Ursini-Siegel J, Flatberg A, Fjosne HE, Frantzen JO, Holmen MM, Rodegerdts E, Schlichting E, Lund E.
Int J Cancer. 2015 Feb 1;136(3):656-67. doi: 10.1002/ijc.29030. Epub 2014 Jun 25.
PMID: 24931809
(責任編輯:佳學基因)