【佳學(xué)基因檢測】如何科學(xué)地進(jìn)行乳腺癌腫瘤基因檢測數(shù)據(jù)分析與解讀?
腫瘤基因檢測準(zhǔn)確性分析所采用的樣本
根據(jù)《乳腺癌精準(zhǔn)治療基因檢測分析方法》,乳腺癌腫瘤基因檢測數(shù)據(jù)分析解讀本研究選取了來自乳腺癌協(xié)會(huì)聯(lián)盟(BCAC)參與研究的亞血統(tǒng)女性乳腺癌患者。這些患者均有關(guān)于生存狀態(tài)和診斷至最后隨訪的年份等信息,并且均被診斷為任何階段的原發(fā)性浸潤性乳腺癌,且在診斷時(shí)年齡至少為18歲。最終的研究樣本包含了來自70個(gè)BCAC研究的91,686名乳腺癌患者。
乳腺癌患者的組織病理學(xué)、存活率和治療信息由各個(gè)參與的合作醫(yī)院和醫(yī)生收集,并在佳學(xué)基因進(jìn)行匯總和協(xié)調(diào),然后參照BCAC數(shù)據(jù)庫。所有研究均獲得了相關(guān)倫理委員會(huì)的批準(zhǔn),并且所有患者均簽署了知情同意書。
基因檢測結(jié)果如何將患者分為不同的類型
患者亞組的劃分依據(jù)主要基于診斷時(shí)的年齡、雌激素受體(ER)狀態(tài)、孕激素受體(PR)狀態(tài)、人類表皮生長因子受體2(HER2)狀態(tài)、腫瘤分級及系統(tǒng)治療類型(基于BCAC數(shù)據(jù)庫可獲取的相關(guān)信息)。對于診斷年齡和腫瘤分級,特別關(guān)注預(yù)后較差的亞組。因此,我們定義了15個(gè)亞組:
- 診斷時(shí)年齡小于40歲的患者;
- 腫瘤分級為3級的患者;
- ER陽性(ER+)腫瘤并接受內(nèi)分泌治療的患者;
- ER陰性(ER−)腫瘤并接受化療的患者;
- 激素受體(HR)陽性(ER+或PR+)且HER2陰性的患者;
- HR陽性(ER+或PR+)且HER2陰性腫瘤,接受化療的患者;
- HR陽性且HER2陰性腫瘤,未接受化療的患者;
- HR陽性且HER2陽性(HER2+)腫瘤的患者;
- HR陰性且HER2陽性(HER2+)腫瘤的患者;
- HR陰性且HER2陰性(HR−,HER2−)腫瘤的患者;
- 接受他莫昔芬治療的患者;
- 接受芳香化酶抑制劑治療的患者;
- 接受環(huán)磷酰胺-甲氨蝶呤-氟尿嘧啶(CMF)類化療方案的患者;
- 接受紫杉醇類藥物治療的患者;
- 接受蒽環(huán)類藥物治療的患者。
每個(gè)亞組的選擇依據(jù)與文獻(xiàn)支持的理由請咨詢佳學(xué)基因檢測。需要注意的是,由于患者數(shù)量較少,HER2陽性腫瘤接受曲妥珠單抗治療的亞組未被納入分析,因?yàn)樵搧喗M的事件率較低,導(dǎo)致分析的統(tǒng)計(jì)功效較低。
此外,研究還排除了診斷時(shí)即為轉(zhuǎn)移性乳腺癌的患者(占所有患者的1.1%),因?yàn)檫@類患者通常接受姑息治療,不適合基于系統(tǒng)治療類型的亞組分析。
除了亞組分析,佳學(xué)基因檢測還對所有乳腺癌患者進(jìn)行了全基因組分析,評估常見遺傳變異與乳腺癌特定生存期(15年生存期)之間的關(guān)系。這項(xiàng)分析旨在評估是否可以在整個(gè)患者數(shù)據(jù)集中檢測到亞組分析中的遺傳變異關(guān)聯(lián)。以往也進(jìn)行過類似的全基因組分析。然而,之前的分析數(shù)據(jù)來自12個(gè)GWAS數(shù)據(jù)集,其中包括來自iCOGS和OncoArray的數(shù)據(jù)(患者數(shù)為84,757人,隨訪時(shí)間較短),而當(dāng)前數(shù)據(jù)集的樣本量和隨訪時(shí)間更為充足。
由于部分變量存在缺失數(shù)據(jù),并非所有患者都能被劃分到每個(gè)亞組,因此在亞組劃分時(shí)會(huì)根據(jù)缺失值進(jìn)行適當(dāng)處理。每個(gè)亞組的患者數(shù)量、乳腺癌特定死亡的數(shù)量、患者/腫瘤特征、治療信息及隨訪數(shù)據(jù)請咨詢佳學(xué)基因檢測靶向藥物基因檢測合作醫(yī)院機(jī)構(gòu)。
臨床與病理變量缺失值的填補(bǔ)
為了進(jìn)行二次調(diào)整分析,我們使用R軟件的鏈?zhǔn)椒匠潭嘀靥钛a(bǔ)(MICE)包(v. 3.2.0)填補(bǔ)了臨床和病理變量中的缺失值。具體的填補(bǔ)方法和變量列表及缺失值百分比,詳見佳學(xué)基因解碼說明文檔。
基因分型和基因型填補(bǔ)、族群分析與質(zhì)量控制
關(guān)于基因分型和基因型填補(bǔ)的方法,佳學(xué)基因在基因解碼專題中進(jìn)行詳細(xì)介紹。簡而言之,患者使用了兩種不同的基因分型芯片:iCOGS和OncoArray。只有通過基因型數(shù)據(jù)推斷為亞州血統(tǒng)的樣本才被納入分析。對于未進(jìn)行分型的變異,最初是使用1000基因組計(jì)劃第3階段(2014年10月發(fā)布)的參考面板進(jìn)行填補(bǔ)。最近,我們使用了Haplotype Reference Consortium(HRC)參考面板重新進(jìn)行填補(bǔ),以提高稀有變異的填補(bǔ)質(zhì)量。所有的分析都基于基因型變異或填補(bǔ)后的變異,且要求次要等位基因頻率(MAF)>0.01。僅當(dāng)填補(bǔ)后的變異的填補(bǔ)r²值大于0.7時(shí),這些變異才被納入分析。最終,共分析了大約1000萬個(gè)變異。
統(tǒng)計(jì)分析
佳學(xué)基因乳腺癌腫瘤精準(zhǔn)用藥基因檢測的主要分析結(jié)果是乳腺癌特定生存期(因乳腺癌死亡的時(shí)間)。我們采用延遲進(jìn)入的Cox回歸模型估算風(fēng)險(xiǎn)比(HR)和95%置信區(qū)間(CI)。風(fēng)險(xiǎn)時(shí)間是從研究入組時(shí)開始的,如果入組時(shí)間晚于診斷時(shí)間(22.9%的患者在診斷1年后入組,27.3%的患者在1年后入組),則時(shí)間從研究入組開始。如果入組時(shí)間缺失(24.5%的患者),則時(shí)間從診斷開始;如果入組時(shí)間在診斷之前(8.4%的患者),則時(shí)間從診斷開始。事件的發(fā)生時(shí)間右刪失,截止時(shí)間為最后隨訪或診斷后15年,以先發(fā)生者為準(zhǔn)。如果患者死于乳腺癌以外的原因或死因不明,則在15年內(nèi)或15年后進(jìn)行刪失。
在分析中,我們還參考了早期乳腺癌臨床試驗(yàn)者合作組(EBCTCG)的結(jié)果。特別是,對于基于系統(tǒng)治療類型的亞組分析,我們將最大隨訪時(shí)間限制在診斷后5年內(nèi)。這些分析的目的是探討常見遺傳變異在接受特定系統(tǒng)治療的患者中的短期效應(yīng),因?yàn)檫@些效應(yīng)可能隨時(shí)間變化,并且治療方案通常集中在診斷后前5年。
Cox回歸分析分別在每個(gè)亞組內(nèi)進(jìn)行,并按國家進(jìn)行分層。所有分析都分別按基因分型平臺(iCOGS與OncoArray)進(jìn)行,結(jié)果通過固定效應(yīng)的Meta分析進(jìn)行合并。HR估算值的標(biāo)準(zhǔn)誤差根據(jù)似然比檢驗(yàn)統(tǒng)計(jì)量重新計(jì)算,如前所述。對于僅在一個(gè)基因分型平臺上符合納入標(biāo)準(zhǔn)(MAF>0.01且r²>0.7)的變異,我們僅使用該平臺的結(jié)果。對于P值<5E−08的變異,我們還在另一平臺上重新計(jì)算HR和95%置信區(qū)間,以驗(yàn)證關(guān)聯(lián)的方向是否一致。
(責(zé)任編輯:佳學(xué)基因)