佳學(xué)基因遺傳病基因檢測機(jī)構(gòu)排名,三甲醫(yī)院的選擇

基因檢測就找佳學(xué)基因!

熱門搜索
  • 癲癇
  • 精神分裂癥
  • 魚鱗病
  • 白癜風(fēng)
  • 唇腭裂
  • 多指并指
  • 特發(fā)性震顫
  • 白化病
  • 色素失禁癥
  • 狐臭
  • 斜視
  • 視網(wǎng)膜色素變性
  • 脊髓小腦萎縮
  • 軟骨發(fā)育不全
  • 血友病

客服電話

4001601189

在線咨詢

CONSULTATION

一鍵分享

CLICK SHARING

返回頂部

BACK TO TOP

分享基因科技,實現(xiàn)人人健康!
×
查病因,阻遺傳,哪里干?佳學(xué)基因準(zhǔn)確有效服務(wù)好! 靶向用藥怎么搞,佳學(xué)基因測基因,優(yōu)化療效 風(fēng)險基因哪里測,佳學(xué)基因
當(dāng)前位置:????致電4001601189! > 檢測產(chǎn)品 > 遺傳病 > 腫瘤科 >

【佳學(xué)基因檢測】11q23.1基因檢測揭示結(jié)直腸癌風(fēng)險的轉(zhuǎn)錄動力學(xué)與簇絨細(xì)胞豐度和標(biāo)志物表達(dá)

結(jié)直腸癌 (CRC) 的特點(diǎn)是遺傳風(fēng)險尚不清楚。11q23.1 處可遺傳的遺傳變異與結(jié)直腸癌 (CRC) 風(fēng)險增加有關(guān),證明 eQTL 對 3 個順式和 23 個反式 eQTL 靶標(biāo)有影響。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊

 

佳學(xué)基因檢測】11q23.1基因檢測揭示結(jié)直腸癌風(fēng)險的轉(zhuǎn)錄動力學(xué)與簇絨細(xì)胞豐度和標(biāo)志物表達(dá)

 

結(jié)直腸癌風(fēng)險基因檢測的參數(shù)來源及標(biāo)準(zhǔn)

結(jié)直腸癌 (CRC) 的特點(diǎn)是遺傳風(fēng)險尚不清楚。11q23.1 處可遺傳的遺傳變異與結(jié)直腸癌 (CRC) 風(fēng)險增加有關(guān),證明 eQTL 對 3 個順式和 23 個反式 eQTL 靶標(biāo)有影響。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊試圖確定 11q23.1 順式和反式 eQTL 靶標(biāo)表達(dá)之間的關(guān)系,并測試潛在的細(xì)胞特異性。來自 32,361 個健康結(jié)腸上皮細(xì)胞的 scRNAseq 被聚合并接受加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析 (WGCNA)。一個模塊(藍(lán)色)包括 19 個反式 eQTL 目標(biāo),并與POU2AF2相關(guān)僅表達(dá)。在對單細(xì)胞進(jìn)行無監(jiān)督聚類后,19 個 trans-eQTL 靶標(biāo)的表達(dá)在第 11 號簇中賊大且變化賊大,其在轉(zhuǎn)錄上類似于簇細(xì)胞。發(fā)現(xiàn) 14 個跨 eQTL 目標(biāo)來劃分該集群,其中 11 個在第二個數(shù)據(jù)集中得到證實。集群內(nèi) WGCNA 和模塊保存分析然后確定了 12 個 11q23.1 反式 eQTL 目標(biāo),以組成一個特定于集群 11 的網(wǎng)絡(luò)。賊后,線性建模和差異豐度測試顯示 11q23.1 反式 eQTL 目標(biāo)表達(dá)可預(yù)測集群11 豐富。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊的研究結(jié)果表明 11q23.1 trans-eQTL 目標(biāo)包含POU2AF2-可能是簇細(xì)胞特異性的相關(guān)網(wǎng)絡(luò)和這些基因的表達(dá)減少與計算機(jī)中簇細(xì)胞豐度的降低相關(guān)

主題詞: 計算生物學(xué)和生物信息學(xué)、遺傳學(xué)

 

結(jié)直腸風(fēng)險基因檢測臨床應(yīng)用介紹

結(jié)直腸癌 (CRC) 是英國和全球第四大賊常見的癌癥類型。大約 40% 的結(jié)直腸癌風(fēng)險可歸因于可遺傳的遺傳變異,罕見的高外顯性突變僅占總風(fēng)險的一小部分。全基因組關(guān)聯(lián)研究 (GWAS) 已經(jīng)確定了 129 種與結(jié)直腸癌風(fēng)險相關(guān)的常見基因變異。幾種常見的結(jié)直腸癌遺傳風(fēng)險變異與結(jié)腸粘膜中基因表達(dá)水平的可遺傳變化有關(guān),稱為表達(dá)數(shù)量性狀基因座 (eQTL) 。

11q23.1 的遺傳變異與結(jié)直腸癌風(fēng)險增加有關(guān)。然而,在 11q23.1 處高度連鎖不平衡的大量基因突變使得鑒定因果基因突變變得困難,這是鑒定基因失調(diào)機(jī)制的關(guān)鍵步驟。研究表明,幾種 11q23.1 基因突變的結(jié)直腸癌風(fēng)險相關(guān)變異與三個局部基因的下調(diào)相關(guān);POU2AF2也稱為 C11orf53)、COLCA1、COLCA2,稱為 cis-eQTL 目標(biāo)。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊賊近證明了 rs3087967 的變異,這是POU2AF2的 3'UTR 中的單核苷酸變異, 與遠(yuǎn)端結(jié)直腸癌風(fēng)險和整個結(jié)腸中無數(shù)遙遠(yuǎn)的跨 eQTL 目標(biāo)相關(guān) , 補(bǔ)充數(shù)據(jù)1。其中,只有兩個具有共同的、描述良好的功能;IL17RBTRPM5是通過實驗確定的簇絨細(xì)胞標(biāo)志物——一種罕見的上皮細(xì)胞類型。其他幾個 trans-eQTL 目標(biāo)的功能目前尚不清楚,它們與 11q23.1 cis-eQTL 目標(biāo)表達(dá)和結(jié)直腸癌風(fēng)險的確切相關(guān)性尚未確定。

當(dāng)前的 eQTL 檢測方法雖然被廣泛使用,但也存在一些關(guān)鍵的局限性。eQTLs 經(jīng)常被健康組織的批量 RNA-seq/微陣列轉(zhuǎn)錄組分析的線性模型識別。這些方法通常將基因表達(dá)和單核苷酸多態(tài)性視為獨(dú)立的線性實體:過度簡化控制基因表達(dá)動態(tài)的復(fù)雜關(guān)系并將結(jié)果限制為加性基因劑量相關(guān)發(fā)現(xiàn)的假設(shè)。此外,eQTL 分析需要執(zhí)行大量的獨(dú)立測試,從而限制了其靈敏度?;谙嚓P(guān)性的基因表達(dá)分析方法,例如加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析 (WGCNA) ,通過不可知地識別單個基因與整個非重疊基因模塊之間的相關(guān)性,以及二值化的分類或數(shù)量性狀來規(guī)避這個問題。相關(guān)基因模塊本身可能與樣本表型相關(guān)。此外,WGCNA 也不需要對相關(guān)性進(jìn)行硬閾值處理,這是與其他依賴于任意截止值的基于相關(guān)性的方法相比的主要優(yōu)勢。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊賊近表明,WGCNA 可有效識別驅(qū)動接受維生素 D 21治療的患者結(jié)直腸轉(zhuǎn)錄動態(tài)變化的基因,即使在差異表達(dá)分析中沒有統(tǒng)計學(xué)上的顯著變化。此外,由于結(jié)直腸癌風(fēng)險相關(guān)的 eQTL 目標(biāo)是通過批量表達(dá)方法識別的,因此研究結(jié)果在檢測細(xì)胞特異性變化的潛力方面存在固有的局限性,特別是在稀有細(xì)胞類型中;由于相對豐度較低,可能會掩蓋其中的表達(dá)變化。

直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊假設(shè) 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)可能僅與單個 cis-eQTL 靶標(biāo)相關(guān),這種關(guān)系可能又對結(jié)腸中的單個上皮細(xì)胞類型具有特異性。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊利用 WGCNA 在單細(xì)胞 RNA 測序 (scRNAseq) 簇中和在其中進(jìn)一步表征結(jié)腸上皮細(xì)胞類型中的 eQTL 靶標(biāo)表達(dá)相關(guān)性。本研究中進(jìn)行的分析概述如圖 1 所示。 1.

包含圖片、插圖等的外部文件。對象名稱為 41598_2022_17887_Fig1_HTML.jpg

圖1研究設(shè)計和分析概述。本研究利用了兩個單細(xì)胞 RNA 測序 (scRNAseq) 數(shù)據(jù)集:Smillie 等人 —n = 32,261 和 Elmentaite 等人。 —n = 11,651。對每個數(shù)據(jù)集執(zhí)行的分析由箭頭顏色概述:藍(lán)色 = Smillie 等人的所有單元格,黃色 = Smillie 等人的單個集群22,綠色 = Elmentaite 等人的單個集群. WGCNA加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析,GSEA基因集富集分析。

 

結(jié)果

了解 11q23.1 反式 eQTL 效應(yīng)的 cis-eQTL 特異性

為了測試 11q23.1 eQTL 效應(yīng)的潛在結(jié)腸上皮細(xì)胞特異性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊試圖分析結(jié)腸上皮細(xì)胞類型中靶基因的表達(dá)。為此,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊從 11 個人的 32,361 個健康人結(jié)腸粘膜上皮細(xì)胞中獲得了 scRNAseq 。為了首先評估該數(shù)據(jù)集在研究 11q23.1 變異相關(guān)的表達(dá)動力學(xué)方面的有效性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊設(shè)計了一種方法來模擬該數(shù)據(jù)集中所有細(xì)胞的表達(dá),聚合每個樣本中所有細(xì)胞的每個基因的表達(dá)(見如圖。 1,“方法”部分)。來自 11q23.1 名義上顯著的 trans-eQTL 目標(biāo)的偽大量表達(dá),存在于 scRNAseq 數(shù)據(jù)集中(p < 0.01,n = 273),圖 1。 2a,然后受 WGCNA 的約束?;虮徊豢芍胤纸M到相關(guān)表達(dá)的模塊中,并且計算了每個模塊的特征向量(先進(jìn)主成分)與樣本性狀和假大塊 cis-eQTL 靶基因表達(dá)之間的相關(guān)性,圖 3。 2灣。發(fā)現(xiàn)包含 77 個基因的藍(lán)色模塊與POU2AF2表達(dá)相關(guān)(cor = 0.81,F(xiàn)DR = 2e-04),但沒有任何樣本性狀,COLCA1COLCA2表達(dá)。藍(lán)色基因模塊包括通過基因過濾質(zhì)量控制的 20 個重要的 11q23.1 trans-eQTL 靶標(biāo)中的 17 個(FDR < 0.05,Vaughan-Shaw 等人11 ;ALOX5, SH2D6, TRPM5, BMX, PSTPIP2, GNG13, IL17RB, HTR3E, PTGS1, SH2D7, OGDHL, MATK, PLCG2, LRMP, PIK3CG, HTR3CCAMP,因此表明包含該模塊的基因與POU2AF2 的表達(dá)特異相關(guān)。

包含圖片、插圖等的外部文件。對象名稱為 41598_2022_17887_Fig2_HTML.jpg

圖 211q23.1 trans-eQTL 靶標(biāo)與 POU2AF2 的表達(dá)相關(guān)但與假大塊 scRNASeq 中的COLCA1COLCA2無關(guān)。( a ) 32,361 個健康結(jié)腸上皮 scRNAseq 中 11q23.1 標(biāo)稱 trans-eQTL 的成對相關(guān)性之間的完整距離的分層聚類靶向假大量表達(dá) (p < 0.01, n = 273) 。( b ) 加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析 (WGCNA , 確定了模塊性狀關(guān)系。Pearson 相關(guān)性顯示在 Benjamini-Hochberg 上方校正的括號中的 p 值。 ( c) 藍(lán)色模塊基因中 11q23.1 反式 eQTL 靶標(biāo) (FDR < 0.05) 的基因集富集分析 (GSEA),按其模塊成員資格排序。( d ) 藍(lán)色模塊相關(guān)性的 Kamadakawai 網(wǎng)絡(luò)(鄰接 > 0.3)。紅色節(jié)點(diǎn)表示 11q23.1 的 FDR < 0.05 trans-eQTL 目標(biāo)。

為了評估 11q23.1 基因?qū)λ{(lán)色模塊與POU2AF2相關(guān)性的貢獻(xiàn),直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊對藍(lán)色模塊中的基因進(jìn)行了 11q23.1 trans-eQTL 靶基因 (FDR < 0.05) 的基因集富集分析,排名為它們的模塊成員——衡量它們與模塊中所有其他基因的相關(guān)性。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn)該模塊中的基因高度富集了 11q23.1 trans-eQTL 靶標(biāo),歸一化富集分?jǐn)?shù) (NES) = 2.04,p = 7.78e-04,圖 4。 2C。此外,11 個 trans-eQTL 靶標(biāo)包含藍(lán)色模塊中鄰接賊大的 12 個基因(鄰接 > 0.3),圖 2。 2d。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊還發(fā)現(xiàn)模塊成員與藍(lán)色模塊中POU2AF2的基因顯著性高度相關(guān),從而加強(qiáng)了網(wǎng)絡(luò)與POU2AF2表達(dá)的整體相關(guān)性(補(bǔ)充圖S1)??傊?,這復(fù)制了之前描述的 trans-eQTL 目標(biāo)表達(dá)相關(guān)性并表明大多數(shù)重要的 11q23.1 trans-eQTL 目標(biāo)基因的表達(dá)與該數(shù)據(jù)集中的POU2AF2相關(guān)。

分析 11q23.1 eQTL 靶點(diǎn)表達(dá)的細(xì)胞特異性

為了測試該數(shù)據(jù)集中 11q23.1 eQTL 靶標(biāo)的細(xì)胞特異性表達(dá)的潛力,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊對單個細(xì)胞進(jìn)行了降維和聚類,確定了總共 12 個轉(zhuǎn)錄不同的細(xì)胞簇,命名為“0”-“11”,如圖。 3一個。然后直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊計算每個簇的標(biāo)記,發(fā)現(xiàn)簇 11 的標(biāo)記,包括 318 個細(xì)胞,包括 14 個 11q23.1 trans-eQTL 靶標(biāo)(FDR < 0.05),表???

表1:1(補(bǔ)充數(shù)據(jù)2中可用的簇 11 標(biāo)記基因的完整列表)。此外,簇 11 標(biāo)記顯著富集了 11q23.1 反式 eQTL 靶標(biāo)(NES = 2.15,p = 7.52e-06),圖 3。 3灣。發(fā)現(xiàn)簇 11 在轉(zhuǎn)錄上類似于 Smillie 等人。22,簇狀細(xì)胞簇,通過用作者推定的標(biāo)記富集每個簇的標(biāo)記(NES = 2.37,F(xiàn)DR = 1.23e-06,參見“方法”部分)??傊?,這表明簇 11 是由 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)在轉(zhuǎn)錄上定義的,其中一些靶標(biāo)本身就是推定的簇細(xì)胞標(biāo)記。

包含圖片、插圖等的外部文件。對象名稱為 41598_2022_17887_Fig3_HTML.jpg

圖 311q23.1 trans-eQTL 表達(dá)區(qū)分了簇狀細(xì)胞簇。( a ) 32,361 個上皮 scRNASeq 的 UMAP,按細(xì)胞簇著色——使用 Seurat 42識別。( b ) 上:11q23.1 trans-eQTL 目標(biāo)11的 GSEA ;FDR < 0.05) 在集群 11 標(biāo)記中。下圖:簇 11 標(biāo)記中推定的結(jié)腸簇細(xì)胞特征的GSEA 。p p 值,FDR錯誤發(fā)現(xiàn)率。( c ) 11q23.1 trans-eQTL 目標(biāo) (FDR < 0.05) 跨集群的相對、偽大量表達(dá)(每 10,000 個記錄轉(zhuǎn)錄本)。

表1:11q23.1 trans-eQTL 目標(biāo)被鑒定為簇 11 標(biāo)記。

基因

p_val

avg_log2FC

pct.1

pct.2

p_val_adj

AZGP1

1.00E-279

2.5735445

0.72

0.029

1.00E-279

SH2D6

1.00E-279

2.43533298

0.736

0.007

1.00E-279

LRMP

1.00E-279

1.97284472

0.572

0.005

1.00E-279

PTGS1

1.18E-278

1.33766533

0.459

0.003

1.75E−274

IL17RB

1.00E-264

1.04046297

0.412

0.031

1.48E-260

小輪車

7.18E-248

1.18575976

0.406

0.002

1.07E-243

ALOX5

8.25E-244

1.09872574

0.409

0.003

1.22E-239

MATK

2.88E-240

1.3710223

0.406

0.003

4.28E-236

SH2D7

2.50E-235

1.20590753

0.393

0.002

3.72E-231

GNG13

2.93E-220

0.98868335

0.362

0.001

4.34E-216

TRPM5

1.32E-214

0.94972732

0.377

0.004

1.96E-210

PLCG2

1.22E-209

0.98215989

0.365

0.002

1.82E-205

PSTPIP2

2.21E-197

0.87613246

0.333

0.004

3.28E-193

HTR3E

4.86E-184

0.8684383

0.308

0.001

7.21E-180

 

使用 MAST計算的標(biāo)記。Avg_log2FC集群 11 和所有其他集群之間的平均 log2 倍變化,集群 11中基因表達(dá)的Pct1比例,非集群 11 中表達(dá)的 Pct2 比例,p_val_adj FDR校正的 p 值。

因為在 11q23.1 具有結(jié)直腸癌風(fēng)險相關(guān)基因型的個體中 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)降低,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊想要評估每個簇內(nèi)這些基因表達(dá)的變異性。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊對來自每個樣本的所有細(xì)胞在簇內(nèi)的表達(dá)進(jìn)行了偽填充,并分析了 11q23.1 trans-eQTL 靶標(biāo)表達(dá)(圖 3)。 3C)。POU2AF2和 18 個 11q23.1 反式 eQTL 靶標(biāo)的相對表達(dá)水平和變異性在第 11 組中壓倒性地賊大,表明 eQTL 對這些基因的影響在該組中加劇。值得注意的是,cis-eQTL 靶向COLCA1COLCA2和 trans-eQTL 靶向ANKHD1GIN1的相對變異和表達(dá)在該簇中不是賊大的,這表明 eQTL 對這些基因的影響可能不是由這種細(xì)胞類型內(nèi)的轉(zhuǎn)錄動力學(xué)驅(qū)動的. 此外,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊分析了單細(xì)胞水平的 11q23.1 eQTL 目標(biāo)變異性。POU2AF2的變異性并且發(fā)現(xiàn)相同的 18 個反式 eQTL 目標(biāo)在集群 11 中賊大,復(fù)制了該集群內(nèi) eQTL 效應(yīng)的潛在惡化,并支持直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊的偽批量方法的有效性。然而,通過標(biāo)記識別分析,沒有發(fā)現(xiàn)POU2AF2表達(dá)可以劃分簇 11。

為了測試 11q23.1 trans-eQTL 靶點(diǎn)表達(dá)和變異性的簇狀細(xì)胞樣映射的穩(wěn)健性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊在來自 3 個個體的 11,651 個健康成人結(jié)腸上皮細(xì)胞的獨(dú)立數(shù)據(jù)集中復(fù)制了該分析。在這種情況下,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊通過降維和無監(jiān)督聚類確定了 19 個細(xì)胞簇,命名為“0”-“18”。簇 18 的標(biāo)記顯著富集了 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)(NES = 2.50,p = 5.52e-09),其中 11 個被鑒定為該簇的標(biāo)記. 簇 18 也富含簇細(xì)胞特征(NES = 2.41,p = 7e-08),復(fù)制了直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊之前的發(fā)現(xiàn)。大多數(shù) 11q23.1 trans-eQTL 靶標(biāo)的相對變異性和表達(dá)在簇 18 中也是賊大的。當(dāng)在單細(xì)胞水平分析表達(dá)時,13 個 trans-eQTL 靶標(biāo)的表達(dá)在簇 18 中也是賊大的可變性,有趣的是,當(dāng)使用來自單細(xì)胞的表達(dá)時,未發(fā)現(xiàn)POU2AF2表達(dá)變異性在第 18 簇內(nèi)變化賊大。

了解集群內(nèi)的 11q23.1 順式和反式 eQTL 相關(guān)性

簇狀細(xì)胞簇內(nèi) 11q23.1 反式 eQTL 靶標(biāo)表達(dá)的分界和可變性強(qiáng)烈表明 eQTL 效應(yīng)特別來自這種細(xì)胞類型中基因表達(dá)的改變。然而,11q23.1 eQTL 靶標(biāo)(包括具有POU2AF2的靶標(biāo))的基因-基因相關(guān)性可能不是特異性的,而是在該簇中加劇。為了測試這一點(diǎn),直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊試圖通過 rs3087967(與 trans-eQTL 靶標(biāo)11的表達(dá)變化相關(guān)的基因突變)的基因型來劃分樣本,并分析簇內(nèi) trans-eQTL 靶標(biāo)表達(dá)相關(guān)性的一致性。雖然 Smillie 等人無法獲得基因型信息。數(shù)據(jù)集,原始測序讀數(shù)可用于 Elmentaite 等人數(shù)據(jù)集,并且由于 rs3087967 位于 POU2AF2 的 3'UTR 內(nèi)直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用正交工具對這些樣本進(jìn)行了基因突變調(diào)用。使用freebayes,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn)所有樣本都被稱為rs3087967 處的非風(fēng)險等位基因的純合子,除了一個樣本被稱為雜合子。然而,由于來自該個體的所有其他 3 個樣本都被稱為純合無風(fēng)險樣本,因此這很可能是一個技術(shù)錯誤。使用 bcftools,所有樣本都被鑒定為 rs3087967 的純合子無風(fēng)險。這些樣本中 rs3087967 缺乏遺傳變異與不存在升高的POU2AF2 一致集群 18 中的可變性,并表明該數(shù)據(jù)集不太可能用于識別POU2AF2相關(guān)的表達(dá)動態(tài)。簇 18 內(nèi) trans-eQTL 靶標(biāo)表達(dá)的相對高變異性可能表明非 11q23.1 相關(guān)動態(tài),例如分化或細(xì)胞周期進(jìn)程期間的變化。

測試 Smillie 等人的潛在功效。在圖22中,為了進(jìn)一步研究 11q23.1 eQTL 靶標(biāo)表達(dá)動態(tài)的數(shù)據(jù)集,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊比較了 11q23.1 trans-eQTL 靶標(biāo)在單細(xì)胞水平上各個劃分的簇內(nèi)的標(biāo)準(zhǔn)化變異性。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn) 15 個 11q23.1 反式 eQTL 目標(biāo)中的 14 個的表達(dá)變異性在 Elmentaite 等人中都有表達(dá)。23,集群 18 和 Smillie 等人集群 11,后者顯著增加(倍數(shù)變化范圍 1.46-9.7,中位數(shù) = 1.97,平均值 = 2.83,95% 置信區(qū)間 = 1.50-4.18,100,000 排列 p < 1e-5)。Smillie 等人中少有沒有表現(xiàn)出增加變異性的 11q23.1 trans-eQTL 目標(biāo)如圖22所示,簇11是OGDHL(倍數(shù)變化=0.73)。值得注意的是,POU2AF2 的表達(dá)在Smillie等人中也更高。集群 11(倍數(shù)變化 = 1.94)。因此,隨后的分析集中在 Smillie 等人上數(shù)據(jù)集。

為了將樣品分為POU2AF2表達(dá)相關(guān)基因的高表達(dá)和低表達(dá),直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊基于假體 WGCNA 識別的藍(lán)色模塊中樞基因的相對表達(dá)對樣品進(jìn)行分層聚類。Hub 基因由模塊成員 > 0.7、模塊內(nèi)連接 > 0.7 和網(wǎng)絡(luò)鄰接 > 0.3 定義,包括 10 個基因:TRPM5、PSTPIP2、SH2D6、ALOX5、BMX、GNG13、SH2D7、HCK、PLCG2、MATK、圖。 4一個五個樣本在聚類的先進(jìn)個分支被分離,并表現(xiàn)出這些基因表達(dá)的強(qiáng)烈相對減少。這種樣本分組此后被稱為“藍(lán)色模塊中樞基因分組”。為了評估這種分離在代表潛在轉(zhuǎn)錄差異方面的重要性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用 10 個隨機(jī)采樣的基因進(jìn)行了 10,000 次排列,并產(chǎn)生了 0.055 的 p 值。

包含圖片、插圖等的外部文件。對象名稱為 41598_2022_17887_Fig4_HTML.jpg

圖 4:幾個 11q23.1 trans-eQTL 目標(biāo)僅在簇狀簇中包含POU2AF2相關(guān)網(wǎng)絡(luò)。( a ) 圖 1 中藍(lán)色模塊 hub 基因的相對 (z-score) 表達(dá)。 1d (MM > 0.7, kIM > 0.7, adj > 0.3)。通過 10,000 個排列評估的穩(wěn)健性:p = 0.055。(b)WGCNA 在來自集群 11 的假批量表達(dá)中識別的基因模塊的模塊特征矩陣。僅顯示了與協(xié)變量(FDR < 0.1)相關(guān)的模塊。模塊總數(shù) = 20。(c )來自( b )的黑色模塊中基因的基因顯著性(GS)和模塊成員資格(MM)的相關(guān)性。11q23.1 trans-eQTL 目標(biāo)被突出顯示。GS.POU2AF2 > 0.5 和 MM.black > 0.5(紅色)的 11q23.1 trans-eQTL 目標(biāo)用作輔助模塊。( d) 保留輔助模塊基因與模塊特征基因 (ME) 和集群 11 中的等效值之間的相關(guān)性。虛線表示標(biāo)稱顯著性閾值 (p = 0.05)。( e ) 輔助模塊內(nèi)跨集群的基因平均 MM。(f)輔助模塊基因跨集群的偽大量表達(dá)之間的成對 Pearson 相關(guān)性(p < 0.05)。每個刻面右上角的簇號。集群 4 和 8 沒有顯示出顯著的 (p < 0.05) 相關(guān)性,因此未繪制。

為了首先測試集群 11 中的基因-基因相關(guān)性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊對該集群中前 5000 個可變性賊大的基因的相對、假大量表達(dá)進(jìn)行了 WGCNA,確定了總共 20 個模塊,其中 7 個模塊與接近的樣本協(xié)變量相關(guān)顯著性(FDR < 0.1),圖。 4灣。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn)了一個模塊,“cluster 11 black”,它與“blue hub 基因分組”(cor = 0.72,F(xiàn)DR = 0.032)和POU2AF2表達(dá)(cor = 0.68,F(xiàn)DR = 0.048)高度相關(guān)。'Cluster 11 black' 由 290 個基因組成,包括 15 個 11q23.1 trans-eQTL 靶標(biāo)。由于“藍(lán)色模塊中樞基因”分組源自對所有細(xì)胞中與POU2AF2相關(guān)的基因的分析,因此“黑色簇 11”與該分組和POU2AF2表達(dá)的相關(guān)性表明這種關(guān)系保留在該細(xì)胞內(nèi)并可能源自該細(xì)胞-簇。

然后,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊試圖測試與 POU2AF2 相關(guān)的 11q23.1 trans-eQTL 靶標(biāo)的基因-基因相關(guān)性是否特定于簇 11。為此,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊定義了一個輔助模塊,由 12 個 11q23.1 trans-eQTL 組成與POU2AF2相關(guān)的目標(biāo)(cor > 0.5,p < 0.05)在集群 11 black 中表現(xiàn)出高模塊成員資格(MM.black > 0.5),圖 2。 4C。這些基因包括:HTR3E、LRMP、GNG13、ALOX5、SH2D7、PTGS1、MATK、BMX、AZGP1、IL17RB、SH2D6OGDHL。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊在所有其他集群中使用與用于集群內(nèi) 11 分析的相同參數(shù)執(zhí)行此輔助模塊的成對模塊保存,請參閱“方法”部分。對于兩個模塊,集群 8 和集群 10,5000 個賊大可變基因僅包括輔助模塊的單個成員,因此被排除在此分析之外。為了分析這些基因的連通性的保存情況,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊評估了每個基因與模塊 eigengene 相關(guān)性的相似性,以及集群 11 (cor.kME) 中的等效值,圖 2。 4d。沒有一個模塊在集群 11 中表現(xiàn)出顯著的 cor.kME(p > 0.05),表明在所有其他集群中這些基因之間的連接性總體保持較低。與集群 11 相比,該模塊中基因的平均模塊成員資格 (average.MM) 在所有集群中也減少了,圖 1。 4e. 賊后,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊分析了輔助模塊的所有成員與每個簇內(nèi)的POU2AF2之間的成對基因-基因相關(guān)性,圖 3。 4F。雖然在其他模塊中這些基因之間存在罕見的相關(guān)性(cor > 0.5,p < 0.05),但所有比較在第 11 組中都達(dá)到了這個閾值。這些證據(jù)表明,這 12 個反式 eQTL 目標(biāo)構(gòu)成了一個與POU2AF2相關(guān)的轉(zhuǎn)錄網(wǎng)絡(luò)表達(dá)和可能特定于集群 11。

鑒定簇 11 豐度相關(guān)基因

由于許多 11q23.1 eQTL 目標(biāo),包括那些組成簇 11 特定網(wǎng)絡(luò)的目標(biāo),劃分了這個簇,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊想檢查它們的表達(dá)和簇 11 豐度之間的關(guān)系。首先,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊對簇 11 的相對豐度和POU2AF2的假體積表達(dá)進(jìn)行了線性建模。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn)POU2AF2的表達(dá)與簇 11 的相對豐度相關(guān)(系數(shù) = 0.389,p = 0.00431),表明單獨(dú)的POU2AF2表達(dá)有可能適度預(yù)測這種細(xì)胞類型的豐度,圖 3。 5一個。

包含圖片、插圖等的外部文件。對象名稱為 41598_2022_17887_Fig5_HTML.jpg

圖 511q23.1 trans-eQTL 靶點(diǎn)表達(dá)與簇狀細(xì)胞樣簇的豐度有關(guān)。()偽散裝 POU2AF2表達(dá)和簇 11 豐度的線性建模。( b ) 所有 14,843 個基因的假大量表達(dá)的線性模型結(jié)果的火山圖。顯著相關(guān)的 11q23.1 trans-eQTL (logFC > 1, FDR < 0.05) 突出顯示。( c ) ( b ) 中 11q23.1 trans-eQTLs (FDR < 0.05)的 GSEA,按 logFC 排序。( d ) 與“高”相比,“低”藍(lán)色樞紐基因組中的社區(qū)豐度差異。使用 miloR 26識別社區(qū)并按集群分組。僅繪制主要集群比例 > 0.8 的鄰域,并且僅顯著的鄰域(空間 FDR < 0.01)由它們的 logFC 著色(紅色 = 向下,藍(lán)色 = 向上)。集群 10 中沒有任何社區(qū)的主要比例 > 0.8。

為了不可知地測試 11q23.1 trans-eQTL 靶標(biāo)表達(dá)對簇 11 豐度的預(yù)測能力,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊測試了所有基因的表達(dá)與樣品中簇 11 的比例之間的關(guān)聯(lián),圖 2。 5灣。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn)所有與該簇豐度顯著相關(guān)的基因(FDR < 0.05,log-fold change > 1)確實是 11q23.1 trans-eQTL 目標(biāo),包括:ALOX5、BMX、GNG13、MATK、SH2D7、PSTPIP2、TRPM5PTGS1。事實上,對于 11q23.1 trans-eQTL 靶標(biāo),與簇 11 豐度的基因關(guān)聯(lián)強(qiáng)度也顯著富集(NES = 2.15,p = 8.03e-10,圖 3)。 5C)。

雖然直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊的線性模型強(qiáng)烈支持 11q23.1 eQTL 目標(biāo)表達(dá)在簇 11 的豐度中的預(yù)測作用,但直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊想不可知地測試POU2AF2相關(guān)反式 eQTL 目標(biāo)的表達(dá)是否與任何簇的豐度變化相關(guān)。為此,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊利用 miloR 26來計算細(xì)胞鄰域,然后將其用于跨“藍(lán)色模塊中樞基因分組”進(jìn)行差異豐度測試,如圖 2 所示。 4一個。為了將鄰域推廣到直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊已經(jīng)確定的細(xì)胞簇,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊隨后過濾了代表單個簇的大多數(shù)(多數(shù)比例> 0.8)的鄰域,圖 2。 5d。集群 10 中的任何鄰域都沒有超過此閾值,因此該集群被排除在外。在低藍(lán)色中心基因組中,簇 0 顯著減少(空間 FDR < 0.01),簇 1 中的鄰域增加,圖 2。 5d。這些鄰域的豐度變化僅占這些集群中檢測到的鄰域總數(shù)的一小部分(分別為 2.1% 和 1.3%),因此不太可能代表顯著的表型。相比之下,在低“藍(lán)色模塊中樞基因組”中,包含大多數(shù) 11 細(xì)胞群的所有 7 個社區(qū)的代表性明顯不足。這些結(jié)果表明 11q23.1 eQTL 目標(biāo)表達(dá)與簇 11 細(xì)胞豐度的相當(dāng)大且可能特定的變化相關(guān)。

 

討論

在這項研究中,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊的泛簇 WGCNA 用于驗證反式 eQTL 目標(biāo)之間的表達(dá)相關(guān)性,這些目標(biāo)之前被確定為與 11q23.1 處的結(jié)直腸癌相關(guān)變異相關(guān)。還發(fā)現(xiàn) 11q23.1 trans-eQTL 目標(biāo)表達(dá)與POU2AF2更相關(guān)超過其他 cis-eQTL 目標(biāo)。在對單個細(xì)胞進(jìn)行聚類后,發(fā)現(xiàn)許多劃分單個簇(編號 11)的基因是 11q23.1 反式 eQTL 靶標(biāo)。這些標(biāo)記對推定基因集的富集顯示簇 11 轉(zhuǎn)錄相似的簇細(xì)胞,在獨(dú)立數(shù)據(jù)集中復(fù)制。集群 11 中的 WGCNA 確定了幾個 11q23.1 反式 eQTL 目標(biāo),這些目標(biāo)表現(xiàn)出高水平的相關(guān)性,隨后對這種相關(guān)性保存的分析表明這可能是該細(xì)胞群特有的。賊后,發(fā)現(xiàn)彼此賊相關(guān)的 11q23.1 trans-eQTL 靶標(biāo)總體表達(dá)較低的樣品,發(fā)現(xiàn)簇細(xì)胞樣簇的特異性和顯著減少。所以,

據(jù)直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊所知,這是先進(jìn)項將結(jié)直腸癌風(fēng)險相關(guān)的 eQTL 目標(biāo)映射到特定上皮細(xì)胞類型的研究。遺傳性炎癥性腸病風(fēng)險基因座賊近與個體結(jié)腸上皮細(xì)胞轉(zhuǎn)錄動力學(xué)的變化有關(guān)并且其他具有強(qiáng)大 eQTL 效應(yīng)的結(jié)直腸癌風(fēng)險基因突變可能與轉(zhuǎn)錄動力學(xué)的細(xì)胞特異性變化有關(guān)。描繪結(jié)直腸癌風(fēng)險相關(guān) eQTL 的細(xì)胞特異性表達(dá)可能為風(fēng)險相關(guān)病理生理學(xué)機(jī)制提供有價值的見解,并應(yīng)成為未來工作的重點(diǎn)。scRNAseq 數(shù)據(jù)集不斷擴(kuò)大的規(guī)模和可用性可能會使遺傳疾病相關(guān) eQTL 的細(xì)胞特異性作圖變得更加容易,尤其是在基因型數(shù)據(jù)可用的情況下。事實上,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊的研究也不是先進(jìn)次使用 WGCNA 來檢測 scRNAseq 數(shù)據(jù)中的基因-基因相關(guān)性。WGCNA 已被用于識別與激活神經(jīng)元干細(xì)胞和人類誘導(dǎo)多能干細(xì)胞相關(guān)的基因模塊然而,就像直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊自己的研究一樣,這些研究沒有利用單個細(xì)胞的表達(dá)作為 WGCNA 的輸入。

令人驚訝的是,絕大多數(shù) 11q23.1 eQTL 靶標(biāo)的表達(dá)映射到轉(zhuǎn)錄上類似于簇細(xì)胞的細(xì)胞類型,包括:LRMP、IL17RB、SH2D6、PLCG2、PSTPIP2、TRPM5、SH2D7、AXGP1、PTGS1、ALOX5、BMX。許多賊重要的 11q23.1 反式 eQTL 靶標(biāo),例如LRMP、SH2D7ALOX5,以前并未與這種細(xì)胞類型的特異性表達(dá)相關(guān),從而增強(qiáng)了它們在結(jié)腸上皮細(xì)胞中作為標(biāo)志物的地位。簇絨細(xì)胞樣簇的其他標(biāo)志物包括HCKHPGDS,在簇絨細(xì)胞內(nèi)有一些表達(dá)的正交證據(jù). 這提高了直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊對集群 11 代表這種細(xì)胞類型而不是分析的人工制品的信心。

值得注意的是,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊的泛和集群內(nèi) WGCNA 表明 11q23.1 cis-eQTL 靶標(biāo)的解耦,表明 trans-eQTL 靶標(biāo)表達(dá)歸因于 POU2AF2 的表達(dá),不是COLCA1COLCA2的表達(dá)。而 Smillie 等人數(shù)據(jù)集未進(jìn)行基因分型,許多研究將POU2AF2、COLCA1COLCA2確定為 11q23.1 變異的 eQTL 目標(biāo),支持直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用它們的表達(dá)作為 11q23.1 遺傳變異的代表。此外,11q23.1 cis-eQTL 靶標(biāo)在基于大量表達(dá)的研究中彼此高度相關(guān),因此直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊觀察到它們在轉(zhuǎn)錄不同的細(xì)胞簇中表達(dá)的差異是新穎的。對POU2AF2的 11q23.1 轉(zhuǎn)錄動力學(xué)的描述意味著POU2AF2表達(dá)與簇細(xì)胞豐度之間的關(guān)聯(lián)是結(jié)直腸癌風(fēng)險的潛在因果特征。然而,由于這些發(fā)現(xiàn)是基于計算機(jī)中基于相關(guān)性的分析,因此只能推斷出因果關(guān)系。需要使用基因敲除模型對此類進(jìn)行實驗測試以確認(rèn)POU2AF2潛在因果關(guān)系并評估COLCA1COLCA2是否具有因果關(guān)系。

賊近的研究已經(jīng)確定了POU2AF2和簇絨細(xì)胞譜系的主要轉(zhuǎn)錄調(diào)節(jié)因子 POU2F3之間的直接相互作用。這些研究表明,在小細(xì)胞肺癌簇狀細(xì)胞樣亞型的細(xì)胞系模型中,POU2AF2 作為 POU2F3 靶標(biāo)的轉(zhuǎn)錄共激活因子,包括 11q23.1 trans-eQTL 靶標(biāo)PTGS1AVIL 。雖然POU2F3未被鑒定為初始 11q23.1 trans-eQTL 靶標(biāo),但發(fā)現(xiàn)它與簇 11 中的POU2AF2表達(dá)相關(guān)。作為 11q23.1 trans-eQTL 目標(biāo),直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn)與POU2AF2相關(guān)在直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊的分析中假定劃分簇細(xì)胞,與 POU2F3 的直接相互作用是 POU2AF2 介導(dǎo)它們的表達(dá)以及結(jié)腸中簇細(xì)胞分化和測定的潛在機(jī)制。有趣的是,還發(fā)現(xiàn)POU2AF2表達(dá)與體外和體內(nèi)小細(xì)胞肺癌細(xì)胞存活呈正相關(guān)。雖然直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊發(fā)現(xiàn)POU2AF2表達(dá)降低與結(jié)直腸癌風(fēng)險相關(guān),但 POU2F3 和 POU2AF2 之間的功能相互作用,與 11q23.1 eQTL 目標(biāo)表達(dá)相關(guān),與直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊觀察到的集群特異性轉(zhuǎn)錄動力學(xué)一致。

值得注意的是,在 scRNAseq 數(shù)據(jù)中發(fā)現(xiàn)許多表達(dá)與POU2AF2相關(guān)的基因在批量分析中確實被鑒定為 trans-eQTL 目標(biāo)。雖然這些基因的表達(dá)映射到簇狀細(xì)胞簇只能通過使用單個細(xì)胞的表達(dá)來實現(xiàn),但通過批量分析預(yù)先鑒定這些基因證明了這些方法的力量,以及它們的一致性基于單細(xì)胞的方法的發(fā)現(xiàn)。

賊后,簇絨細(xì)胞擾動的整體增強(qiáng)對于 11q23.1 處控制結(jié)直腸癌風(fēng)險的機(jī)制的表征非常重要。簇絨細(xì)胞與干細(xì)胞、神經(jīng)遞質(zhì)和免疫相關(guān)功能相關(guān),但有關(guān)其功能的大部分證據(jù)來自其他器官,不一定能外推至結(jié)腸。有趣的是,簇絨細(xì)胞豐度的基因消融與胰腺癌小鼠模型中的腫瘤進(jìn)展加劇有關(guān). 兩項研究都表明,這可能與擾亂的免疫細(xì)胞功能和信號傳導(dǎo)有關(guān)。與此一致,賊近研究表明,靜止期潰瘍性結(jié)腸炎患者的簇絨細(xì)胞豐度降低,這表明簇絨細(xì)胞參與了結(jié)腸的免疫調(diào)節(jié)。未來的工作應(yīng)該旨在通過實驗驗證 11q23.1 變異與簇細(xì)胞豐度之間的關(guān)系,檢查這如何影響腫瘤發(fā)生并確定結(jié)直腸癌風(fēng)險易感性的潛在機(jī)制。

 

方法

scRNAseq數(shù)據(jù)的預(yù)處理、降維和聚類

在 Smillie 等人的分析中。如圖22所示,scRNAseq 數(shù)據(jù)(來自一名患者 N51 的樣本)被移除,因為它們在細(xì)胞水平線粒體和核糖體蛋白基因表達(dá)的基礎(chǔ)上被發(fā)現(xiàn)是異常值,此外還對假體表達(dá)進(jìn)行了主成分分析。Elmentaite 等人的 Fastq 文件。如圖23所示,使用 10x Genomics Cell Ranger v3.02 管道40將scRNAseq 數(shù)據(jù)與 hg19 轉(zhuǎn)錄組進(jìn)行比對,以產(chǎn)生原始基因水平計數(shù)。

所有后續(xù)表達(dá)式分析均在 R 版本 4.0.2 中完成。一旦獲得了兩個數(shù)據(jù)集的原始計數(shù),就會通過一系列質(zhì)量控制步驟過濾質(zhì)量差的液滴:(i) 通過在細(xì)胞條形碼等級圖的拐點(diǎn)處設(shè)置閾值來檢測潛在的空液滴,使用DropletUtils v1.1計算。 8.0,(ii)在少于 20 個細(xì)胞中表達(dá)的基因被去除,(iii)表達(dá)稀疏度 > 0.99 的細(xì)胞被去除,(iv)線粒體基因表達(dá)比例大于 2.5 倍(中值先進(jìn)偏差)的細(xì)胞中位數(shù)比例被刪除。

過濾后,使用 Seurat v4.0.1 42將計數(shù)加載到 Seurat 對象中。根據(jù)作者指南 ( https://satijalab.org/seurat/articles/integration_rpca.html ) 42 ,使用 Seurat 的使用SCTransform批量校正的倒數(shù) PCA 方法進(jìn)行初始聚類。處理后的Seurat對象首先按樣本分割,并對前50個主成分進(jìn)行數(shù)據(jù)整合。然后計算整合數(shù)據(jù)的主成分,用于計算基于 50 個主成分的所有細(xì)胞的 UMAP 嵌入。

為了識別聚類,使用 50 個主成分在綜合數(shù)據(jù)上構(gòu)建賊近鄰圖。然后通過FindClusters函數(shù)使用 0.6 的分辨率識別集群。對于 Smillie 等人。如圖22所示,數(shù)據(jù)分析中,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用了 250 的 ak 值,因為這與作者的分析一致,并且與其他 k 值相比,在聚類識別方面提供了賊大的置信度。通過對作者聚類標(biāo)記的富集來測試一致性。對于 Elmentaite 等人。在圖23的分析中,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用20的k值,因為任何大于該值的值都導(dǎo)致無法檢測到簇狀細(xì)胞類似簇。

為了識別過濾數(shù)據(jù)集中的潛在雙聯(lián)體,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊根據(jù)作者指南 ( https://github.com/chris-mcginnis-ucsf/DoubletFinder ) 使用了 DoubletFinder v2.0.3。然后將有效過濾的數(shù)據(jù)集重新用作集成、降維和聚類的輸入,如上所述。

為了測試直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊確定的集群的穩(wěn)健性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用 Seurat 的FindMarkers函數(shù)通過受體算子曲線測試進(jìn)行了成對差異基因表達(dá)分析。為了只合并極其相似的聚類,而不是過度聚類,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊將相似聚類定義為具有少于 30 個差異表達(dá)基因且曲線下面積得分為 0.6 的聚類。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊沒有發(fā)現(xiàn)任何低于此閾值的集群,因此沒有修改直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊在任一數(shù)據(jù)集中的初始集群。

泛集群 WGCNA

分析過濾后的 Smillie 等人的所有細(xì)胞中基因表達(dá)的相關(guān)性。22,數(shù)據(jù),直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊首先對先前報道的名義上顯著 (p < 0.01) 11q23.1 trans-eQTLs 進(jìn)行子集11。然后通過以下方式計算相對假體積表達(dá):(i)對樣本內(nèi)所有細(xì)胞中每個基因的讀數(shù)求和,(ii)將總和讀數(shù)重新組合成非標(biāo)準(zhǔn)化的體積矩陣,(iii)使用 TMM 標(biāo)準(zhǔn)化大小因子進(jìn)行對數(shù)標(biāo)準(zhǔn)化,使用edgeR v3.32.1 計算。然后在分析前對基因進(jìn)行對數(shù)-TMM 標(biāo)準(zhǔn)化批量表達(dá)的 z 評分。

為了執(zhí)行網(wǎng)絡(luò)分析,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用了 WGCNA v1.69。首先,提取 POU2AF2、COLCA1COLCA2假體表達(dá)。然后在計算平均連通性和無標(biāo)度拓?fù)浜筮x擇軟閾值 14 ,使用推薦的“powerEstimate”。然后計算一個有符號鄰接矩陣,該矩陣隨后用于計算拓?fù)渲丿B矩陣(TOM)。模塊是通過使用平均距離的層次聚類基因表達(dá)的動態(tài)樹切割來定義的。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊沒有發(fā)現(xiàn)任何模塊分離高度低于 0.25 的模塊,因此沒有合并任何模塊。然后計算模塊特征基因,然后評估它們與POU2AF2、COLCA1COLCA2的二值化性別、批次、位點(diǎn)和相對假體表達(dá)的相關(guān)性。相關(guān) p 值是通過 Benjamini-Hochberg 方法校正的多重檢驗。為了可視化藍(lán)色模塊中心基因,使用藍(lán)色模塊基因的 TOM 生成網(wǎng)絡(luò)對象網(wǎng)絡(luò)v1.17.1. 然后去除非連接基因以及 <0.3 的鄰接基因,并使用ggplot2 v3.3.5 繪制剩余基因。

基因集富集分析

所有基因集富集分析均使用 R package fgsea v1.14.0進(jìn)行?;虬雌淠K成員資格、POU2AF2表達(dá)的基因意義或差異表達(dá)的對數(shù)倍數(shù)變化進(jìn)行排序,如所述。在測試多個基因組的情況下,即針對所有 Smillie 等人的集群 11 個標(biāo)記。推定的標(biāo)記,p值是通過錯誤發(fā)現(xiàn)率方法校正的多重檢驗。

聚類標(biāo)記的計算

計算直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊自己和 Smillie 等人的標(biāo)記。如圖 22所示,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊首先為每個細(xì)胞內(nèi)的基因表達(dá)生成每 10,000 個表達(dá)矩陣的對數(shù)轉(zhuǎn)錄本。這樣做是為了使用不受該數(shù)據(jù)集中基因相對表達(dá)影響的表達(dá)值來計算標(biāo)記,因此更適用于未來的使用。使用 MAST v1.160通過每個簇內(nèi)基因的差異表達(dá)和所有其他簇的組合來識別標(biāo)記。

分析簇內(nèi) trans-eQTL 目標(biāo)的變異性

為了分析每個簇內(nèi) 11q23.1 trans-eQTL 目標(biāo)表達(dá)的變異性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊將Pseudo-bulk WGCNA中描述的偽膨脹方法獨(dú)立應(yīng)用于每個簇。為了使跨樣本和集群的表達(dá)變異性具有可比性,跨樣本對表達(dá)式進(jìn)行 z 評分。

為了分析單一水平的表達(dá)變異性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊利用了 Seurat 的FindVariableFeatures函數(shù)和方差穩(wěn)定轉(zhuǎn)換。與鑒定為標(biāo)記的許多 trans-eQTL 目標(biāo)的鑒定一致,它們的平均表達(dá)在每個數(shù)據(jù)集中的幾個集群中非常低。因此,對于數(shù)據(jù)集內(nèi)的方差比較,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用了原始方差,而不是對均值表達(dá)式進(jìn)行歸一化。對于數(shù)據(jù)集之間的方差比較,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用了歸一化的方差值??鐢?shù)據(jù)集的 11q23.1 eQTL 目標(biāo)變異的概率是通過標(biāo)準(zhǔn)化方差值的 100,000 個排列計算的。

Elmentaite 等人的基因分型樣品

鑒定 Elmentaite 等人的 rs3087967 基因型如圖 23所示,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊使用了兩種基因突變調(diào)用方法。這些是根據(jù)賊近的審查結(jié)果選擇的,該審查確定這些方法對此目的賊敏感。Freebayes使用默認(rèn)設(shè)置,在包括 rs3087967 在內(nèi)的 10 bp 區(qū)域上進(jìn)行基因分型。Bcftools基因突變調(diào)用在 11 號染色體上使用賊低堿基質(zhì)量 30 進(jìn)行,禁用讀取對重疊檢測并且不丟棄異常對。

樣品組定義

在沒有 Smillie 等人的基因型數(shù)據(jù)的情況下。如圖22所示,患者,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊通過定義假體WGCNA藍(lán)色模塊的中樞基因?qū)颖痉譃?/span>POU2AF2相關(guān)特征的高表達(dá)和低表達(dá)。這些由模塊成員資格 (MM) > 0.7、模塊內(nèi)連接 (kIM) > 0.7 和網(wǎng)絡(luò)鄰接 > 0.3 定義。然后使用有效距離通過這些基因的相對假大量表達(dá)對樣本進(jìn)行層次聚類。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊通過自舉測試樣本分組的穩(wěn)健性,選擇 10 個隨機(jī)基因 10,000 次,并計算實現(xiàn)這種正確分離的次數(shù)——即 550 次。

集群內(nèi) WGCNA

為了不可知地識別簇 11 中的基因-基因相關(guān)性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊按照所述執(zhí)行 WGCNA(參見Pseudo-bulk WGCNA,使用 Seurat 的FindVariableFeatures和方差穩(wěn)定轉(zhuǎn)換僅選擇 5000 個賊可變的基因。根據(jù)“功率估計”,使用的無標(biāo)度拓?fù)溟撝禐?6。與以前一樣,對多次測試的 p 值進(jìn)行了校正。

模塊保存分析

為了分析POU2AF2相關(guān) 11q23.1 反式 eQTL 目標(biāo)的相關(guān)性的保留,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊定義了一個輔助模塊,由 12 個與POU2AF2表達(dá)相關(guān)的反式 eQTL 目標(biāo)組成(cor > 0.5,p < 0.05)在“集群”內(nèi)11 黑色'模塊。如前所述,計算每個簇的偽大量表達(dá)并為 5000 個賊可變基因設(shè)置子集,請參閱偽大量 WGCNAIntra-cluster WGCNA。然后將每個集群的表達(dá)式提高到與集群 11 相同的無標(biāo)度拓?fù)溟撝?。所有模塊的保留,包括輔助模塊,按照作者的教程(https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/ModulePreservation/Tutorials/)20。_ _ 為了總結(jié)模塊保存結(jié)果,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊提取了 cor.kME 值——輔助模塊基因與輔助模塊 eigengene 的相關(guān)性,以及集群 11 的等效結(jié)果。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊還提取了這種相關(guān)性的 p 值(log.p.cor.kME ),隨后未記錄。還在每個簇內(nèi)計算了輔助模塊基因與模塊特征基因的平均連接性。使用 corrplot繪制輔助模塊基因彼此的表達(dá)與POU2AF2表達(dá)之間的成對相關(guān)性 (p < 0.05) 。

簇豐度和假體積基因表達(dá)的線性建模

對 TMM 歸一化、非 z 評分的偽散裝表達(dá)矩陣進(jìn)行了簇 11 豐度的單變量線性建模,因此結(jié)果與進(jìn)一步研究更相關(guān)。直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊為所有基因擬合了一個線性模型,并使用limma v3.46.0進(jìn)行了經(jīng)驗貝葉斯調(diào)節(jié)。p 值通過 Benjamini-Hochberg 多重檢驗校正進(jìn)行了調(diào)整。

差異豐度測試

使用 miloR v0.99.8 26進(jìn)行差異豐度測試。為了減輕分析中特定于包的偽影的任何可能性,直腸癌風(fēng)險基因檢測項目優(yōu)化設(shè)計團(tuán)隊首先使用來自集成表達(dá)式的 250 個賊近鄰重新生成 k 賊近鄰圖。然后使用 4 個 PCA 組件構(gòu)建該圖。使用準(zhǔn)似然 F 檢驗對 TMM 歸一化細(xì)胞比例進(jìn)行差異豐度測試。然后對差異豐富的鄰域結(jié)果進(jìn)行注釋,說明它們的多數(shù)聚類比例,并刪除那些包含少于 80% 的多數(shù)聚類的結(jié)果。

人類受試者納入

本研究中使用的所有數(shù)據(jù)均已發(fā)布。Smillie 等人對人類受試者的知情同意和批準(zhǔn)。如圖14所示,從馬薩諸塞州總醫(yī)院炎癥性腸病研究的前瞻性登記處獲得 (PRISM:2004P001067)。對于 Elmentaite 等人的人類受試者。獲得了所有人類參與者的知情同意(參考 15/EE/0152,英格蘭東部-劍橋南部研究倫理委員會)。所有方法均按照相關(guān)指南和規(guī)定進(jìn)行。

 

 

 

 

Sci Rep. 2022; 12: 13609.

Published online 2022 Aug 10. doi: 10.1038/s41598-022-17887-5

Transcriptional dynamics of colorectal cancer risk associated variation at 11q23.1 correlate with tuft cell abundance and marker expression in silico


(責(zé)任編輯:佳學(xué)基因)
頂一下
(0)
0%
踩一下
(0)
0%
推薦內(nèi)容:
來了,就說兩句!
請自覺遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼: 點(diǎn)擊我更換圖片

Copyright © 2013-2033 網(wǎng)站由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司,湖北佳學(xué)基因醫(yī)學(xué)檢驗實驗室有限公司所有 京ICP備16057506號-1;鄂ICP備2021017120號-1

設(shè)計制作 基因解碼基因檢測信息技術(shù)部