【佳學基因檢測】癌癥與腫瘤基因檢測的數(shù)據(jù)庫介紹
癌癥是由于父母基因組合或者是體細胞突變產(chǎn)生的細胞增殖增生失去控制的慢性、難治性疾病。癌癥基因突變最簡單的形式一個細胞基因組變化而導(dǎo)致的遺傳性疾病。可以驅(qū)動腫瘤產(chǎn)生的基因突變包括點突變、插入突變、缺失突變和染色體易位、染色體數(shù)量增加等。這些基因信息的變化可以導(dǎo)致細胞和組織生長異常,這就是腫瘤所表現(xiàn)出來的臨床表現(xiàn)的基礎(chǔ)。對控制癌癥發(fā)生的分子機制研究已經(jīng)進行了50多年,在這些研究過程中使用了很多分子生物學手段的研究,使得人們對于癌癥的發(fā)生的機制有了深入了解。而且在細胞轉(zhuǎn)化基礎(chǔ)上,人們已經(jīng)了解了許多分子遺傳學和表觀遺傳學改變,而且開始解析導(dǎo)致腫瘤表型的復(fù)雜過程。目前,癌癥發(fā)生的基因信息學、腫瘤發(fā)生的基因解碼,正在帶領(lǐng)著腫瘤的診斷和治療發(fā)生一場深刻的革命。
這些都促進了后基因組時代科技的進步,從而令分子生物學家能夠更加精細地研究DNA(基因組)、mRNA(轉(zhuǎn)錄組)和蛋白序列(蛋白質(zhì)組)。全面背景下描述癌癥的機理為研究人員獲得更多有用的數(shù)據(jù)進行分析,并將之以全新的方式結(jié)合起來提供了一個機遇。盡管存在很多實際困難,但人們?nèi)匀慌﹂_展更多項目,目的是整合數(shù)百個樣本以研究來自不同資源的數(shù)據(jù)類型。表1描述了癌癥生物信息學和系統(tǒng)生物學的基因組數(shù)據(jù)庫資源。
表1 癌癥生物信息學和系統(tǒng)生物學的基因組數(shù)據(jù)庫資源
類型 | 數(shù)據(jù)庫資源 | 數(shù)據(jù)庫類型 | 網(wǎng)址 |
基因組 | 癌癥基因組計劃(Sanger 中心) | 癌癥基因調(diào)查統(tǒng)計、體細胞突變、失雜合圖譜、缺失圖譜、小的基因內(nèi)體細胞突變 | http://www.sanger.ac.uk/genetics/CGP |
美國人類基因組資源(NCBI) | 人類基因組數(shù)據(jù)的整合信息資源 | http://www.ncbi.nlm.nih.gov/genome/guide/human | |
Genome Browser(加州大學圣克魯茲分校) | 可視化和查詢工具 | http://genome.ucsc.edu | |
核型 | 癌癥染色體(NCBI) | SKY/M-FISH and CGH數(shù)據(jù)庫、Mitelman數(shù)據(jù)庫、癌癥NCI周期性畸變 | http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=cancerchromosomes |
Progenetix(佛羅里達大學) | 不同癌癥類型的CGH 數(shù)據(jù)庫 | http://www.progenetix.net | |
單核苷酸多態(tài)性 | NCBI的單核苷酸多態(tài)性數(shù)據(jù)庫 | 單核苷酸多態(tài)性 | http://www.ncbi.nlm.nih.govprojects/SNP |
SNP500cancer(NCBI) | 癌癥流行病學有關(guān)的單核苷酸多態(tài)性 | http://snp500cancer.nci.nih.gov | |
基因表達 | NCBI的基因表達數(shù)據(jù)庫 | 基因表達數(shù)據(jù)庫瀏覽、搜索和數(shù)據(jù)檢索的策劃資源 | http://www.ncbi.nlm.nih.gov/geo |
Oncomine(美國密歇根大學) | 定位、搜索和可視化某種基因或癌癥類型的工具 | http://141.214.6.50/oncomine/main/index.jsp | |
癌腫基因組解剖計(CGAP) | 基因、染色體畸變、SNP 500cancer、組織、SAGE表達材料(正常的、癌癥前期生物和癌細胞的)整合資源 | http://cgap.nci.nih.gov | |
臨床基因組 | 癌癥的分子水平分析計劃(CMAP) | 分子表達譜、靶標、靶向藥物和測試 | http://cmap.nci.nih.gov |
癌癥基因組剖析計劃(The Cancer Genome Anatomy Project, CGAP)是由美國癌癥研究所(the National Cancer Institute, NCI)在1996年發(fā)起并維持的一項計劃。至今,它已經(jīng)成為癌癥遺傳學研究領(lǐng)域的首創(chuàng)。該計劃已經(jīng)從多種腫瘤樣品和正常樣品中研究出了超過300多萬的表達序列標簽(EST)。
癌癥基因組剖析計劃(The Cancer Genome Anatomy Project, CGAP)是由美國癌癥研究所(the National Cancer Institute, NCI)在1996年發(fā)起并維持的一項計劃。至今,它已經(jīng)成為癌癥遺傳學研究領(lǐng)域的首創(chuàng)。該計劃已經(jīng)從多種腫瘤樣品和正常樣品中研究出了超過300多萬的表達序列標簽(EST)。
除此之外,該計劃還利用新的技術(shù)構(gòu)建了數(shù)以百計的圖書館。提及的新技術(shù)包括基因表達系列分析(SAGE)和大規(guī)模平行測序技術(shù)(massively parallel signalure sequencing, MPSS)。
SAGE技術(shù)是近幾年發(fā)展起來的一種快速分析基因表達信息的綜合分析方法,它是公認的轉(zhuǎn)錄學圖譜(Transcriptome profiling)研究的最佳方法之一。MPSS是以DNA測序為基礎(chǔ)的大規(guī)模、高通量的基因分析新技術(shù)。它通過標簽庫的建立、微珠與標簽的連接、酶切連接反應(yīng)和生物信息分析等步驟,可以獲得基因表達序列。MPSS具有測定表達水平低、基因差異小,無需預(yù)先知道基因的序列、自動化和高通量等特點,是一項值得推廣的技術(shù)。在巴西,F(xiàn)APESP/LICR的人類癌癥基因組計劃(Human Cancer Genome Project, HCGP)利用一種稱為開放閱讀框EST的新技術(shù),研究了超過100萬個流行腫瘤的EST。由CGAP和HCGP研究的表達序列,被整合到了國際癌癥基因表達的數(shù)據(jù)庫(International Database Cancer Gene Expression)。這個數(shù)據(jù)庫是基因組研究機構(gòu)(Institute of Genomic Research)(http://www.tigr.org)中人類癌癥索引的基礎(chǔ)。CGAP和HCGP兩個計劃已經(jīng)結(jié)合起來。它們本質(zhì)上有一個共同的目標——創(chuàng)建癌癥的表達目錄,而且它們還注解并向GenBank提交了數(shù)以百萬的腫瘤和正常組織的序列。這兩個計劃的目的是確定正常細胞、前癌細胞和癌細胞基因的獨特表達模式,以期達到改善檢測、診斷和治療病人的目的。
癌癥生物醫(yī)學信息網(wǎng)絡(luò)(Cancer Biomedical Informatics Grid, caBIG)(http://cabig.nci.nih.gov)是一個雄心勃勃的、由美國癌癥研究所(NCI,http://cancergenome.nih.gov)資助和維護的一項新計劃。它旨在建立一個癌癥網(wǎng)絡(luò),從而整合四類信息:信息接口、詞匯/術(shù)語和本體論、數(shù)據(jù)元素和信息模型等。
caBIG計劃是一個由研究人員和組織機構(gòu)自愿組織的網(wǎng)格項目,目標是“創(chuàng)造癌癥研究的全球網(wǎng)絡(luò)”。為了這個目標,大家努力為應(yīng)用和分析過程制定了標準,以便能更容易地開展合作、分享數(shù)據(jù)。此外,caBIG承擔了不同領(lǐng)域的開發(fā)項目,例如,開發(fā)臨床試驗管理系統(tǒng)、Ontology采集工具和體內(nèi)成像系統(tǒng)等。
自2004年成立以來,caBIG在80個組織機構(gòu)的800多名工作人員的合作下,已經(jīng)取得了70 多項成果,包括報告書、用語、數(shù)據(jù)規(guī)范、軟件工具(例如一種基于網(wǎng)絡(luò)的臨床試驗與多重試驗數(shù)據(jù)管理應(yīng)用程序)、一種微陣列數(shù)據(jù)庫、一種基因定義元數(shù)據(jù)采集工具以及許多其它成果。
caBIG將個人和機構(gòu)聯(lián)系在一起,共享很多數(shù)據(jù)和工具,它構(gòu)建了全球范圍的癌癥研究資源。caBIG是癌基因組阿特拉斯計劃的一部分,由美國癌癥研究所 (http://cancergenome.nih.gov)資助和維持,它可以加速癌癥預(yù)防或治療方面的新方法問世。
如上所述,caBIG的目標是:
(1) 通過一種可共享和可操作的基礎(chǔ)設(shè)施,將科學家和醫(yī)生聯(lián)系起來;
(2) 通過開發(fā)標準規(guī)則和共同語言,能夠更容易地共享信息;
(3) 建立或調(diào)整工具收集、分析、綜合和傳播與癌癥相關(guān)的研究和護理的信息。
該caBIG項目旨在建立一個協(xié)作信息網(wǎng)絡(luò),以加速開發(fā)新的辦法以改善對患者的治療效果。caBIG 所創(chuàng)建的基礎(chǔ)設(shè)施和工具在癌癥社區(qū)之外也有很廣泛的應(yīng)用。
因此,癌癥生物信息學處理的是組織和數(shù)據(jù),以便重要的趨勢和模式可以被識別,最終目標是發(fā)現(xiàn)新的治療和/或診斷癌癥的方案。實現(xiàn)這一目標的第一步就是尋找表現(xiàn)特定癌癥條件的基因表達藍圖。人們普遍認為生物狀態(tài)和生理不可能由一個基因的表達所代表。因此,為了揭示代表癌癥發(fā)生和進展的分子標記,研究人員進行了廣泛的基因組分析,例如基因表達的微陣列、微陣列-比較基因組雜交技術(shù)(Array CGH)和組織芯片等。然而,在特定的癌變時期有相當多的改變,包括基因組復(fù)制后階段、轉(zhuǎn)錄階段、翻譯階段或翻譯后階段和修改階段,如基因擴增、RNA剪接改變、磷酸化、甲基化和蛋白質(zhì)分泌和穩(wěn)定性差異,這些都不能被基因組分析設(shè)想到。蛋白質(zhì)組的分析鑒定,能夠鑒定和定量分析生物樣品中的全部蛋白質(zhì)。
目前蛋白質(zhì)分析技術(shù)包括:二維聚丙烯酰胺凝膠電泳(2DE法)、同位素編碼親合性標簽(isotope-coded affinity tag, ICAT)、基質(zhì)輔助激光解析電離質(zhì)譜(MALDI-MS)、液相色譜-串聯(lián)質(zhì)譜(LC/MS/MS)、質(zhì)譜成像(imaging MS)、蛋白質(zhì)芯片(Protein array)和自體抗體表達等技術(shù)等。要組織和分析由這些高通量技術(shù)產(chǎn)生的具體數(shù)據(jù),需要發(fā)展相當數(shù)量的計算軟件和數(shù)據(jù)庫。人們通過計算統(tǒng)計分析輔助和建立蛋白質(zhì)或基因圖譜,已經(jīng)可以鑒別遺傳特點,這對發(fā)展新的和個性化的癌癥治療方法非常有價值。
生物信息學方法和臨床驗證已用于識別多種癌癥指示性表達譜。Kim等人分析了SAGE和EST數(shù)據(jù),從而發(fā)現(xiàn)了一系列肺癌中差異表達的基因。在一個系統(tǒng)檢測注解基因功能的實驗中,他們找到了29個基因,隨后借助肺癌病人的臨床標本發(fā)現(xiàn)了這些基因?qū)嶒烌炞C很敏感。
Sjoblom 等人確定了在大腸癌和乳腺癌腫瘤中已經(jīng)經(jīng)過注解的人類蛋白質(zhì)編碼基因序列。他們分析了11個乳腺癌患者和11個大腸癌患者個體的13023個基因,結(jié)果揭示單個腫瘤積累了大約平均90個突變基因,但它們中只有一部分會導(dǎo)致腫瘤惡化。用嚴格的標準來界定這些基因,Sjoblom 等人發(fā)現(xiàn)共有189個基因(平均每個腫瘤11個)突變頻率很高。
統(tǒng)計和生物信息學工具可以幫助確定突變在腫瘤形成中的作用。鑒定分子標記和表達譜正被人們用于腫瘤分類、診斷和臨床結(jié)果的預(yù)測。癌細胞依賴的特殊基因、蛋白質(zhì)和細胞路徑的鑒定,加速了人們對更有效的治療藥物的研發(fā)進程。通過設(shè)計、整合來自多個應(yīng)用和平臺的資料,如GeneSpring分析平臺(http://www.chem.agilent.com/en-US/Pages/HomePage.aspx),或開發(fā)資源和開發(fā)軟件計劃(Bioconductor,http://www.bioconductor.org,一項使用R語言進行基因組數(shù)據(jù)計算的開源&可擴展軟件計劃),不僅可以用于專門回答生物學方面的基因組、遺傳學、蛋白質(zhì)組和生物標志物篩選的交叉問題,還能夠提供全面的統(tǒng)計分析、數(shù)據(jù)挖掘和可視化工具。此外,基于群體的分子和遺傳變異研究可能會成為個體化治療的基礎(chǔ)。目前已在臨床上成功應(yīng)用于治療的藥物有Gleevec(格列衛(wèi))(一種激酶抑制劑,可用于成人和兒童慢性髓性白血?。–ML)的治療)與單克隆抗體美羅華(Rituxan)(治療非霍奇金淋巴瘤),另外還有阿瓦斯?。ˋvastin)(治療結(jié)直腸癌和非小細胞肺癌)和赫賽?。℉erceptin )(治療乳腺癌)。
- 【佳學基因檢測】介紹一個基因檢測明確其中一種類型的乳腺癌風險...
- 【佳學基因檢測】視網(wǎng)膜母細胞瘤基因檢測機構(gòu)TOP10...
- 【佳學基因檢測】基因檢測如何揭示視網(wǎng)膜母細胞瘤與基因突變的關(guān)系?...
- 【佳學基因檢測】皮膚淋巴細胞瘤基因檢測...
- 【佳學基因檢測】毛囊周圍纖維瘤(Perifollicular fibroma)基因檢測...
- 【佳學基因檢測】鞏膜神經(jīng)鞘瘤基因檢測...
- 【佳學基因檢測】皮膚平滑肌瘤基因檢測...
- 【佳學基因檢測】黏液皮下腫瘤基因檢測...
- 【佳學基因檢測】皮脂腺癌基因檢測...
- 【佳學基因檢測】生殖泌尿道的腫瘤基因檢測...
- 【佳學基因檢測】毛發(fā)瘤基因檢測...
- 【佳學基因檢測】圓柱瘤基因檢測...
- 【佳學基因檢測】毛母質(zhì)瘤基因檢測...
- 【佳學基因檢測】濾泡漏斗腫瘤基因檢測...
- 【佳學基因檢測】汗孔瘤基因檢測...
- 【佳學基因檢測】大汗腺汗腺瘤基因檢測...
- 【佳學基因檢測】毛囊腫瘤基因檢測...
- 【佳學基因檢測】毛發(fā)上皮瘤基因檢測...
- 【佳學基因檢測】外毛根鞘瘤基因檢測...
- 【佳學基因檢測】單一三叉神經(jīng)瘤基因檢測...
- 【佳學基因檢測】多發(fā)性毛囊鞘瘤( Multiple trichilemmomata)基因檢測...
- 【佳學基因檢測】生殖器腫瘤基因檢測...
- 【佳學基因檢測】皮膚粘液瘤基因檢測...
- 【佳學基因檢測】血管畸形基因檢測...
- 【佳學基因檢測】肺毛細血管血管瘤病基因檢測...
- 【佳學基因檢測】內(nèi)臟血管瘤病基因檢測...
- 【佳學基因檢測】眼腫瘤基因檢測...
- 【佳學基因檢測】眼睛的錯構(gòu)瘤基因檢測...
- 【佳學基因檢測】視網(wǎng)膜腫瘤基因檢測...
- 【佳學基因檢測】視網(wǎng)膜母細胞瘤基因檢測...
- 來了,就說兩句!
-
- 最新評論 進入詳細評論頁>>