佳學(xué)基因遺傳病基因檢測機(jī)構(gòu)排名,三甲醫(yī)院的選擇

基因檢測就找佳學(xué)基因!

熱門搜索
  • 癲癇
  • 精神分裂癥
  • 魚鱗病
  • 白癜風(fēng)
  • 唇腭裂
  • 多指并指
  • 特發(fā)性震顫
  • 白化病
  • 色素失禁癥
  • 狐臭
  • 斜視
  • 視網(wǎng)膜色素變性
  • 脊髓小腦萎縮
  • 軟骨發(fā)育不全
  • 血友病

客服電話

4001601189

在線咨詢

CONSULTATION

一鍵分享

CLICK SHARING

返回頂部

BACK TO TOP

分享基因科技,實(shí)現(xiàn)人人健康!
×
查病因,阻遺傳,哪里干?佳學(xué)基因準(zhǔn)確有效服務(wù)好! 靶向用藥怎么搞,佳學(xué)基因測基因,優(yōu)化療效 風(fēng)險(xiǎn)基因哪里測,佳學(xué)基因
當(dāng)前位置:????致電4001601189! > 基因課堂 > 基因價(jià)值 > 基因測序技術(shù) >

【佳學(xué)基因檢測】基因解碼基礎(chǔ):如何從VCF格式文件中獲取基因測序數(shù)據(jù)?

【佳學(xué)基因】基因解碼基礎(chǔ):如何從VCF格式文件中獲取基因測序數(shù)據(jù)? 佳學(xué)基因?qū)ёx: VCF格式是一種基因測序領(lǐng)域常用的基因序列存儲格式。了解VCF格式是基因信息注釋工作與基因測序工作

佳學(xué)基因檢測】基因解碼基礎(chǔ):如何從VCF格式文件中獲取基因測序數(shù)據(jù)?


遺傳病、罕見病基因檢測導(dǎo)讀:

VCF格式是一種基因測序領(lǐng)域常用的基因序列存儲格式。了解VCF格式是基因信息注釋工作與基因測序工作進(jìn)行對接的先進(jìn)步。本文介結(jié)從采用VCF格式存儲的基因數(shù)據(jù)中獲取受檢者基因信息的一個工具,以及使用這一個工具的方法。

為什么要開發(fā)vcfR工具包?vcfR有什么用途?

VCF文件格式成為記錄一個人基因信息的通用格式文件,正如JPG是照片和圖形的通用格式文件一樣。由于測序成本的大幅度降低,數(shù)據(jù)庫比對成為現(xiàn)行基因檢測的通行技術(shù),而基因解碼進(jìn)一步對數(shù)據(jù)庫比對方法進(jìn)行升級換對,讀取和理解基因信息成為基因信息閱讀、傳遞和交流的一個重要需要。因此,我們需要掌握對VCF格式文件進(jìn)行處理的軟件。vcfR軟件不僅可提取基因型,還可以提取與基因型測定的質(zhì)量的數(shù)據(jù)。vcfR是一個在R語言下開發(fā)的工具,因?yàn)镽提供了一個交互體驗(yàn)和一個通常用于基因信息分析的環(huán)境。通過vcfR可以讀取VCF文件,存儲到R語言支持的各種文件格式。并采用R語言進(jìn)行匯總、繪圖、統(tǒng)計(jì)。VcfR還提供了通過修改各種參數(shù),用可視化的方式再現(xiàn)這些參數(shù)對分析結(jié)果的影響的功能。另外vcfR還可以使用基因序列文件(FASTA)和基因注釋文件(GFF),使得基因組的特定區(qū)域如染色體可以以圖形的方式展現(xiàn)。vcfR還可以通過轉(zhuǎn)換函數(shù)將vcfR的數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換成為R環(huán)境下其他基因信息分析工具可以使用的文件格式。更為復(fù)雜的運(yùn)算可以通過C++語言來實(shí)現(xiàn)。

VCF文件的存儲格式:

vcf文件分為三個部分

  • ‘#’號開頭行——meta
  • 非#號開頭行分為fix和gt兩個部分

fix部分存儲vcf文件中非#號開頭行的前7列,分別是

  • 染色體編號
  • 堿基位置
  • ID
  • 參考堿基
  • 變異堿基
  • 質(zhì)量值
  • 是否過濾

gt 部分存儲兩部分內(nèi)容

  • format
  • 樣本基因型
  •  

vcfR的主要功能


> 1、可以有效地將VCF數(shù)據(jù)讀入內(nèi)存并將其寫回到磁盤。
2、解析功能可有效提取基因型矩陣或其相關(guān)信息。
3、繪圖功能提供了一種直觀地評估變體特征的快速方法。
4、提供了對R環(huán)境提供的大量統(tǒng)計(jì)和圖形工具的便捷訪問。
5、通過有效的解析和可視化,可以快速開發(fā)針對質(zhì)量指標(biāo)的硬過濾器,可以輕松地針對單個項(xiàng)目和實(shí)驗(yàn)設(shè)計(jì)進(jìn)行量身定制。
6、vcfR的關(guān)鍵組件以C ++實(shí)現(xiàn),并從R中調(diào)用以賊大程度地減少計(jì)算時間。 

vcf主要功能介紹:

1、快速讀TEXT和GZIP文件
 通過參數(shù)設(shè)置,通過讀取表格數(shù)據(jù)的函數(shù)utils :: read.table()和data.table :: fread()以跳過非表格元區(qū)域,從而為這些函數(shù)提供了一點(diǎn)優(yōu)勢。
通過data.table :: fread('zcat filename.gz')調(diào)用data.table :: fread()函數(shù),是因?yàn)樗?dāng)前不能讀取壓縮的數(shù)據(jù)。

2、讀取基因型函數(shù):
extract.gt()
chromoqc()可用于可視化chromR對象。
 
(責(zé)任編輯:佳學(xué)基因)
頂一下
(0)
0%
踩一下
(0)
0%
推薦內(nèi)容:
來了,就說兩句!
請自覺遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動的言論。
評價(jià):
表情:
用戶名: 驗(yàn)證碼: 點(diǎn)擊我更換圖片

Copyright © 2013-2033 網(wǎng)站由佳學(xué)基因醫(yī)學(xué)技術(shù)(北京)有限公司,湖北佳學(xué)基因醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室有限公司所有 京ICP備16057506號-1;鄂ICP備2021017120號-1

設(shè)計(jì)制作 基因解碼基因檢測信息技術(shù)部