【佳學(xué)基因檢測】基因檢測培訓(xùn)參與機(jī)構(gòu)必須掌握的技術(shù)細(xì)節(jié)
基因檢測的有效性、正確性和高效性不僅包括是否采用了全外顯子測序、全基因測序。佳學(xué)基因在對基因檢測機(jī)構(gòu)進(jìn)行培訓(xùn)的過程中從測序范圍的選擇、基因檢測包與全基因、全外顯子的區(qū)別、不同測序技術(shù)的比較進(jìn)行了介紹。今天對參加佳學(xué)基因生物信息分析培訓(xùn)的學(xué)員介紹,獲得測序結(jié)果的中間過程中是如何影響基因檢測結(jié)果的。
本文關(guān)鍵詞:基因測序,基因檢測,有效性,正確性,高效性,標(biāo)準(zhǔn),分析,低質(zhì)量過濾。
2. 對原始變異檢測結(jié)果進(jìn)行過濾(hard filter and VQSR)
這一步的目的就是對結(jié)過病人的DNA序列測序的結(jié)果與參照基因組進(jìn)行比對后得到所有被初步認(rèn)為是基因突變位點、基因變異位點的數(shù)據(jù)進(jìn)行進(jìn)一步的質(zhì)量控制。對于機(jī)器信號包括Illumina, 因美納、華大基因等儀器提供商生成的從低端到高端的測序儀器產(chǎn)生的基因物理信號進(jìn)行分析和評價,去掉不可信的位點。佳學(xué)基因介紹了兩種方法,一種是通過GATK的Variant Filtration,另一種是通過GATK的VQSR(變異位點質(zhì)量值重新校正)進(jìn)行過濾。
佳學(xué)基因采用GATK優(yōu)化方案,增加分析過程的一致性、分析結(jié)果和實際結(jié)果的匹配度。佳學(xué)基因推薦使用基于GATK的VASR分析流程。但使用VQSR數(shù)據(jù)量一定要達(dá)到要求,數(shù)據(jù)量太小無法使用佳學(xué)基因要求的質(zhì)量高效性要求。還有,在使用VAQR時,indel和snp要分別進(jìn)行。
VQSR原理介紹:
這個基因解碼過程是采用已有的真實變異位點(人類基因組一般使用HapMap3中的位點,以及這些位點在Omni 2.5M SNP芯片中出現(xiàn)的多態(tài)位點)來校對、校準(zhǔn)分析過程,賊后得到一個具有深度人工智能特點的、能夠很好的評估變異序列的真實性的方法,可以叫他適應(yīng)性錯誤評估模型。這個適應(yīng)性的錯誤評估模型可以應(yīng)用到基因解碼、基因檢測初步列出來的原始變異位點,列出已知的變異位點和新發(fā)現(xiàn)的變異位點,進(jìn)而去評估每一個變異位點發(fā)生錯誤的概率,賊終會給出一個得分。這個得分賊后會被寫入vcf文件的INFO信息里,在佳學(xué)基因基因序列分析標(biāo)準(zhǔn)流程里,這一數(shù)值的標(biāo)簽被規(guī)定為VQSLOD,就是在訓(xùn)練好的混合高斯模型下,一個位點是真實的概率比上這個位點可能是假陽性的概率的log odds ratio(對數(shù)差異比),因此,可以定性的認(rèn)為,這個值越大就越好。
VQSR主要分兩個步驟,這兩個步驟會使用兩個不同的工具:Variant Recalibrator和Apply Recalibration。
(責(zé)任編輯:佳學(xué)基因)