十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
这篇文章主要讲解了“如何使用Minimac进行基因型填充”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何使用Minimac进行基因型填充”吧!
创新互联"三网合一"的企业建站思路。企业可建设拥有电脑版、微信版、手机版的企业网站。实现跨屏营销,产品发布一步更新,电脑网络+移动网络一网打尽,满足企业的营销需求!创新互联具备承接各种类型的网站建设、成都网站制作项目的能力。经过10年的努力的开拓,为不同行业的企事业单位提供了优质的服务,并获得了客户的一致好评。
源代码保存在github上,网址如下
https://github.com/statgen/Minimac4
为了减少内存消耗,和beagle软件类似,minimac提出了一种名为M3VCF
的格式,用来存储referenc panel的单倍型信息,将单倍型划分为不同的block, 示意如下
上图表示的是9个SNP位点构成的8种单倍型,minimac会根据染色体位置划分成不同的block区间,识别block区间内的unique haplotypes。两个邻近的block区域必须有一个重叠的位点,图中的9个位点划分成了两个block, 1-6号位点对应block B, 6到9号位点对应block B+1。在block B中,有3种唯一的单倍型,对应三种不同颜色。
M3VCF的内容示意如下
和VCF格式类似,在每个blcok的开头会有一行用于显示block的信息,包含的变异位点数VARIANTS
,unique haplotype的个数REPS
等,详细的介绍请参考以下链接
https://genome.sph.umich.edu/wiki/M3VCF_Files
相比VCF格式,该格式磁盘占用小,读取速度更快,内存消耗小。官网提供了1000G的reference panel供下载,链接如下
https://genome.sph.umich.edu/wiki/Minimac4#Reference_Panels_for_Download
该软件推荐的基因型填充pipeline步骤如下
study样本分型结果的质量控制,参考GWAS的质控条件
对质控后的分型结果进行pre-phasing, 支持MACH和shapeit两个软件的结果
将pre-phasing的结果转化成VCF格式
选择reference panel,推荐1000G或者HRC
进行填充
实际操作中典型的用法如下
以MACH为例,用法如下
mach2 \
-d Gwas.chr20.Unphased.dat \
-p Gwas.chr20.Unphased.ped \
--rounds 20 \
--states 200 \
--phase \
--interim 5 \
--sample 5 \
--prefix Gwas.Chr20.Phased.Output
MACH要求输入的分型结果格式为dat和ped格式,详细的解释参见以下链接
http://csg.sph.umich.edu/abecasis/Merlin/tour/input_files.html
通过MACH2VCF进行格式转换,用法如下
mach3VCF \
--haps Gwas.Chr20.Phased.Output.hap \
--snps Gwas.Chr20.Phased.Output.snps \
--prefix Gwas.Chr20.Phased.Output.VCF.Format
该脚本可以从以下链接下载
ftp://share.sph.umich.edu/minimac3/Mach3VCF.v1.Source.Binary.tar.gz
采用minimac4进行填充,用法如下
minimac4 \
--refHaps refPanel.m3vcf \
--haps Gwas.Chr20.Phased.Output.VCF.Format.vcf \
--prefix testRun \
--cpus 5
minimac4会自动将染色体拆分成不同的区间,在结合多线程,可以大大提高运行速度。
感谢各位的阅读,以上就是“如何使用Minimac进行基因型填充”的内容了,经过本文的学习后,相信大家对如何使用Minimac进行基因型填充这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!