最近米老鼠收到好多朋友关于openGWAS数据库的vcf文件处理问题,在这里我打算写一期推送帮助大家系统解决一下这个问题。这里我们主要使用的是“vcfR”这个包,它可以快速读取vcf格式的文件。
我们以糖化血红蛋白的GWAS为例(https://gwas.mrcieu.ac.uk/datasets/ieu-b-103/)进行讲解,首先我们打开网页并下载该vcf文件(黄色标记)。
install.packages("vcfR") #安装R包arData <-vcfR::read.vcfR("./ieu-b-103.vcf.gz"#直接读取vcf文件str(arData) #查看vcf数据的结构

从上图中我们不难看出,这里的vcf文件主要由三部分内容构成(meta,fix和gt),其中meta是vcf的注释信息。
继续阅读
阅读原文