https://zhuanlan.zhihu.com/p/648475139
MungeSumstats包介绍(二)——rsid和chr:pos转换
今天介绍如何使用MungeSumstats包来转换rsid和chr:pos。MungeSumstats包被开发出来是用来统一GWAS summary格式的,因此,也可以用它来进行rsid和chr:pos之间的转换,具体代码如下:
library(MungeSumstats) library(tidyverse) library(data.table) ## 示例数据路径 eduAttainOkbayPth <- system.file("extdata","eduAttainOkbay.txt", package="MungeSumstats") ## 读取示例数据并删除rsid df <- fread(eduAttainOkbayPth) %>% dplyr::select(-MarkerName) ## MungeSumstats包检验数据并填充rsid reformatted <- format_sumstats(df, ref_genome = "GRCh37", nThread = 2, return_data =T)但是这个包对输入数据的格式有要求,必须要包含以下几列:
像EAF和SE可有可没有,但是以上几列则必须要有,否则该包就会报错。
如果我们知道dbSNP的版本号,可以使用dbSNP参数指定版本号,减少rsid转换后的损失,不过目前好像只支持144和155版本,其他版本如果有小伙伴感兴趣的可以试一下行不行,不过要提前安装相应的数据:
reformatted2 <- format_sumstats(df, ref_genome = "GRCh37", nThread = 2, dbSNP = 155, return_data =T)当然了,我们还可以用这个函数在转换rsid的同时变更参考基因组:
reformatted2 <- format_sumstats(df, ref_genome = "GRCh37", convert_ref_genome = "GRCh38", nThread = 2, return_data =T)如果想转换后直接存储,可以设置save_path参数:
reformatted2 <- format_sumstats(df, ref_genome = "GRCh37", convert_ref_genome = "GRCh38", nThread = 2, save_path = "path/to/dir")这里还有蛮多参数大家可以自行探索。后面抽空写一下其他可以转换rsid和chr:pos的方法。