我有两个数据框:一个是带有基因型信息的 VCF,另一个是“特殊”SNP 位置的数据框。使用 dplyr,我想仅针对特殊 SNP 的数据框中存在的那些位置过滤 VCF,但是,我无法弄清楚如何将 %in% 用于多列。
VCF 数据框:
CHR POS REF ALT
01 10 C T
01 20 G A
01 30 T C
02 20 A G
02 30 C G
02 40 G T
02 50 T A
SPECIAL_SNP 数据框:
CHR POS
01 20
01 30
02 40
02 50
期望的输出:
CHR POS REF ALT
01 20 G A
01 30 T C
02 40 G T
02 50 T A
我在想类似的事情:
VCF %>%
filter(.[, c("CHR", "POS"] %in% SPECIAL_SNP[, c("CHR", "POS")])
提前感谢您的帮助。