character如果您处理变量,这将是一个简单得多的命题,而不是factors.
我将提出一个简单的 data.table解决方案(优雅且易于使用的语法以及许多其他优点)
x <- data.frame(c1=letters[1:26],c2=letters[26:1], stringsAsFactors =FALSE)
x[x$c1 == "m","c2"] <- NA
y <- data.frame(c1="m",c2="n", stringsAsFactors = FALSE)
library(data.table)
X <- as.data.table(x)
Y <- as.data.table(y)
为了简化合并,我将创建一个列,指示
X[,missing_c2 := is.na(c2)]
# a similar column in Y
Y[,missing_c2 := TRUE]
setkey(X, c2, missing_c2)
setkey(Y, c2, missing_c2)
# merge and replace (by reference) those values in X with the the values in `Y`
X[Y, c2 := i.c2]
i.c2意味着我们使用c2fromi参数的值[
这种方法假设不是所有的值 wherec1 = 'm'都会丢失,X并且您不想c2用'm'where替换所有的值c1='m',只有那些丢失的值
基础解决方案
这是一个基本解决方案——我使用合并,以便ydata.frame 可以包含missing比实际需要更多的替换(即可以具有所有值的c1值,尽管只c1=需要 m``。
# add a second missing value row because to make the solution more generalizable
x <- rbind(x, data.frame(c1 = 'm',c2 = NA, stringsAsFactors = FALSE) )
missing <- x[is.na(x$c2),]
merged <- merge(missing, y, by = 'c1')
x[is.na(x$c2),] <- with(merged, data.frame(c1 = c1, c2 = c2.y, stringsAsFactors = FALSE))
如果你使用factors,你会遇到一堵痛苦的墙,确保水平对应。