我正在尝试基于非常相似的语言对两个数据帧进行 dplyr 左连接(这不准确)。
DF1:
title | records
Bob's show, part 1 | 42
Time for dinner | 77
Horsecrap | 121
DF2:
showname | counts
Bob's show part 1 | 772
Dinner time | 89
No way Jose | 123
我执行此操作以使用 stringdist 包/库将字符串距离作为向量获取:
titlematch <- amatch(df1$title,df2$showname)
向量看起来像......好吧,一个整数向量:
titlematch
1
2
NA
通常,如果我有完全匹配,我会这样做:
blended <- left_join(df1, df2, by = c("title" = "showname"))
如何使用向量作为记录选择器进行左连接,以便最终结果为:
title | records | showname | counts
Bob's show, part 1 | 42 | Bob's show part 1 | 772
Time for dinner | 77 | Dinner time | 89
由于向量 (NA) 中没有可能的匹配项,因此排除了第三个不匹配项。