如果我有一个名称向量,请说:
a = c("tom", "tommy", "alex", "tom", "alexis", "Alex", "jenny", "Al", "michell")
我想使用levenshteinSim
或类似来获得此向量中的相似度分数。但是,我不希望它自我评分。例如,"tom" #1
对"tom" #3
. 并且不要为"tom" #1
反对返回分数,"tom" #1
所以不要自己得分。
我以前用两个不同的向量a
和b
. 但是,如果我将它用于相同的向量,那么我 会针对我想要避免的"tom" #1
情况进行评分 。"tom" #1
有没有办法做到这一点?