考虑以下两个字符串: applesauce
和 apple-sauce
。它们指的是同一个对象。因此,任何包含这两个名称的记录都将被视为重复。但是,在 R 中,这些被视为单独的级别。可以使用编辑距离来量化这两个名称使用 stringdist
包的相似程度吗?
1 回答
0
这个怎么样。
"applesauce"==gsub("-","","apple-sauce")
对于多个参数,"applesauce"=="apple - sauce"
你可以使用这个Replace multiple arguments with gsub
于 2015-03-02T02:57:10.650 回答