0

考虑以下两个字符串: applesauce apple-sauce 。它们指的是同一个对象。因此,任何包含这两个名称的记录都将被视为重复。但是,在 R 中,这些被视为单独的级别。可以使用编辑距离来量化这两个名称使用 stringdist 包的相似程度吗?

4

1 回答 1

0

这个怎么样。

"applesauce"==gsub("-","","apple-sauce")

对于多个参数,"applesauce"=="apple - sauce"你可以使用这个Replace multiple arguments with gsub

于 2015-03-02T02:57:10.650 回答