我正在尝试找到一种算法来检查两个数据条目之间的相似性。假设我有两个数据结构(联系人列表中的字段),其中包含以下数据:
// UserA addressbook.
name: Frank Sinatra
mobile: +44 555 555 555 55
// UserB addressbook.
name: Frank Albert Sinatra
phone: 004455555555555
我从不同的提供商那里获得了这些条目,UserA
同步了他的 Google 帐户,同时UserB
同步了他的 Microsoft 帐户,但我希望我的算法告诉我两个用户都认识同一个人(在一定概率内)。
有谁知道我应该去哪里看?我试图找到创建“不安全”散列的散列算法,即类似数据的类似散列,但该路由没有效率。