2

在数据挖掘中,频繁项集是使用不同的算法来发现的,比如 Apriori Algorithm , FP-Tree 等。那么这些是模式评估方法吗?

4

2 回答 2

3

您可以尝试关联规则(例如先验规则)、协作过滤(基于项目或基于用户)甚至聚类。

我不知道您要做什么,但是如果您有一个数据集并且需要找到最频繁的项目集,则应该尝试上述一些技术。

如果您使用的是 R,您应该探索关联规则的 arules 包(例如)。

于 2015-05-27T13:33:53.920 回答
2

Apriori 算法和 FP-tree 算法用于查找给定事务数据的频繁项集。这将有助于购物篮分析应用程序。对于模式评估,有许多组件,即:

  1. 支持,
  2. 信心,
  3. 电梯,
  4. 不平衡比等

更多细节可以在论文中看到:

Pang Ning Tan, Vipin Kumar, Jaideep Srivastava, KDD 2002 为关联模式选择正确的兴趣度度量。

于 2019-02-09T16:43:38.243 回答