我已经在线阅读了 Stack 和各种文档,但仍然无法正常工作。
我有一个包含 5,368 笔交易的数据集。它们以 Excel 表格的形式出现,其中包含一堆不同的列 - CustomerID、ItemID 和 OrderID(见下文,数据从 A1:C10 中显示)。
我有3个问题:
具体来说数据需要采用什么格式?我尝试使用下面显示的所有 3 种格式来阅读它。我可以让 read.transactions 以任何这些格式读取数据,但是当我去运行 apriori 时,它只给了我 1 条规则(或者有时没有)。即使要获得该规则,我也必须将置信度设置为 0.01,并且 lhs 始终为空白。
我最近一次尝试使用第 21 行显示的格式。我什至删除了所有单笔交易(第 23 和 24 行)。然后我运行了这个语法:
sb<-read.transactions(file = "~/Downloads/sbasket.csv",sep = ",")
我想我什至尝试过:
sb<-read.transactions(file = "~/Downloads/sbasket.csv", format="single",sep=",", cols=c(1,2))
- 您的数据集需要多大?我的数据集是 5,368 行,其中只有 366 行涉及多个事务(所以数据中的大多数行就像下面的第 6 行),所以我的整体数据中大约只有 7% 有多个项目篮子。这就是我没有规则的原因吗?这就是我尝试消除所有单一篮子订单的原因,但即使这样也无济于事。