我有一个包含变量 STORE、SALES_DT、REGISTER、TRANS_ID 和 PRODUCT 的数据框。
STORE、SALES_DT、REGISTER 和 TRANS_ID 的每个唯一组合代表一个唯一事务,而不仅仅是 TRANS_ID。例如,可能存在具有相同商店、日期和交易 ID 以及产品但在不同寄存器中的交易。任何组合都是可能的。数据帧的一小部分可能是......
STORE SALES_DT REGISTER TRANS_ID PRODUCT
1 2017-04-12 3 1234 Milk
1 2017-04-12 3 1234 Milk
1 2014-06-01 14 8901 Eggs
23 2014-06-09 1 4597 Eggs
48 2016-01-25 2 1234 Bread
48 2015-12-09 2 8901 Milk
如何计算每个 PRODUCT 会输出类似内容的唯一交易?
PRODUCT
Milk :2
Eggs :2
Bread :1
我试过了:
cart <- group_by(dataframe, STORE, SLS_DT, REGISTER, TRANS_ID)
summary(cart$PRODUCT)
但似乎它忽略了计数中的 group_by ,因为它输出:
PRODUCT
MILK :3
EGGS :2
BREAD :1