我有一个数据集,其中包含许多商品及其销售数据,包括每周销售的数量和数量。我想弄清楚两者之间是否存在某种相关性,试图了解一件商品的销售是否会影响另一件商品的销售,就任何积极或消极影响而言。考虑以下类型的数据:
Week # Product # Sale($) Quantity
Week 1 Product 1 1 1
Product 2 2 1
Product 3 3 1
Week 2 Product 1 3 2
Product 3 2 1
Product 6 2 2
Week 3 Product 4 2 1
Product 3 1 2
Product 5 4 2
因此,从上述每周数据中,我想弄清楚如何将这些数据转换为具有上述可用参数集的市场篮子数据形式。因为,没有任何可用的市场篮子数据。
The parameters I could think of is :
To use the count or occurrences of each product in a given week.
To use the total quantity sold
To use the total sales to find correlation.
所以,基本上我必须想出一个项目如何与一个产品与另一个产品的亲和力相关。无论它是正相关还是负相关。唯一的问题是我没有任何主键来将商品与篮子或订单号绑定,因为它是汇总销售。本主题的任何答案或帮助都非常可观。如果您发现它不完整,您可以让我知道以进一步澄清。