我正在尝试对两个 pandas 数据帧进行连接,其中一个是从 mlxtend 包运行 Apriori 算法的结果。当我尝试加入两者时,它输出了一堆无。我认为至少其中一个原因是我加入的数据框之一在两列中包含“(”和“)”,我试图删除它们但没有运气,因为它们是不可变的冻结套。
我将在这里尝试从两个数据帧中复制一个最小样本:
这是一个数据框的示例:
cat_num description code
(32934-082) FILTER PAPER #413 75MM 100/PK 2006101
(32934-082) BULB- 20W HALOGEN (12V) 2099804
这是另一个示例:
antecedants consequents support confidence lift
(32934-082) (32934-080) 0.0124 0.629032 43.682796
(32934-080) (32934-082) 0.0144 0.541667 43.682796
我希望看到的最终结果是:
description hier_code antecedents consequents supp
FILTER PAPER #413 75MM 100/PK 2006101 32934-082 32934-080 0.0124
BULB- 20W HALOGEN (12V) 2099804 32934-080 32934-082 0.0144
当我进行连接时,它会显示列中所有行的 NaN,甚至知道我知道它们都应该有匹配项。我转换为字符串以尝试查看是否可以使用这种方式进行连接
rules.antecedants = rules.antecedants.apply(np.str) but it gave me output that looks like:
antecedent consequent
frozenset(['32934-082']) frozenset(['32934-080'])
所以我看到我有一个无法轻易分解的不可变 Frozenset。为了能够正确连接这两个表,我该怎么做?