2

我正在尝试对两个 pandas 数据帧进行连接,其中一个是从 mlxtend 包运行 Apriori 算法的结果。当我尝试加入两者时,它输出了一堆无。我认为至少其中一个原因是我加入的数据框之一在两列中包含“(”和“)”,我试图删除它们但没有运气,因为它们是不可变的冻结套。

我将在这里尝试从两个数据帧中复制一个最小样本:

这是一个数据框的示例:

cat_num             description                     code
(32934-082)         FILTER PAPER #413 75MM 100/PK   2006101
(32934-082)         BULB- 20W HALOGEN (12V)         2099804

这是另一个示例:

antecedants consequents support confidence  lift
(32934-082) (32934-080) 0.0124  0.629032    43.682796
(32934-080) (32934-082) 0.0144  0.541667    43.682796

我希望看到的最终结果是:

description                    hier_code     antecedents consequents supp
FILTER PAPER #413 75MM 100/PK  2006101       32934-082   32934-080 0.0124
BULB- 20W HALOGEN (12V)        2099804       32934-080   32934-082 0.0144

当我进行连接时,它会显示列中所有行的 NaN,甚至知道我知道它们都应该有匹配项。我转换为字符串以尝试查看是否可以使用这种方式进行连接

rules.antecedants = rules.antecedants.apply(np.str) but it gave me output that looks like:

antecedent                 consequent
frozenset(['32934-082'])   frozenset(['32934-080'])

所以我看到我有一个无法轻易分解的不可变 Frozenset。为了能够正确连接这两个表,我该怎么做?

4

0 回答 0