0

所以在我的代码中,我正在删除重复项。问题是我的一些数据没有条目。因为它删除了重复的那些没有条目的被删除。这样做的问题是我正在运行数百万个条目,所以我不能只是进入并在数据中添加一个假条目。我需要一行代码来忽略空白条目而不是删除它们。我只检查它们是否在一列而不是一行中重复。提前致谢。我也在其中使用 PANDAS,因为数据在 CSV 文件中

数组示例:1,1 2,2 3,3 4,"" 5,5 6,"" 1,1 2,2 我想对数组发生什么:1,1 2,2 3,3 4,"" 5,5 6,"" 实际发生的情况 1,1 2,2 3,3 5,5

`df = df.drop_duplicates(subset = [1])

df = df.drop_duplicates(subset = [2]) df = df.drop_duplicates(subset = [2])`

4

1 回答 1

0

您可以过滤空行,删除重复项并在 concat 之后。

df = pd.DataFrame({'col1': ['1','1 2','2 3','3 4','','5','5 6','','1','1 2','2']})
dfempty = df.loc[df.col1 == ""]
df2 = df.loc[df.col1 != ""].drop_duplicates()
pd.concat([dfempty, df2]).sort_index()


    col1
0   1
1   1 2
2   2 3
3   3 4
4   
5   5
6   5 6
7   

10 2

于 2021-09-01T14:56:05.793 回答