问题标签 [pandas-1.0]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 自动将字符串列推断为字符串
默认情况下,pandas.read_csv()
将使用 dtype 对象读取字符串列。从 pandas 1.0 开始,可以改为将其读取为字符串 dtype。我正在阅读 CSV,其中大多数列都是字符串。我可以告诉熊猫(尝试)默认情况下将所有非数字列作为字符串而不是作为对象 dtypes 读取吗?
编码:
这导致:
我正在使用熊猫 1.0.0rc0。在编写 HDFStore 时,直接将所有内容读取为字符串 dtype 应该可以防止混合类型出现问题。
python - 转换为 Markdown 为什么没有 print() 函数 pandas 1.0 不能正常工作
我正在尝试转换为 Markdown的示例。没有print()
功能的表格降价格式不正确。
pandas - pandas 1.0 用 NAN 替换一个字符串 dtype 列
我已经开始在 pandas 1.0.1 中使用 StringDtype 我知道它被认为是实验性的,但是在包含 NaN 的字符串类型列上使用替换时遇到了问题。
例如:
上述结果:
这可能是一个错误还是我做错了什么?
python-3.8 - 创建新列时的Python Pandas SettingWithCopyWarning
我有一个数据框 df 为:
我正在尝试以下操作:
我收到以下警告:
执行上述操作的正确方法是什么?
python - 替换选定列中特定的逐行重复单元格而不删除行
如何在不删除行的情况下替换选定列中特定的逐行重复单元格(最好不遍历行)?
基本上,我想保留第一个值并用 NAN 替换剩余的重复项。
例如:
原来的:
预期输出:
稍微复杂一点的例子如下:
原来的:
预期输出:
python-3.8 - Pandas 1.0 从年份和日期创建月份列
我有一个数据框df
,其值为:
我正在尝试创建一个新MonthIdx
列:
但我得到了错误:
以下是所需的输出:
python - StringDtype 数据类型不理解
从扩展类型转换时,例如pd.Int32Dtype()
,我得到TypeError: data type not understood
. 例子:
python - 用 None 替换 DataFrame 中的值
当创建一个带有None
值的 Pandas DataFrame 时,它们被转换为NaN
:
如果我None
按索引设置值也是一样的:
但是,如果我进行替换,就会开始发生奇怪的事情:
这里发生了什么?
python - 简单的 pandas 合并有意想不到的结果 - 获取数据结构但不是预期的数据
所以我得到了意想不到的结果 - 我的合并包括 1 个表中的 2 列,另一个表中的 3 列,它们之间有一个公共列。合并返回预期的 3 列数据结构,但仅返回来自合并一侧的结果(基本上是数据一侧的副本),因此除非我进行外连接,否则一个字段没有值。如果我进行内部连接,我不会得到任何值——即使我可以清楚地看到共同的值。使用 on_left 和 on_right 得到相同的结果。没有列被索引。
我正在使用 Pandas v 1.0.3
DFA.merge(DFB, on=['queue'], how='left').fillna('').drop_duplicates()
结果是
DFA.merge(DFB, on=['queue'], how='right').fillna('').drop_duplicates()
结果是
DFA.merge(DFB, on=['queue'], how='inner').fillna('').drop_duplicates()
结果是
是的,没有结果
这看起来很简单 - 我在这里错过了什么?队列文件中的值在 excel 中被验证为完全相同。数据类型都是对象(字符串)
python - 熊猫奇怪的 SettingWithCopyWarning 警告
拥有一列的 DataFrame volume_
:
SettingWithCopyWarning
导致关于“试图在数据帧的切片副本上设置值”的经典半永久警告。这个众所周知的警告表明:
尝试改用 .loc[row_indexer,col_indexer] = value
好吧,就照他们说的做吧!
现在,我得到了两个,而不是一个SettingWithCopyWarning 警告!
从本质上讲,Pandas 抱怨我使用df.loc[:, 'up'] = ...
并建议我df.loc[:, 'up'] = ...
改用......
实现此目的的正确、符合 Pandas 的方法是什么?