问题标签 [pandas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
5829 浏览

python - Python Pandas:导入熊猫时找不到 numpy.core.multiarray

我正在尝试让我的代码(在 eclipse 中运行)导入熊猫。

我收到以下错误:"ImportError: numpy.core.multiarray failed to import"当我尝试导入熊猫时。我正在使用python2.7,pandas 0.7.1numpy 1.5.1

0 投票
1 回答
1262 浏览

python - 混合模式下的 Pandas 数据帧无法序列化为 hdf5?

在 Pandas 中,我似乎无法存储混合类型的数据框:

这给出了一个Exception: Cannot currently store mixed-type DataFrame objects in Table format

这是由于 Pandas 的某些固有限制,还是只是未来的好东西?这个限制似乎HDFStore不是很有用,因为许多数据帧将是混合类型的。

0 投票
8 回答
262125 浏览

python - 如何将 tsv 文件加载到 Pandas DataFrame 中?

我是 python 和 pandas 的新手。我正在尝试将tsv文件加载到 pandasDataFrame中。

这就是我正在尝试的,我得到的错误:

0 投票
2 回答
5024 浏览

python - 使用 pandas.read_csv 从 csv 文件加载数据时如何指定 dtype?

我有一些具有以下格式的文本文件:


当我使用 read_csv 将它们加载到 DataFrame 中时,它不会为某些列生成正确的 dtype。比如第一列被解析为int,不是unicode str,第三列被解析为unicode str,不是int,因为缺少一个数据……有没有办法预设DataFrame的dtype,就像numpy.genfromtxt 呢?

更新:我read_csv这样使用导致问题:

为了同时解决 dtype 和 encoding 问题,我需要先使用unicode()and numpy.genfromtxt

如果read_csv能添加dtypeusecols设置就好了。对不起我的贪婪。^_^

0 投票
4 回答
20066 浏览

python - 如何在 pandas 中读取固定宽度格式的文本文件?

我刚刚接触了熊猫,正在研究如何读取文件。该文件来自 WRDS 数据库,是自 1960 年代以来的 SP500 成分列表。我检查了文件,无论我做什么来导入它read_csv,我仍然无法正确显示数据。

上面的输出块是什么意思?任何事情都会有所帮助。

0 投票
1 回答
1376 浏览

python - 如何告诉 pandas 将特定列解析为日期时间对象,但不使其成为索引?

我有一个 csv 文件,其中一列是日期/时间字符串。如何正确解析它pandas?我不想将该列设为索引。谢谢!

乌里

0 投票
10 回答
224712 浏览

python - Pandas 将数据帧转换为元组数组

我已经使用 pandas 操作了一些数据,现在我想执行批量保存回数据库。这需要我将数据帧转换为元组数组,每个元组对应于数据帧的“行”。

我的 DataFrame 看起来像:

我想将其转换为元组数组,例如:

关于如何有效地做到这一点的任何建议?

0 投票
1 回答
3296 浏览

python - 重复时间序列数据的 Pandas 滚动中位数

我看到 Pandas 还不允许重复的时间序列索引https://github.com/pydata/pandas/issues/643),但很快就会添加。我想知道是否有一种好方法可以通过多索引标签/列将滚动窗口均值应用于具有重复时间的数据集

基本上,我有一个由纪元时间、分层标签(tag1、tag2)和所用时间组成的无序事件的 csv。一个小样本:

我想要做的是通过事件和事件+标签构建和绘制具有不同 ms 窗口的滚动方式。这似乎应该在 Pandas 中完成,但不确定我是否需要先等到重复的时间序列索引。现在有什么想法可以解决这个问题吗?

0 投票
2 回答
11115 浏览

python - 使用 pandas 将索引列添加到 DataFrame

我是 pandas 的初级用户,在研究了文档之后,我仍然找不到直接的方法来执行以下操作。

我有一个带有 pandas.DateRange 索引的 DataFrame,我想添加一个列,其中包含相同 DateRange 的一部分的值。

假设我有

我怎样才能获得这样的东西:

0 投票
2 回答
43488 浏览

python - 在熊猫中加入或合并覆盖

我想对具有日期时间索引的数据框执行连接/合并/追加操作。

假设我有df1并且我想添加df2它。 df2可以有更少或更多的列,以及重叠的索引。对于索引匹配的所有行,如果与df2具有相同的列df1,我希望 的值df1被来自 的值覆盖df2

我怎样才能获得想要的结果?