问题标签 [pandas-resample]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

233 问题

0 投票

0 回答

300 浏览

node.js - 类似于 pandas.resample 但在 node.js [danfo.js]

2020-09-24T16:55:21.107

0 投票

2 回答

232 浏览

python - 熊猫根据条件重新采样和聚合

我有一个 DataFrame，其中有一列状态如下：

我想按天对数据进行重新采样，并在会话中按条件计数状态类型（而不是尝试）。

我可以像这样轻松地尝试重新采样：

并且有：

但是无论会话中尝试了多少次，我都想按会话聚合它：

如果会话中的“成功”状态尝试，则成功+1，失败+0，中断+0；
如果会话中的“中断”状态并且会话中没有“成功”状态，则成功+0，失败+0，中断+1；
如果会话中没有“中断”和“成功”状态，则成功+0，失败+1，中断+0。

所以我应该得到这样的东西：

我坚持使用功能，我想出的所有结果都以“ValueError：系列的真值是模棱两可的”结尾。对于任何想法，我都会非常满意。

python pandas pandas-apply pandas-resample

2020-09-30T08:43:25.867

0 投票

1 回答

57 浏览

dataframe - 使用 Pandas 的重采样功能后如何选择特定时间间隔的数据？

我使用 Pandas 的 resample 函数每 6 个月计算一次产品列表的销售额。我将重采样函数用于“6M”并使用 apply({“column-name”:“sum”})。

现在我想创建一个表，其中包含前六个月的销售额总和。

鉴于所有产品都有超过 3 年的记录，并且没有一个具有相同的开始日期，我如何提取前 6 个月的总和？

在此先感谢您的任何建议。

以下是数据示例：

dataframe pandas-resample

2020-10-05T03:08:10.750

0 投票

1 回答

88 浏览

python - Python Pandas：如何将“resample”与“idxmin”一起使用？

我有一个带有熊猫日期时间索引的数据框。

我想获取每日最小值的索引。这是我的方法不起作用：

如何在不创建循环的情况下解决这个问题？

python pandas pandas-resample

2020-10-06T13:20:48.307

0 投票

3 回答

450 浏览

python - pandas：重新采样多索引数据框

我有一个带有多索引的数据框：“主题”和“日期时间”。每行对应一个主题和一个日期时间，数据框的列对应于各种测量值。

每个主题的天数范围不同，并且给定主题的某些天数可能会丢失（参见示例）。此外，对于给定的一天，受试者可以具有一个或多个值。

我想重新采样数据框，以便：

每个主题每天只有一行（我不关心一天中的时间），
每列值是当天的最后一个非 NaN（如果当天没有值，则为 NaN），
不会创建或保留任何列上没有值的天数。

例如，以下数据框示例：

应该返回：

我花了太多时间尝试使用带有“pad”选项的 resample 来获得这个，但我总是得到错误或者不是我想要的结果。有人可以帮忙吗？

注意：这是创建示例数据框的代码：

python pandas dataframe nan pandas-resample

2020-10-12T13:00:06.887

0 投票

2 回答

43 浏览

python - Groupby和ffill Python中的指定列

我想按id_, Code, Timestamp（因为时间顺序很重要）对值进行排序，然后d1使用id_and对值进行分组，然后对每个组、列和onlyCode使用前向填充，同时保持其他列不变，并返回完整的表。ffillNaN V1V2

d1：

试过：

仅返回两列：

我应该如何正确地做到这一点？

python pandas pandas-resample

2020-10-13T03:32:06.553

0 投票

1 回答

241 浏览

python - 如何根据夏令时更改 UTC OHLC 时间序列上的熊猫重采样

我有一个 1 分钟的 OHLC CSV 文件，其日期使用UTC

我正在使用以下方法重新采样：

这将从周日 21:00 开始重新采样，因此它是 21:00、01:00、05:00，...，直到周五 17:00，其中 21:00 UTC 是市场开放时间。

但是，当有夏令时开关时，一周的第一分钟从周日 22:00 开始，到 18:00 结束。

当周日的第一分钟从 22:00 开始时，您如何将重采样在 22:00 和周日的第一分钟从 21:00 开始时的 21:00 交替进行？ 简而言之，重采样应该在 CSV 中的第一分钟（这是星期天的一周开始）自动开始，并以相同的模式继续，直到遇到另一个开始，依此类推。

python pandas pandas-resample ohlc

2020-10-18T13:24:36.500

0 投票

1 回答

103 浏览

pandas - 每年对具有远期值的每日数据重新采样

我有 2 个数据框（一个 df 和一个系列）。它们看起来像这样：

和：

第一个是年度数据，而第二个是每日数据。我想合并基于类型/日期列的两个基础，但对于年度数据，创建一个带有前向数据的每日数据。我的意思是：2009-12-31 AAB000001471 Q2 2010-01-01 AAB000001471 Q2 .... 直到年底，我有了一个新的价值

我试过了：

但它不工作。我还有年度数据

谢谢

pandas dataframe pandas-resample

2020-10-22T10:20:11.540

0 投票

3 回答

502 浏览

pandas - pandas 将不均匀的每小时数据重新采样到 1D 或 24h 箱中

我有每周一小时的外汇数据，我需要在周一至周四下午 12:00 和周五晚上 21:00 重新采样到“1D”或“24hr”箱中，每周总共 5 天：

所以一周中每一天的小时数是不均匀的，即“星期一”= 00:00:00 星期一到 12:00:00 星期一，“星期二”（还有星期三，星期四）= 即 13:00： 00 周一至周二 12:00:00，周五 = 13:00:00 至 21:00:00

在尝试找到解决方案时，我发现 base 现在已弃用，并且 offset/origin 方法未按预期工作，可能是由于每天的行数不均匀：

我花了几个小时试图找到解决方案

如何将每个 12:00:00 时间戳之间的所有数据行简单地放入 ohlc() 列？

所需的输出如下所示：

pandas time-series resampling pandas-resample

2020-11-05T19:07:00.497

0 投票

2 回答

118 浏览

python - Pandas：重新采样分类索引数据

假设一些测量数据（实际上大约每分钟给出）命名为logData：

数据被分组为avgData如下所示：

这个下采样avgData现在应该（在执行一些其他计算之后）再次上采样，例如到频率freq='10min'为进一步计算。由于avgData.resample('10min')引发以下错误，问题是如何重新采样分类数据？

提前谢谢了！

python pandas pandas-groupby pandas-resample

2020-11-08T10:06:10.153

1 2 3 4 5 6 7 8 9 10

问题标签 [pandas-resample]

Reference