我必须数据框,我正在使用熊猫。我想从可变日期和列中的值进行累积总和
我想在 df2 中添加第二列,显示日期,以了解在 df2 中的 date2 之后 AVG 列的总和大于 100 的日期。
例如,df1 和 df2 是我开始的数据框,df3 是我想要的,df3['date100'] 是 avg 总和大于 100 的日期:
df1 = pd.DataFrame({'date1': ['1/1/2014', '2/1/2014', '3/1/2014','1/1/2014', '2/1/2014', '3/1/2014','1/1/2014', '2/1/2014', '3/1/2014'],
'Place':['A','A','A','B','B','B','C','C','C'],'AVG': [62,14,47,25,74,60,78,27,41]})
df2 = pd.DataFrame({'date2': ['1/1/2014', '2/1/2014'], 'Place':['A','C'])})
*Something*
df3 = pd.DataFrame({'date2': ['1/1/2014', '2/1/2014'], 'Place':['A','C'], 'date100': ['3/1/2014', '2/1/2014'], 'sum': [123, 105]})
我找到了一些答案,但大多数都使用 groupby 而 df2 没有组。