1

我有以下任务: 1)我有一个带有一些电子表格的 excel 文件。从这些电子表格中,我需要来自“A:CU”列的信息,第 41 - 51 行 2) 然后我需要从所有电子表格的第 41 - 51 行的“A:CU”列中收集信息(它们具有相同的结构)和创建一个数据库。3) 应该有一列表明从哪个电子表格数据收集

我做了以下工作:

import pandas as pd
file='January2020.xlsx'
#getting info from spreadsheets C(1), C(2) and so on
days = range(1,32)
sheets = []
for day in days:
    sheets.append('C(' + str(day)+')')
#importing data
all_sales=pd.read_excel(file,header=None,skiprows=41, usecols="A:CU", sheet_name=sheets,
                skipfooter=10)

现在我有 collections.OrderedDict 并且很难将它放入 dataFrame 中。

在此处输入图像描述

我需要的是这样的数据框: 在此处输入图像描述

4

2 回答 2

1

尝试pd.concat

df = pd.concat(all_sales, ignore_index = True) 
于 2020-03-02T09:44:49.583 回答
0

我使用了这段代码并且它有效:

file='January2020.xlsx'
days = range(1,32)
all_sales=pd.DataFrame()
df = pd.DataFrame()
all_df = []
for day in days:
    sheet_name = "C("+str(day)+")"
    all_sales=pd.read_excel(file,header=None,skiprows=41,usecols="A:CU", sheet_name=sheet_name,
                skipfooter=10)
    all_sales["Date"] = sheet_name
    all_df.append(all_sales)
df_final = pd.concat(all_df)

于 2020-03-03T10:45:37.320 回答