问题标签 [json-normalize]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

127 问题

0 投票

2 回答

34 浏览

python - dict到pandas pandas DataFrame的dict列表

我想在数据框中转换 future_df：

我用丑陋的以下几行来实现这一点：

我知道这是一个非常硬编码的解决方案，并且必须有一个更干净优雅的解决方案。我想 json_normalize 函数可能会有所帮助，但我没有找到正确使用它的方法。

2021-07-30T17:03:02.223

0 投票

1 回答

137 浏览

python - 将 JSON 数组提取到数据框列中

我有project.json文件，其中包含这样的数据：

我需要将嵌套subject_id并提取date_of_submission到一个单独的列中，例如：

学生卡	主题ID	提交日期	项目年
ST0001	S003	2021 年 5 月 23 日 20:03	第二
ST0001	S004	24/05/2021 21:03	第二
ST0001	S005	30/05/2021 05:09	第二
ST0002	S003	2021 年 2 月 6 日 15:05	第二
ST0002	S007	28/04/2021 21:03	第二
ST0002	S0018	2020 年 3 月 6 日 08:15	第一的

我想我们可以用它json_normalize来提取一个级别，有人可以帮我完成这个吗？

python pandas dataframe json-normalize

2021-07-31T15:06:36.570

0 投票

0 回答

56 浏览

json - 使用streamlit file_uploader时如何规范化json文件？

我正在尝试在我的 streamlit 应用程序中加载一个 json 文件并将其解析为 pandas 数据帧。这是json文件：

我正在使用 json_normalize 但我收到以下错误“TypeError：字符串索引必须是整数”

知道我该如何解决这个问题吗？谢谢！

json streamlit json-normalize

2021-08-02T14:57:24.937

0 投票

1 回答

130 浏览

python - 如何在 Pandas Python 中将此嵌套数组 JSON 响应列转换为 DataFrame

我有一个熊猫数据框，它有一个 json 响应列

我已使用以下代码读取数据：

后来我使用 eval 函数来评估使用此代码：

它在使用 json_normalize 时抛出错误

运行上面的代码1错误：

评估后的数据如下所示：

我需要扁平列值中的这个 json 数据。

使用读取 csv 后， data1 = pd.read_csv("bureau_response.csv",sep=",") 请注意，它有两列 APPLICATION__ID 和 account_Segments 我希望 APPLICATION_ID 列在展平 account_Segments 后作为索引

所以在 data1.head(1).to_dict() 我得到之后，这个输出

我删除了双引号并清理了数据，因此下面给出了前两行。请注意，索引列具有 APPLICATION_ID

当我调用您的函数 s = (data2.applymap(type) == list).all()时，此条件为假，因此数据不会变平

我已经使用这些代码来清理数据并最终使用您的代码创建了一个新的 DF，并且我得到以下格式作为输出：

dict1 = data1['account_Segments'].to_dict() dict_str = str(dict1).replace('"','') import ast new_dict = ast.literal_eval(dict_str)

df2 = flatten_nested_json_df(df1) df2 = df2.drop(['level_0'], axis=1) df2