问题标签 [json-normalize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
34 浏览

python - dict到pandas pandas DataFrame的dict列表

我想在数据框中转换 future_df:

我用丑陋的以下几行来实现这一点:

我知道这是一个非常硬编码的解决方案,并且必须有一个更干净优雅的解决方案。我想 json_normalize 函数可能会有所帮助,但我没有找到正确使用它的方法。

0 投票
1 回答
137 浏览

python - 将 JSON 数组提取到数据框列中

我有project.json文件,其中包含这样的数据:

我需要将嵌套subject_id并提取date_of_submission到一个单独的列中,例如:

学生卡 主题ID 提交日期 项目年
ST0001 S003 2021 年 5 月 23 日 20:03 第二
ST0001 S004 24/05/2021 21:03 第二
ST0001 S005 30/05/2021 05:09 第二
ST0002 S003 2021 年 2 月 6 日 15:05 第二
ST0002 S007 28/04/2021 21:03 第二
ST0002 S0018 2020 年 3 月 6 日 08:15 第一的

我想我们可以用它json_normalize来提取一个级别,有人可以帮我完成这个吗?

0 投票
0 回答
56 浏览

json - 使用streamlit file_uploader时如何规范化json文件?

我正在尝试在我的 streamlit 应用程序中加载一个 json 文件并将其解析为 pandas 数据帧。这是json文件:

我正在使用 json_normalize 但我收到以下错误“TypeError:字符串索引必须是整数”

知道我该如何解决这个问题吗?谢谢!

0 投票
1 回答
130 浏览

python - 如何在 Pandas Python 中将此嵌套数组 JSON 响应列转换为 DataFrame

我有一个熊猫数据框,它有一个 json 响应列

我已使用以下代码读取数据:

后来我使用 eval 函数来评估使用此代码:

它在使用 json_normalize 时抛出错误

运行上面的代码1错误:

在此处输入图像描述

评估后的数据如下所示:

在此处输入图像描述

我需要扁平列值中的这个 json 数据。

使用读取 csv 后, data1 = pd.read_csv("bureau_response.csv",sep=",") 请注意,它有两列 APPLICATION__ID 和 account_Segments 我希望 APPLICATION_ID 列在展平 account_Segments 后作为索引

所以在 data1.head(1).to_dict() 我得到之后, 这个输出

我删除了双引号并清理了数据,因此下面给出了前两行。请注意,索引列具有 APPLICATION_ID

当我调用您的函数 s = (data2.applymap(type) == list).all()时,此条件为假,因此数据不会变平

我已经使用这些代码来清理数据并最终使用您的代码创建了一个新的 DF,并且我得到以下格式作为输出:

dict1 = data1['account_Segments'].to_dict() dict_str = str(dict1).replace('"','') import ast new_dict = ast.literal_eval(dict_str)

df2 = flatten_nested_json_df(df1) df2 = df2.drop(['level_0'], axis=1) df2

输出df2

我想让所有 json 用 application_id 作为行索引展平

0 投票
1 回答
53 浏览

python - 使用 Pandas json_normalize 展平嵌套 JSON 时出现问题

我有一个具有以下结构的 JSON 文件(以下是 的内容retweets[:2]):

我需要什么: 我必须将 JSON 文件导入到 Pandas 数据框中,以便每个字段都有一个单独的列(即,完全展平嵌套列表)。例如,不应只有一列referenced_tweets包含typeid等,而应为每一列分别设置。

这是我的代码:

问题:df_retweets.head()当我运行最后一行id代码(例如,该列的值始终为,而 referenced_tweets 列中的类型为!!!! 请参阅所附结果数据框的屏幕截图。typereferenced_tweetstyperetweetedreplied_to

在此处输入图像描述

0 投票
1 回答
626 浏览

python - 将深度嵌套的 JSON 展平为 pandas 数据框

我正在尝试将深度嵌套的 JSON 导入熊猫数据框。这是 JSON 文件的结构(这只是第一条记录 (retweets[:1]):

这是我的代码:

这是生成的数据框:

在此处输入图像描述

如您所见,该列referenced_tweets尚未展平(请注意,referenced_tweets我的 JSON 文件中有两个不同的数组:一个位于另一个“referenced_tweets”内部的更深层次)。例如,更高级别的返回:

而更深层次的返回:

问题:我想知道如何才能使更深的referenced_tweets. 我想要两个单独的列作为referenced_tweets.typereferenced_tweets.id,上面示例中列的值referenced_tweets.type应该是replied_to

0 投票
0 回答
67 浏览

python - 如何展平包含字典列表的字典

这是一个 JSON 文件的示例,我试图将其展平为数据框。如果有人熟悉的话,它基于 OCDS(开放合同数据标准)数据模型。

我正在使用 json_normalize。这是我现在拥有的代码:

我遇到的困难是将数据放入tender->items, bids,awardscontracts. 我尝试了很多组合,但我总是遇到以下错误之一:

使用现在的代码,一切都变平了,除此之外['tender','items'],'bids','awards','contracts'看起来像这样(右边的 4):

在此处输入图像描述

我不知道如何在这 4 个字典列表中获取数据。任何帮助表示赞赏。

0 投票
1 回答
38 浏览

python - Pandas json_normalize 函数无法正确导出到 excel 文件

我正在使用 json_normalize 函数,但它没有正确地将 JSON 导出到您可以在下面看到的 excel 文件中。 在此处输入图像描述

这是我的代码:

0 投票
2 回答
164 浏览

python - 如何将嵌套的 JSON 转换为 CSV

我想将嵌套的 json 转换为 csv 格式,包括分组列表/字典的子行。

这是我的json

JSON到CSV转换器的输出

我尝试了 pandas 规范化,但结果与想要的不一样。JSON 数组不会转换为 csv 中的子行。我想在 csv 中保留空字符串。

我想用 Python 脚本做同样的事情。

0 投票
2 回答
114 浏览

python - 具有多个键的熊猫数据框到 json

我有一个看起来像这样的熊猫数据框:

ID x1 x2 x3 行动
23432 示例1 1 姓名 创造
678786 示例2 1 姓名 创造

如何将该熊猫数据框转换为这种 json 格式?

我玩过 pd.json_normalize 但无法让它工作。我也引用了这个问题,但由于需要 groupby,它有点不同。