问题标签 [json-normalize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
58 浏览

json - 如何使用 pandas 从 api 展平 json

json从要附加到列表的 API 中返回。在我完成那个调用之后,我需要使用 pandas 来展平这些数据。我不知道该怎么做。

代码:

当我打电话给api_results我时,我的数据如下所示:

我一直在使用json_normalize,但我知道我没有正确使用这个库。

如何展平这些数据?

我需要的是这个:

0 投票
1 回答
308 浏览

python - 如何规范化熊猫数据框中的多列字典

我是编码新手,我可以理解这是一个非常基本的问题

我有一个数据框:

我希望很好地格式化字典列表并获取数据框,例如 full_time_result 列将被拆分为 full_time_result_1、full_time_result_X、full_time_result_2 和 both_teams_to_score 和 double_chance 相同,如下所示:

我正在关注这里给出的这个例子,但我无法让它工作。这是我的代码:

帮助将不胜感激。

0 投票
1 回答
483 浏览

python - 如何将带有字典列表的熊猫列拆分为每个键的单独列

我正在分析来自 Facebook 的政治广告,这是ProPublica在此处发布的数据集。

这就是我的意思。我有一整列要分析的目标,但是对于我的技能水平的人来说,它的格式非常难以访问。

这仅来自 1 个单元格: [{"target": "NAge", "segment": "21 and older"}, {"target": "MinAge", "segment": "21"}, {"target": "Retargeting", "segment": "people who may be similar to their customers"}, {"target": "Region", "segment": "the United States"}]

另一个: [{"target": "NAge", "segment": "18 and older"}, {"target": "Location Type", "segment": "HOME"}, {"target": "Interest", "segment": "Hispanic culture"}, {"target": "Interest", "segment": "Republican Party (United States)"}, {"target": "Location Granularity", "segment": "country"}, {"target": "Country", "segment": "the United States"}, {"target": "MinAge", "segment": 18}]

我需要做的是将每个“目标”项目分开以成为列标签,其中每个相应的“段”成为该列中的可能值。

或者,是否创建一个函数来调用每行中的每个字典键来计算频率?

0 投票
1 回答
384 浏览

python - 如何获取一列字典值列表并使用它们的值(不是键)创建新列

我正在分析来自 Facebook 的政治广告,这是ProPublica在此处发布的数据集。

我想分析一整列'targets',但它的格式使得每个观察都是一个形式list(例如)。dictsstring"[{k1: v1}, {k2: v2}]"

我需要将每个分隔"target" value成为列标题,每个对应"segment" value于该列中的一个值。

或者,是创建一个函数,调用每行中的每个字典键,计算频率的解决方案吗?

这应该是输出的样子:

Reddit 上有人发布了这个解决方案:

0 投票
1 回答
1260 浏览

python - 如何将嵌套的 JSON 键规范化为 pandas 数据帧

一般来说,我是 Python 和 API 的新手,所以这可能是一个简单回答的基本问题。我正在尝试使用 Python从Propublica 的 API获取有关国会代表的数据。我可以让 REST API 运行,但是在将生成的 json 数据正确地构建为数据框时遇到了问题。我认为这是因为数据中有多个嵌套级别。我尝试规范化数据,但我只能让它在第一个嵌套级别上工作。

这是我的代码。请注意,我已经删除了我的 API 密钥,但您可以在这里快速轻松地获得一个。

这就是 JSON 数据的样子。请注意,所有代表的数据都嵌套在“结果”和“成员”下:

这就是我的“数据集”的样子。所有 JSON 数据都作为字符串存储在唯一行的“成员”列中:

我已经尝试过json_normalize两次运行数据,并且还添加了两个变量[results,members]。我试过的都没有用。

有什么建议么?

0 投票
2 回答
59 浏览

python - 在熊猫中导入嵌套字典数据

如果我的 json 文件看起来像这样......

我可以使用...导入熊猫中的数据

但是数据看起来是这样的......

我需要一个列中的所有 URL。

0 投票
4 回答
559 浏览

python - 如何将包含嵌套列表的字典列表转换为 pandas df

我有一个字典列表:

我想将其转换为熊猫数据框,如下所示:

姓名 动物 频率
一种 2
b 1
b 卡比巴拉 5
b 10
C 1
C 1

在当前代码中,我尝试对其进行规范化:

但我认为我走错了方向。另外,如果我做一个简单的df = pd.DataFrame(list_of_dicts),它会导致每个字典列表都是一个单行值,这是不希望的。

0 投票
1 回答
315 浏览

python - 如何将嵌套的 JSON 展平为 pandas 数据框

JSON我想将其放入数据框中有些棘手。

我不需要带有 A 和 B 的第一层,因为它是名称的一部分。永远只有一个 left_foot 和一个 right_foot。

我想要的数据如下:

使用这篇文章能够得到脚和脚趾,但如果你说数据[“A”]。有没有更简单的方法?

编辑 我有这样的东西,但我需要"A"在第一行指定。

0 投票
1 回答
649 浏览

python - 如何将 JSON 文件中的值提取到数据框行中的单独列中

我的主要目标是提取metrics列中的值。要了解该列的结构,您可以使用下面的行

df.metrics[0]

在下面的代码中,您可以看到按类型分隔的指标。values我想要为类型存储的所有值stepsspeed并且pace

例如:在类型中steps你有这个(你可以签入df.metrics[0]):

我想要一行包含 values [13, 11, 6, 13, 5, ...],这些值中的每一个都在不同的数据框列中。

做起来是不是太难了?我怎么能那样做?我尝试了多种方法,但我对.json文件完全陌生

0 投票
2 回答
514 浏览

python - json_normalize 在尝试提取某些属性时产生 KeyError

这是我的 json 文件的一个子集:

我想将它放入一个数据框中,每个问题和每个答案的一行。

Python代码:

这会产生一个 KeyError:

在这里待了几个小时,绝对无法弄清楚。我觉得它应该很简单,但它从来都不是。