问题标签 [json-normalize]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

127 问题

0 投票

1 回答

58 浏览

json - 如何使用 pandas 从 api 展平 json

我json从要附加到列表的 API 中返回。在我完成那个调用之后，我需要使用 pandas 来展平这些数据。我不知道该怎么做。

代码：

当我打电话给api_results我时，我的数据如下所示：

我一直在使用json_normalize，但我知道我没有正确使用这个库。

如何展平这些数据？

我需要的是这个：

2021-01-05T13:11:09.180

0 投票

1 回答

308 浏览

python - 如何规范化熊猫数据框中的多列字典

我是编码新手，我可以理解这是一个非常基本的问题

我有一个数据框：

我希望很好地格式化字典列表并获取数据框，例如 full_time_result 列将被拆分为 full_time_result_1、full_time_result_X、full_time_result_2 和 both_teams_to_score 和 double_chance 相同，如下所示：

我正在关注这里给出的这个例子，但我无法让它工作。这是我的代码：

帮助将不胜感激。

python pandas formatting json-normalize

2021-01-05T23:43:34.367

0 投票

1 回答

483 浏览

python - 如何将带有字典列表的熊猫列拆分为每个键的单独列

我正在分析来自 Facebook 的政治广告，这是ProPublica在此处发布的数据集。

这就是我的意思。我有一整列要分析的目标，但是对于我的技能水平的人来说，它的格式非常难以访问。

这仅来自 1 个单元格： [{"target": "NAge", "segment": "21 and older"}, {"target": "MinAge", "segment": "21"}, {"target": "Retargeting", "segment": "people who may be similar to their customers"}, {"target": "Region", "segment": "the United States"}]

另一个： [{"target": "NAge", "segment": "18 and older"}, {"target": "Location Type", "segment": "HOME"}, {"target": "Interest", "segment": "Hispanic culture"}, {"target": "Interest", "segment": "Republican Party (United States)"}, {"target": "Location Granularity", "segment": "country"}, {"target": "Country", "segment": "the United States"}, {"target": "MinAge", "segment": 18}]

我需要做的是将每个“目标”项目分开以成为列标签，其中每个相应的“段”成为该列中的可能值。

或者，是否创建一个函数来调用每行中的每个字典键来计算频率？

python pandas json-normalize

2021-01-07T23:42:20.597

0 投票

1 回答

384 浏览

python - 如何获取一列字典值列表并使用它们的值（不是键）创建新列

我正在分析来自 Facebook 的政治广告，这是ProPublica在此处发布的数据集。

我想分析一整列'targets'，但它的格式使得每个观察都是一个形式list（例如）。dictsstring"[{k1: v1}, {k2: v2}]"

我需要将每个分隔"target" value成为列标题，每个对应"segment" value于该列中的一个值。

或者，是创建一个函数，调用每行中的每个字典键，计算频率的解决方案吗？

这应该是输出的样子：

Reddit 上有人发布了这个解决方案：

python pandas json-normalize

2021-01-08T04:52:24.710

0 投票

1 回答

1260 浏览

python - 如何将嵌套的 JSON 键规范化为 pandas 数据帧

一般来说，我是 Python 和 API 的新手，所以这可能是一个简单回答的基本问题。我正在尝试使用 Python从Propublica 的 API获取有关国会代表的数据。我可以让 REST API 运行，但是在将生成的 json 数据正确地构建为数据框时遇到了问题。我认为这是因为数据中有多个嵌套级别。我尝试规范化数据，但我只能让它在第一个嵌套级别上工作。

这是我的代码。请注意，我已经删除了我的 API 密钥，但您可以在这里快速轻松地获得一个。

这就是 JSON 数据的样子。请注意，所有代表的数据都嵌套在“结果”和“成员”下：

这就是我的“数据集”的样子。所有 JSON 数据都作为字符串存储在唯一行的“成员”列中：

我已经尝试过json_normalize两次运行数据，并且还添加了两个变量[results,members]。我试过的都没有用。

有什么建议么？

python json pandas dataframe json-normalize

2021-01-13T21:31:16.257

0 投票

2 回答

59 浏览