问题标签 [json-normalize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
json - 如何使用 pandas 从 api 展平 json
我json
从要附加到列表的 API 中返回。在我完成那个调用之后,我需要使用 pandas 来展平这些数据。我不知道该怎么做。
代码:
当我打电话给api_results
我时,我的数据如下所示:
我一直在使用json_normalize
,但我知道我没有正确使用这个库。
如何展平这些数据?
我需要的是这个:
python - 如何规范化熊猫数据框中的多列字典
我是编码新手,我可以理解这是一个非常基本的问题
我有一个数据框:
我希望很好地格式化字典列表并获取数据框,例如 full_time_result 列将被拆分为 full_time_result_1、full_time_result_X、full_time_result_2 和 both_teams_to_score 和 double_chance 相同,如下所示:
我正在关注这里给出的这个例子,但我无法让它工作。这是我的代码:
帮助将不胜感激。
python - 如何将带有字典列表的熊猫列拆分为每个键的单独列
我正在分析来自 Facebook 的政治广告,这是ProPublica在此处发布的数据集。
这就是我的意思。我有一整列要分析的目标,但是对于我的技能水平的人来说,它的格式非常难以访问。
这仅来自 1 个单元格:
[{"target": "NAge", "segment": "21 and older"}, {"target": "MinAge", "segment": "21"}, {"target": "Retargeting", "segment": "people who may be similar to their customers"}, {"target": "Region", "segment": "the United States"}]
另一个:
[{"target": "NAge", "segment": "18 and older"}, {"target": "Location Type", "segment": "HOME"}, {"target": "Interest", "segment": "Hispanic culture"}, {"target": "Interest", "segment": "Republican Party (United States)"}, {"target": "Location Granularity", "segment": "country"}, {"target": "Country", "segment": "the United States"}, {"target": "MinAge", "segment": 18}]
我需要做的是将每个“目标”项目分开以成为列标签,其中每个相应的“段”成为该列中的可能值。
或者,是否创建一个函数来调用每行中的每个字典键来计算频率?
python - 如何将嵌套的 JSON 键规范化为 pandas 数据帧
一般来说,我是 Python 和 API 的新手,所以这可能是一个简单回答的基本问题。我正在尝试使用 Python从Propublica 的 API获取有关国会代表的数据。我可以让 REST API 运行,但是在将生成的 json 数据正确地构建为数据框时遇到了问题。我认为这是因为数据中有多个嵌套级别。我尝试规范化数据,但我只能让它在第一个嵌套级别上工作。
这是我的代码。请注意,我已经删除了我的 API 密钥,但您可以在这里快速轻松地获得一个。
这就是 JSON 数据的样子。请注意,所有代表的数据都嵌套在“结果”和“成员”下:
这就是我的“数据集”的样子。所有 JSON 数据都作为字符串存储在唯一行的“成员”列中:
我已经尝试过json_normalize
两次运行数据,并且还添加了两个变量[results,members]
。我试过的都没有用。
有什么建议么?
python - 在熊猫中导入嵌套字典数据
如果我的 json 文件看起来像这样......
我可以使用...导入熊猫中的数据
但是数据看起来是这样的......
我需要一个列中的所有 URL。
python - 如何将包含嵌套列表的字典列表转换为 pandas df
我有一个字典列表:
我想将其转换为熊猫数据框,如下所示:
姓名 | 动物 | 频率 |
---|---|---|
一种 | 狗 | 2 |
b | 猫 | 1 |
b | 卡比巴拉 | 5 |
b | 鲸 | 10 |
C | 马 | 1 |
C | 猫 | 1 |
在当前代码中,我尝试对其进行规范化:
但我认为我走错了方向。另外,如果我做一个简单的df = pd.DataFrame(list_of_dicts)
,它会导致每个字典列表都是一个单行值,这是不希望的。
python - 如何将嵌套的 JSON 展平为 pandas 数据框
JSON
我想将其放入数据框中有些棘手。
我不需要带有 A 和 B 的第一层,因为它是名称的一部分。永远只有一个 left_foot 和一个 right_foot。
我想要的数据如下:
使用这篇文章能够得到脚和脚趾,但如果你说数据[“A”]。有没有更简单的方法?
编辑
我有这样的东西,但我需要"A"
在第一行指定。
python - 如何将 JSON 文件中的值提取到数据框行中的单独列中
我的主要目标是提取metrics
列中的值。要了解该列的结构,您可以使用下面的行
df.metrics[0]
在下面的代码中,您可以看到按类型分隔的指标。values
我想要为类型存储的所有值steps
,speed
并且pace
例如:在类型中steps
你有这个(你可以签入df.metrics[0]
):
我想要一行包含 values [13, 11, 6, 13, 5, ...]
,这些值中的每一个都在不同的数据框列中。
做起来是不是太难了?我怎么能那样做?我尝试了多种方法,但我对.json
文件完全陌生
python - json_normalize 在尝试提取某些属性时产生 KeyError
这是我的 json 文件的一个子集:
我想将它放入一个数据框中,每个问题和每个答案的一行。
Python代码:
这会产生一个 KeyError:
在这里待了几个小时,绝对无法弄清楚。我觉得它应该很简单,但它从来都不是。