问题标签 [json-normalize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - dict到pandas pandas DataFrame的dict列表
我想在数据框中转换 future_df:
我用丑陋的以下几行来实现这一点:
我知道这是一个非常硬编码的解决方案,并且必须有一个更干净优雅的解决方案。我想 json_normalize 函数可能会有所帮助,但我没有找到正确使用它的方法。
python - 将 JSON 数组提取到数据框列中
我有project.json
文件,其中包含这样的数据:
我需要将嵌套subject_id
并提取date_of_submission
到一个单独的列中,例如:
学生卡 | 主题ID | 提交日期 | 项目年 |
---|---|---|---|
ST0001 | S003 | 2021 年 5 月 23 日 20:03 | 第二 |
ST0001 | S004 | 24/05/2021 21:03 | 第二 |
ST0001 | S005 | 30/05/2021 05:09 | 第二 |
ST0002 | S003 | 2021 年 2 月 6 日 15:05 | 第二 |
ST0002 | S007 | 28/04/2021 21:03 | 第二 |
ST0002 | S0018 | 2020 年 3 月 6 日 08:15 | 第一的 |
我想我们可以用它json_normalize
来提取一个级别,有人可以帮我完成这个吗?
json - 使用streamlit file_uploader时如何规范化json文件?
我正在尝试在我的 streamlit 应用程序中加载一个 json 文件并将其解析为 pandas 数据帧。这是json文件:
我正在使用 json_normalize 但我收到以下错误“TypeError:字符串索引必须是整数”
知道我该如何解决这个问题吗?谢谢!
python - 如何在 Pandas Python 中将此嵌套数组 JSON 响应列转换为 DataFrame
我有一个熊猫数据框,它有一个 json 响应列
我已使用以下代码读取数据:
后来我使用 eval 函数来评估使用此代码:
它在使用 json_normalize 时抛出错误
运行上面的代码1错误:
评估后的数据如下所示:
我需要扁平列值中的这个 json 数据。
使用读取 csv 后, data1 = pd.read_csv("bureau_response.csv",sep=",") 请注意,它有两列 APPLICATION__ID 和 account_Segments 我希望 APPLICATION_ID 列在展平 account_Segments 后作为索引
所以在 data1.head(1).to_dict() 我得到之后, 这个输出
我删除了双引号并清理了数据,因此下面给出了前两行。请注意,索引列具有 APPLICATION_ID
当我调用您的函数 s = (data2.applymap(type) == list).all()时,此条件为假,因此数据不会变平
我已经使用这些代码来清理数据并最终使用您的代码创建了一个新的 DF,并且我得到以下格式作为输出:
dict1 = data1['account_Segments'].to_dict() dict_str = str(dict1).replace('"','') import ast new_dict = ast.literal_eval(dict_str)
df2 = flatten_nested_json_df(df1) df2 = df2.drop(['level_0'], axis=1) df2
我想让所有 json 用 application_id 作为行索引展平
python - 将深度嵌套的 JSON 展平为 pandas 数据框
我正在尝试将深度嵌套的 JSON 导入熊猫数据框。这是 JSON 文件的结构(这只是第一条记录 (retweets[:1]):
这是我的代码:
这是生成的数据框:
如您所见,该列referenced_tweets
尚未展平(请注意,referenced_tweets
我的 JSON 文件中有两个不同的数组:一个位于另一个“referenced_tweets”内部的更深层次)。例如,更高级别的返回:
而更深层次的返回:
问题:我想知道如何才能使更深的referenced_tweets
. 我想要两个单独的列作为referenced_tweets.type
和referenced_tweets.id
,上面示例中列的值referenced_tweets.type
应该是replied_to
。
python - 如何将嵌套的 JSON 转换为 CSV
我想将嵌套的 json 转换为 csv 格式,包括分组列表/字典的子行。
这是我的json
JSON到CSV转换器的输出
我尝试了 pandas 规范化,但结果与想要的不一样。JSON 数组不会转换为 csv 中的子行。我想在 csv 中保留空字符串。
我想用 Python 脚本做同样的事情。
python - 具有多个键的熊猫数据框到 json
我有一个看起来像这样的熊猫数据框:
ID | x1 | x2 | x3 | 行动 |
---|---|---|---|---|
23432 | 示例1 | 1 | 姓名 | 创造 |
678786 | 示例2 | 1 | 姓名 | 创造 |
如何将该熊猫数据框转换为这种 json 格式?
我玩过 pd.json_normalize 但无法让它工作。我也引用了这个问题,但由于需要 groupby,它有点不同。