希望提高我的数据科学技能。我正在练习从体育网站提取 url 数据,并且 json 文件有多个嵌套字典。我希望能够提取这些数据以在 matplotlib 等中映射我自己的自定义排行榜形式,但是很难将 json 转换为可行的 df。
主网站是:https ://www.usopen.com/scoring.html
看看背景,我相信实时信息是从下面的短代码中列出的链接中提取的。我正在使用 Jupyter 笔记本。我可以成功拉取数据。
但正如您所看到的,它正在拉取多个嵌套字典,这使得拉取简单的数据框变得非常困难。
只是在寻找球员,得分达到标准杆,总杆数和拉杆数。任何帮助将不胜感激,谢谢!
import pandas as pd
import urllib as ul
import json
url = "https://gripapi-static-pd.usopen.com/gripapi/leaderboard.json"
response = ul.request.urlopen(url)
data = json.loads(response.read())
print(data)