我正在尝试使用 Python 中的 Selenium 和 BeautifulSoup 从 Morningstar 自动获取研究项目的数据。我是 Python 的新手,所以我刚刚尝试了 Stackoverflow 和类似论坛的一堆解决方案,但我没有成功。
我要抓取的是网址https://www.morningstar.dk/dk/funds/snapshot/snapshot.aspx?id=F000014CU8&tab=3 在网址中,我专门寻找“Faktorprofil”您可以单击以将数据显示为表格。我可以从 url 中获取标题,但我无法 soup.find 任何其他文本。我尝试过使用多个 id 和类,但没有任何运气。我认为我最成功的代码写在下面。我希望有人能帮帮忙!
from bs4 import BeautifulSoup
import os
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
opts = Options()
opts.add_argument(" --headless")
chrome_driver = os.getcwd() +"/chromedriver"
driver = webdriver.Chrome(options=opts, executable_path=chrome_driver)
driver.get("https://www.morningstar.dk/dk/funds/snapshot/snapshot.aspx?id=F00000ZG2E&tab=3")
soup_file=driver.page_source
soup = BeautifulSoup(soup_file, 'html.parser')
print(soup.title.get_text())
#print(soup.find(class_='').get_text())
#print(soup.find(id='').get_text())
这是我要抓取的数据 [1]:https ://i.stack.imgur.com/wkSMj.png