问题标签 [nextsibling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 将h4映射到数据框Beautifulsoup python中的div兄弟
我正在抓取网页,但无法将信息映射到数据框。HTML 中没有表格。下面是一个 HTML 示例:
这是我在 python 中使用 requests 和 Beautifulsoup 的代码:
数据框最终看起来像一个事件标题和两个列表:
我希望它以某种方式映射以最终使 h4 类别 1 与 div A 相关。
由于 h4 和 div 是兄弟姐妹而不是 parent-child ,因此可以在我的网络抓取代码中将其分开吗?我有多个具有不同事件标题的页面,并且数据太大而无法手动完成。
除其他外,我还尝试过:
这个结果给了我一个df:
这是检查元素的网络链接: https ://www.ibjjfdb.com/ChampionshipResults/926/PublicResults
任何想法都会有所帮助。谢谢!
python - scrapy 能够检查是否只有下一个兄弟姐妹有预期的标签?
让我发布我想先抓取的部分html
我正在尝试按image_url
顺序抓取图像的 p 和 src 中的文本。问题是,我上面显示的 html 实际上不是静态的,所有页面都有不同的结构,这意味着有时会有更多p
的标签,然后才有center
标签,其中包括img src
由于p
andcenter
标记在每个页面中是随机构造的,因此我正在考虑获取所有p
标记,例如使用response.css('#hello p')
然后循环所有标记p
以获取文本,但是在p
循环时从当前标记获取文本时,还要检查下一个兄弟是否有center
标记,如果这样做,则将其src
附加。
我发现了类似的事情p.xpath('following-sibling::center[1]/img/@src').get()
,因为 p 是迭代过程中的每个段落。
但我认为,这根本不起作用,因为假设我有 4 个p
标签,直到 acenter
我实际上会得到 4 个img src
,因为这p.xpath('following-sibling::center[1]/img/@src').get()
不仅会找到下一个兄弟姐妹,而且会遍历所有兄弟姐妹并查看center
标签是否匹配。
我尝试使用谷歌搜索,但我没有看到任何提及仅检查下一个兄弟姐妹是否是某个标签的内容。任何人都知道我可以让它工作,以便我可以按顺序保存数据吗?
希望我的解释是有道理的。
提前感谢您的任何帮助和建议
python - 查找具有以下兄弟姐妹的 xpath 并包含 Python Selenium 中的文本
我知道使用以下兄弟姐妹的基本知识,但在这里我遇到了一种情况,它看起来有点复杂。
我想找到带有文本Total 6.5的元素,其中标题是Total games。如何使用以下兄弟姐妹并包含文本?
python - 将从 HTML 表中提取的文本分配给变量以供以后使用——Beautiful Soup / Python 3.7
我有以下代码可以完美地在 HTML 表源代码中动态搜索特定文本,并拉取找到特定文本的行的 nextSibling。
当前代码
我遇到的主要问题(这可能非常简单,而且我现在已经盯着这个看了很长时间)是我需要将 nextSibling 分配给 LE 变量。
LE 被格式化为“001234”,我需要去掉前导零以将“1234”作为变量。
如果我打印变量,print(LE.text[2:6])
结果是正确的。实现到代码中,
LE = LE.nextSibling.text[2:6]
不会产生任何东西。
我已经尝试了以下陈述,但没有任何工作,希望得到指导。
我需要在提取后将其分配给一个变量,以便稍后在我的脚本中使用该变量。我提前感谢您的帮助!
编辑->包含源代码:
xml - XML,NextSibling 我做NodeAutoIndent。空(#9)节点问题
我的代码是:
和这样的XML:
在 Watch Parent.XML 中查看的数据看起来:
当我在循环中读取节点时,当 Options: [doNodeAutoIndent] 设置时,我有一些像这样的节点:N = '#$D#$A#9#9' 并且节点数 = 7(而不是 2,在这个例子中)
没有 doNodeAutoIndent,一切正常,节点数 = 2,但我的 XML 文件在一行中:(
问题是:启用 doNodeAutoIndent 时如何绕过空的 NextSibling?
javascript - 当某些输入在父元素内时访问 nextSibling
我有一个 html 表,其中一些<input>
在一些<td>
. 当当前输入的值不同于""
. 但是,这不起作用,因为输入元素不直接相互跟随
感谢帮助!
javascript - 使用没有 ID 的内联 CSS 悬停时的工具提示
将鼠标悬停在 a 标签上时应显示工具提示。然而,这些标准适用:
- 不应使用“a:hover”,head 标签中不应使用 CSS 类,必须使用内联 CSS
- 一定是纯js,没有库
- 它必须在没有预定义 ID 的情况下工作,以便可以通用(模式总是这样:一个标签后跟一个跨度标签,而跨度标签内容是工具提示内容)
- html 格式应该是可能的(至少,像 b、u、ul/ol/li 这样的基本格式)
我可能已经拥有它(使用 onmouseover/onmouseout),但几乎没有。见代码:
- 如何使工具提示始终显示在实际的 a 标签下方(目前,它始终显示在第一个 a 标签下方)?
- a 标签用于 ap 标签中。如何使其工作(整个跨度当前未隐藏)?
python - 我如何在网络上抓取某些没有附加属性的单词?
首先,我想指出我是网络抓取的初学者。我刚刚开始一个从https://coinmarketcap.com刮取数据的项目。目前,我专注于抓取加密货币的名称(即比特币、以太坊、Tether 等)。但是,我能得到的最好的结果是货币的名称,后跟一堆格式,如颜色、字体大小、类等。我该如何编码,以便我可以只存储货币的名称而没有这个额外的信息。这是我当前的代码:
如果图片更有用: 我当前的代码
如您所见,我只有 20 行,但很难弄清楚这一点。我很感激你能给我的任何帮助或建议。
javascript - 为什么我的 if 语句不能正常工作?
我正在创建一个程序,如果不显示错误,则必须检查输入中的值是否满足所有条件。