我想从这个网站提取内容:https ://it.projektwerk.com/de/projects/
例如,我有一个 XPath 表达式:(.//*[@id='content_0']/H3/A
请注意,大写字母是正确的,因为我的文档解析器 -> org.cyberneko.html ...将标签解析为那些大写字母)
这是一个有效的 XPath 表达式;例如,我可以使用 FirePath 获取内容。但是,使用这些javax.xml.xpath
类,检索是不可能的。我这样做是这样的:
XPath xpath = XPathFactory.newInstance().newXPath();
XPathExpression expr = xpath.compile(exprString);
Node node = expr.evaluate(doc, XPathConstants.NODE);
但node
总是null
。
我不明白这一点,因为还有其他网站具有相同语法的其他表达式,在哪里可以工作(例如.//*[@id='p_p_id']/DIV/DIV/DIV/DIV[3]/A/H3/SPAN
)
希望有人可以提供帮助。