注意:如果您也遇到此问题,请在 Apache JIRA 上投票:
我得出了一个惊人的结论:
Element e = (Element) document.getElementsByTagName("SomeElementName").item(0);
String result = ((Element) e).getTextContent();
似乎比这快了令人难以置信的 100 倍:
// Accounts for 30%, can be cached
XPathFactory factory = XPathFactory.newInstance();
// Negligible
XPath xpath = factory.newXPath();
// Negligible
XPathExpression expression = xpath.compile("//SomeElementName");
// Accounts for 70%
String result = (String) expression.evaluate(document, XPathConstants.STRING);
我正在使用 JVM 的默认 JAXP 实现:
org.apache.xpath.jaxp.XPathFactoryImpl
org.apache.xpath.jaxp.XPathImpl
我真的很困惑,因为很容易看出 JAXP 如何优化上述 XPath 查询以实际执行一个简单的查询getElementsByTagName()
。但它似乎没有这样做。此问题仅限于大约 5-6 个经常使用的 XPath 调用,这些调用由 API 抽象和隐藏。/a/b/c
这些查询仅针对始终可用的 DOM 文档涉及简单路径(例如,无变量、条件)。因此,如果可以进行优化,那将很容易实现。
我的问题:XPath 的缓慢是一个公认的事实,还是我忽略了什么?有更好(更快)的实现吗?或者我应该完全避免使用 XPath 来进行简单的查询?