1

我正在使用 nekohtml 解析器来解析我的 html 代码。有时我在使用锚标签时犯了错误,内容是这样写的。

<a href="http://abc.com"><a href="http://abc.com">abc</a></a>

通过 nekohtml 解析后,我希望内容像这样更正。

<a href="http://abc.com"></a><a href="http://abc.com">abc</a>

为此,请帮助配置 nekohtml 解析。

更新:

在我尝试设置为

parser.setFeature("http://cyberneko.org/html/features/balance-tags", true);

它没有用。我没有像我预期的那样给出结果。它返回与我给出的相同的 html 内容

4

1 回答 1

0

需要设置一个balance-tags特性来指定 NekoHTML 解析器是否应该尝试平衡已解析文档中的标签。

config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );

来自文档:

  • 平衡标签通过添加缺少的父元素、使用可选的结束标签自动关闭元素以及纠正不平衡的内联元素标签来修复许多常见错误。为了将 HTML 文档作为 XML 处理,不应关闭此功能。提供此功能是为了提高应用程序的性能,这些应用程序只关心特定元素、属性和/或内容的外观,而不考虑文档的非良构结构。
于 2011-10-13T06:08:21.900 回答