0

我只想要一个来自当前 DOM 的简单的一页 HTML 转储,其中包含 html 标记及其之间的所有内容。

我尝试过使用 SavePageType 变体,但它们都没有满足我的需要。

当我使用 SavePageType.COMPLETE_HTML 时,它会弄乱 html 并更改所有资源链接并下载我不想要的资源。

我不能使用 SavePageType.MHTML 选项。

当我使用 SavePageType.ONLY_HTML 时,它可以完美保存,但不会保存对 DOM 所做的更改,这很奇怪。

我也尝试获取 html 元素,但 GetElementByTagName 找不到它。html、head 和 body 标签也丢失了,尽管它提供了这些标签中的内容,这真的很奇怪。

有没有办法使用 DotNetBrowser 捕获修改后的 html(没有问题)?

4

1 回答 1

1

这里是尤金。我与创建 DotNetBrowser 的团队一起工作。

如果我理解正确,您需要保存已加载网页的修改后的 HTML 内容。

在这种情况下,您可以使用该方法获取当前的HTML Browser.GetHTML(),然后使用该方法将其保存到文件中File.WriteAllText()。以下源代码演示了如何执行此操作:

string html = browser.GetHTML();
File.WriteAllText("path/to/file.html", html);
于 2018-01-02T10:31:36.660 回答