31

我对这两个代码块的差异感兴趣。

const $anchor = await page.$('a.buy-now');
const link = await $anchor.getProperty('href');
await $anchor.click();
await page.evaluate(() => {
    const $anchor = document.querySelector('a.buy-now');
    const text = $anchor.href;
    $anchor.click();
});

我通常发现原始 DOM 元素page.evaluate()更容易工作,并且 $ 方法返回的 ElementHandles 是迄今为止的抽象。

但是我觉得异步 Puppeteer 方法可能性能更高或提高可靠性?我在文档中找不到这方面的任何指导,并且有兴趣了解更多关于 pro/con 的关于每种方法的信息以及添加方法(如page.$$().

4

1 回答 1

60

这些代码行之间的主要区别在于 Node.js 和浏览器环境之间的交互。

第一个代码片段将执行以下操作:

  • 在浏览器中运行document.querySelector并返回元素句柄(到 Node.js 环境)
  • 在句柄上运行getProperty并返回结果(到 Node.js 环境)
  • 单击浏览器内的元素

第二个代码片段只是这样做:

  • 在浏览器上下文中运行给定的函数(并将结果返回到 Node.js 环境)

表现

关于这些语句的性能,必须记住 puppeteer 通过 WebSockets 与浏览器进行通信。因此,第二个语句将运行得更快,因为只有一个命令发送到浏览器(相比之下,三个)。

如果您连接的浏览器在不同的机器上运行(连接到 using puppeteer.connect),这可能会产生很大的不同。如果脚本和浏览器位于同一台机器上,它可能只会导致几毫秒的差异。在后一种情况下,它可能不会有很大的不同。

使用元素句柄的优势

使用元素句柄有一些优点。首先,与 using 相比,函数 likeelementHandle.click会表现得更“人性化” document.querySelector('...').click()。例如,puppeteer 将鼠标移动到该位置并单击元素的中心,而不是仅仅执行click函数。

什么时候用什么

一般来说,我建议尽可能使用page.evaluate,因为这个 API 也更容易调试。发生错误时,您可以通过在 Chrome 浏览器中打开 DevTools 并在浏览器中重新运行相同的行来简单地重现错误。如果您将大量page.$语句混合在一起,则可能更难以理解问题是什么以及它是发生在 Node.js 内部还是浏览器运行时。

如果您需要更长时间的元素,请使用元素句柄(因为您可能已经进行了一些复杂的计算或等待外部事件,然后才能从中提取信息)。

于 2019-04-13T11:45:55.803 回答