好吧,你走在正确的轨道上,但只需要改变一些事情。
- 首先,我不知道你在哪里
afterJS
变量从何而来?不管怎样,你都不需要它。
- 您要求将数据输入到
username
and password
输入字段但不询问puppeteer
实际单击登录按钮以完成登录过程。
-
page.evaluate()
用于在页面上下文内(即在远程浏览器中加载的网页上)执行 JavaScript 代码。所以你不需要在这里使用它。
我会将您的代码重构为如下所示:
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://www.instagram.com/accounts/login/');
await page.waitForSelector('input[name="username"]');
await page.type('input[name="username"]', 'username');
await page.type('input[name="password"]', 'password');
await page.click('button[type="submit"]');
// Add a wait for some selector on the home page to load to ensure the next step works correctly
await page.pdf({path: 'page.pdf', format: 'A4'});
await browser.close();
})();
希望这能让您走上正确的道路来通过登录页面!
更新1:
您询问了如何在 Instagram 上解析元素的文本...不幸的是,我自己没有在那里的帐户,因此无法真正为您提供确切的解决方案,但希望这仍然具有一定的价值。
所以你正在尝试评估元素文本,对吧?您可以按如下方式执行此操作:
const text = await page.$eval(cssSelector, (element) => {
return element.textContent;
});
您所要做的就是更换cssSelector
使用您想要从中检索文本的元素的选择器。
更新2:
好的,最后,您询问了有关向下滚动到父元素内的元素的问题。我不会窃取别人的功劳,所以这是答案:
如何滚动到div内的元素? https://stackoverflow.com/questions/635706/how-to-scroll-to-an-element-inside-a-div
您要做的基本上就是按照其中的说明进行操作,并使其与 puppeteer 一起使用,如下所示:
await page.evaluate(() => {
const lastLink = document.querySelectorAll('h3 > a')[2];
const topPos = lastLink.offsetTop;
const parentDiv = document.querySelector('div[class*="eo2As"]');
parentDiv.scrollTop = topPos;
});
请记住,我尚未测试该代码 - 我只是直接按照我提供的 URL 中的答案进行操作。它应该有效!