puppeteer waitForNavigator 不起作用,多窗口的切换

puppeteer waitForNavigator 不起作用,多窗口的切换

月光魔力鸭

2019-06-21 13:33 阅读 708 喜欢 1 puppeteer 多窗口 waitForNavigator

在使用puppeteer 跳转窗口的时候,发现waitForNavigator 并不起作用,最后找到通过browser 获得page 并继续操作。

看官网API 说在click 的时候通常与waitForNavigator 一起用,最后怎么都获取不到页面并拿到截图。

最初想做的很简单,比如说:登录百度,然后输入关键词,然后找到第几个链接,点击打开新页面,等待一会再关闭。

OK,就这么简单,中间夹杂着几个截图看效果,但是按照我之前使用waitForNavigator死活拿不到。

那么像这种新开窗口的怎么处理呢?

干货在此.. 算不上干货..都不敢写大字了

let url = 'http://www.baidu.com';
const chalk = require('chalk');

const puppeteer = require('puppeteer');

async function go(){
    console.log(chalk.green(`创建浏览器`));
    const browser = await puppeteer.launch({
        executablePath : 'C:/Users/Administrator/AppData/Local/Google/Chrome/Application/chrome.exe',
        defaultViewport : {
            width : 1920,
            height : 1080
        }
    });
    const page = await browser.newPage();
    console.log(`跳转页面:${url}`)
    await page.goto(url);

    console.log(`输入关键词`)
    await page.type('[name="wd"]','自动抓站',{delay : 100});
    await page.click('#su');
    await page.waitFor('.result.c-container:nth-child(1)>h3>a');
    console.log(`点击第10个地址`)    

    await page.click('.result.c-container:nth-child(1)>h3>a');
    await page.waitFor(5000);
//此处为重点。
   const pages = await browser.pages();
    const newPage = pages[2];
    let title = await newPage.title();
    if(title.indexOf('集散地') < 0){
        console.log(chalk.red(`error:页面位置有变化。`));
    }
    console.log(`页面:${title}`)
    let delayTime = Math.random() * 40000;
    await newPage.waitFor(delayTime);
    await browser.close();

    let awaitTime = Math.random() * 20000;
    console.log(`time : ${awaitTime}`);
    setTimeout(function(){
        go();
    },awaitTime);
}

go();

前面的跳转啊.. 输入啊 ,官网文档上都有例子,还好说,后面的获取page 我愣是没找到. 这里mark下。

转载请注明出处: https://chrunlee.cn/article/nodejs-puppeteer-pages.html


感谢支持!

赞赏支持
提交评论
评论信息(请文明评论)
暂无评论,快来快来写想法...
推荐
发布自己的nodejs应用后,需要进行管理,目前一般都pm2来进行管理,这里记录下常用的命令。
最近有接触到针对二维码进行识别的功能,然后对图片进行位置纠正、二维码扫描,并将数据进行整理。以下是通过nodejs做的,相对简单一些,没有太过严格,识别率也不是很高大约80%左右
通过nodejs来进行爬取页面的内容,这里简单试试做个小任务..
互联网应用经常需要存储用户上传的图片,比如facebook相册。 facebook目前存储了2600亿张照片,总大小为20PB,每张照片约为80KB。用户每周新增照片数量为10亿。(总大小60TB),平均每秒新增3500张照片(3500次写请求),读操作峰值可以达到每秒百万次
想做微信/支付宝支付很久了..奈何需要的资质太多,只能慢慢申请,等待,审核..终于下来了。
thinkjs框架使用ueditor记录。
开始入手webpack ,直接看的官方文档和demo,对于自动刷新这部分还是希望通过express 加载插件来控制,但是文档没有提供,经过参考github上其他高玩的套路,最终整理了一个基础的配置版本。
通过pm2来实现nodejs应用的集群,不过我之前没做session共享,导致.. 登录不上啊 啊啊啊,无奈,又重新对redis进行了集成。