puppeteer waitForNavigator 不起作用,多窗口的切换

puppeteer waitForNavigator 不起作用,多窗口的切换

月光魔力鸭

2019-06-21 13:33 阅读 252 喜欢 1 puppeteer 多窗口 waitForNavigator

在使用puppeteer 跳转窗口的时候,发现waitForNavigator 并不起作用,最后找到通过browser 获得page 并继续操作。

看官网API 说在click 的时候通常与waitForNavigator 一起用,最后怎么都获取不到页面并拿到截图。

最初想做的很简单,比如说:登录百度,然后输入关键词,然后找到第几个链接,点击打开新页面,等待一会再关闭。

OK,就这么简单,中间夹杂着几个截图看效果,但是按照我之前使用waitForNavigator死活拿不到。

那么像这种新开窗口的怎么处理呢?

干货在此.. 算不上干货..都不敢写大字了

let url = 'http://www.baidu.com';
const chalk = require('chalk');

const puppeteer = require('puppeteer');

async function go(){
    console.log(chalk.green(`创建浏览器`));
    const browser = await puppeteer.launch({
        executablePath : 'C:/Users/Administrator/AppData/Local/Google/Chrome/Application/chrome.exe',
        defaultViewport : {
            width : 1920,
            height : 1080
        }
    });
    const page = await browser.newPage();
    console.log(`跳转页面:${url}`)
    await page.goto(url);

    console.log(`输入关键词`)
    await page.type('[name="wd"]','自动抓站',{delay : 100});
    await page.click('#su');
    await page.waitFor('.result.c-container:nth-child(1)>h3>a');
    console.log(`点击第10个地址`)    

    await page.click('.result.c-container:nth-child(1)>h3>a');
    await page.waitFor(5000);
//此处为重点。
   const pages = await browser.pages();
    const newPage = pages[2];
    let title = await newPage.title();
    if(title.indexOf('集散地') < 0){
        console.log(chalk.red(`error:页面位置有变化。`));
    }
    console.log(`页面:${title}`)
    let delayTime = Math.random() * 40000;
    await newPage.waitFor(delayTime);
    await browser.close();

    let awaitTime = Math.random() * 20000;
    console.log(`time : ${awaitTime}`);
    setTimeout(function(){
        go();
    },awaitTime);
}

go();

前面的跳转啊.. 输入啊 ,官网文档上都有例子,还好说,后面的获取page 我愣是没找到. 这里mark下。

转载请注明出处: https://chrunlee.cn/article/nodejs-puppeteer-pages.html


如果对你有用的话,请赏给作者一个馒头吧 ...或帮点下页面底部的广告,感谢!!

赞赏支持
提交评论
评论信息(请文明评论)
暂无评论,快来快来写想法...
推荐
经常会遇到需要系统重启后自动执行的一些任务,在windows 上可以将对应的程序打包成service 然后自启动即可
也不知道咋回事 ... 哈哈,忽然想研究下磁力网站,其实并不是很想懂里面的原理,只是搞不明白他们的资源是从哪里来的..很是纳闷?
前几天给朋友帮忙,想要一个一模一样的网站...自告奋勇去帮忙.. 结果发现之前一直没处理过类似的情况,虽然也写过爬虫,不过看了下网站,也不算麻烦。于是简单实现了这个自动抓站的功能,最终整理成为一个自动抓站的工具,能省很多的事情。
客户有一批音频需要处理成视频,最好是带有图片,于是就有了下文。
从上面那篇文章过来的,这里分享下nodejs对文件夹以及子文件进行批量删除的实现。
发布自己的nodejs应用后,需要进行管理,目前一般都pm2来进行管理,这里记录下常用的命令。
由于国家的行政区划每年都有变化,所以经常需要更新最新的数据,这里提供一个nodejs版本mysql数据存储的抓取示例。
当我们做爬虫或其他的一些应用的时候,如果需要一些短信验证,但是又没有那么多手机号,又不能放人在那里一直输入的时候?怎么办?