puppeteer waitForNavigator 不起作用,多窗口的切换

puppeteer waitForNavigator 不起作用,多窗口的切换

月光魔力鸭

2019-06-21 13:33 阅读 3102 喜欢 1 puppeteer 多窗口 waitForNavigator

在使用puppeteer 跳转窗口的时候,发现waitForNavigator 并不起作用,最后找到通过browser 获得page 并继续操作。

看官网API 说在click 的时候通常与waitForNavigator 一起用,最后怎么都获取不到页面并拿到截图。

最初想做的很简单,比如说:登录百度,然后输入关键词,然后找到第几个链接,点击打开新页面,等待一会再关闭。

OK,就这么简单,中间夹杂着几个截图看效果,但是按照我之前使用waitForNavigator死活拿不到。

那么像这种新开窗口的怎么处理呢?

干货在此.. 算不上干货..都不敢写大字了

let url = 'http://www.baidu.com';
const chalk = require('chalk');

const puppeteer = require('puppeteer');

async function go(){
    console.log(chalk.green(`创建浏览器`));
    const browser = await puppeteer.launch({
        executablePath : 'C:/Users/Administrator/AppData/Local/Google/Chrome/Application/chrome.exe',
        defaultViewport : {
            width : 1920,
            height : 1080
        }
    });
    const page = await browser.newPage();
    console.log(`跳转页面:${url}`)
    await page.goto(url);

    console.log(`输入关键词`)
    await page.type('[name="wd"]','自动抓站',{delay : 100});
    await page.click('#su');
    await page.waitFor('.result.c-container:nth-child(1)>h3>a');
    console.log(`点击第10个地址`)    
    
    await page.click('.result.c-container:nth-child(1)>h3>a');
    await page.waitFor(5000);
//此处为重点。
   const pages = await browser.pages();
    const newPage = pages[2];
    let title = await newPage.title();
    if(title.indexOf('集散地') < 0){
        console.log(chalk.red(`error:页面位置有变化。`));
    }
    console.log(`页面:${title}`)
    let delayTime = Math.random() * 40000;
    await newPage.waitFor(delayTime);
    await browser.close();

    let awaitTime = Math.random() * 20000;
    console.log(`time : ${awaitTime}`);
    setTimeout(function(){
        go();
    },awaitTime);
}

go();

前面的跳转啊.. 输入啊 ,官网文档上都有例子,还好说,后面的获取page 我愣是没找到. 这里mark下。

转载请注明出处: https://chrunlee.cn/article/nodejs-puppeteer-pages.html


感谢支持!

赞赏支持
提交评论
评论信息 (请文明评论)
暂无评论,快来快来写想法...
推荐
跑了一个千库网的自动签到,在windows上测试的时候好好的,图片也没问题,可是放到linux服务器就不行了,总是登录不上不说,图片都不一样
也不知道咋回事 ... 哈哈,忽然想研究下磁力网站,其实并不是很想懂里面的原理,只是搞不明白他们的资源是从哪里来的..很是纳闷?
学习爬虫的时候突然有想到想做一个音乐播放小站,可以给自己或朋友听,但是音乐哪里来呢??想到自己常听的豆瓣FM,就越发的想把这些音乐都拿下来,因此有了下文通过豆瓣FM批量抓取上万首音乐,目前已经3W+。
因为自己的记录笔记的应用是有道云,又想着把有道云跟自己的小网站联通起来,所以查找了有道云的,然后实现了nodejs版本的sdk.
前段时间帮朋友下歌放在车上听..结果好多都是ncm格式,伤心 ,搜索了下发现基本上这格式解密有好多昂,可惜UI我都不太想要..决定抄一下,自己做一个。 这里先记录下核心代码,回头补充个UI 做个小程序。
在通过axios读取页面的时候,经常会碰到gbk的编码,如果不进行转化的话,在获取信息或读取上都会很麻烦。
在使用marked来做md解析的时候,部分解析规则可能并不是很如意,比如说,我在md中写了a标签,但是这些标签都是在当前页面替换的,而我想要的是新打开窗口。
记录下通过nodejs调用imagemagick 的时候发现的一个错误,command failed -- crop .