博客
关于我
puppeteer(headless chrome)实现网站登录
阅读量:430 次
发布时间:2019-03-06

本文共 2033 字,大约阅读时间需要 6 分钟。

puppeteer简介

puppeteer是Chrome团队开发的一个node库,可以通过api来控制浏览器的行为,比如点击,跳转,刷新,在控制台执行js脚本等等。有了这个神器,写个爬虫,自动签到,网页截图,生成pdf,自动化测试什么的,都不在话下。

puppeteer的简单例子

代码来自官网:

const puppeteer = require('puppeteer'); (async () => {  const browser = await puppeteer.launch();//打开浏览器  const page = await browser.newPage();//打开一个空白页  await page.goto('https://example.com');//在地址栏输入网址并等待加载  await page.screenshot({path: 'example.png'});//截个图   await browser.close();//关掉浏览器})();

阅读上述代码,我们可以发现,1,代码中每一步都是异步操作,2,每一步操作都对应实际使用浏览器的一个行为。理解这两点对使用这个库有很大帮助。另外,比较常用的两个对象就是browser和page对象,对象上有一堆用来操作两个对象的方法。接下来,我们就写一个登录网站的小demo。

没有验证码的网站

对于没有验证码的网站,基本上就是输入账号,输入密码,点击登录这三步,需要用到page对象的两个方法:type用来在输入框中输入信息,click用来点击登录。下面以登录豆瓣为例来举个例子:

const puppeteer = require('puppeteer');const account = `123456@qq.com`;const password = `123456`;(async () => {  const browser = await puppeteer.launch();//打开浏览器  const page = await browser.newPage();//打开一个空白页  await page.goto('https://www.douban.com/');//打开豆瓣网站  await page.type('#form_email', account);      await page.type('#form_password', password);  await page.click('.bn-submit');  await page.waitForNavigation({    waitUntil: 'load'  });//等待页面加载出来,等同于window.onload  await page.screenshot({path: 'example.png'});//截个图  await browser.close();//关掉浏览器})();

有人说,我怎么知道到底有没有登录成功呢,一种调试的办法就是使用screenshot,如果你看到的是一个验证码页面,说明没有登录成功,还有一种办法像下面这样:

const browser = await puppeteer.launch({headless: false});//打开有界面的浏览器

传入headless:false后会真的打开一个浏览器的界面,这样你就可以实时看到代码执行到什么地方了。接下来我们说说碰到验证码时怎么办。

有验证码的网站

碰到有验证码的网站,可以将headless设成false,借助界面输入验证码,同时监听页面加载事件,实现登录,代码如下:

...  await page.waitForNavigation({    waitUntil: 'load'  });//等待页面加载出来,等同于window.onload//代码中监听跳转事件if(page.url() === 'https://www.douban.com/accounts/login'){       //登录不成功    console.log('需要输入验证码');    //等待再一次跳转    while(true){        await page.waitForNavigation({            waitUntil: 'load'        })        console.log(page.url())        if(page.url() === 'https://www.douban.com/'){            console.log('登录成功');            break;        }    }  }

整体思路就是写也个循环,不断监听页面跳转,直到浏览器登录成功后跳转到首页为止。

转载地址:http://ioguz.baihongyu.com/

你可能感兴趣的文章
MyPython
查看>>
MTD技术介绍
查看>>
MySQL
查看>>
MySQL
查看>>
mysql
查看>>
MTK Android 如何获取系统权限
查看>>
MySQL - 4种基本索引、聚簇索引和非聚索引、索引失效情况、SQL 优化
查看>>
MySQL - ERROR 1406
查看>>
mysql - 视图
查看>>
MySQL - 解读MySQL事务与锁机制
查看>>
MTTR、MTBF、MTTF的大白话理解
查看>>
mt_rand
查看>>
mysql -存储过程
查看>>
mysql /*! 50100 ... */ 条件编译
查看>>
mudbox卸载/完美解决安装失败/如何彻底卸载清除干净mudbox各种残留注册表和文件的方法...
查看>>
mysql 1264_关于mysql 出现 1264 Out of range value for column 错误的解决办法
查看>>
mysql 1593_Linux高可用(HA)之MySQL主从复制中出现1593错误码的低级错误
查看>>
mysql 5.6 修改端口_mysql5.6.24怎么修改端口号
查看>>
MySQL 8.0 恢复孤立文件每表ibd文件
查看>>
MySQL 8.0开始Group by不再排序
查看>>