python 开发之selenium-白红宇

python 开发之selenium

阅读量：5800 次

发布时间：2019-06-18

本文共 427 字，大约阅读时间需要 1 分钟。

使用selenium和PhantomJS来模拟浏览器点击下一页，获取页面数据进行抓取分析

用python写爬虫的时候，主要用的是selenium的Webdriver来获取页面数据

使用webdriver需要安装对应浏览器的driver，并加入到环境变量中

from selenium import webdriver

driver = webdriver.PhantomJS() 使用PhantomJS浏览器创建浏览器对象

driver.get("") 使用get方法加载页面

driver.find_element_by_class_name("shark-pager-next").click() class="shark-pager-next"是下一页按钮，click() 是模拟点击

利用BeatuifulSoup 对页面信息进行提取

模拟点击时需要安装

转载于:https://blog.51cto.com/weadyweady/2307341

你可能感兴趣的文章

OCP读书笔记(24) - 题库(ExamD)

查看>>

Http、TCP/IP协议与Socket之间的区别（转载）

查看>>

解决Unable to load R3 module ...VBoxDD.dll (VBoxDD):GetLastError=1790

查看>>

.net excel利用NPOI导入oracle

查看>>

vrpie在Visio Studio 中无法调试的问题

$_SERVER['SCRIPT_FLENAME']与__FILE__

查看>>

skynet实践（8）-接入websocket

Knockout.Js官网学习（enable绑定、disable绑定）