首页 > selenium的基础知识点

selenium的基础知识点

from selenium import webdriver
from scrapy.selector import Selector#模拟登陆
browser = webdriver.Chrome(executable_path='Chromedriver.exe')
#路径是Chromedriver.exe的存放位置,windows下只要配置好这个环境就不需要了

browser.get('http://w') #需要登陆的那个网址

browser.find_element_by_xpath('//div[@view]/imput').send_keys('..........')
#需要输入的表单如帐号
browser.find_element_by_xpath('//div[@view]/imput').send_keys('..........')
#需要输入的表单如密码
browser.find_element_by_id('captcha').send_keys(input("有验证码输入验证码"))browser.find_element_by_xpath('//div[登陆的那个按钮]').click()#点击登陆
browser.quit()#退出浏览器

基本的点击与发送

#可以用selenium得到js加载后的html,比如抓取js加载的内容

browser = webdriver.Chrome(executable_path='')
browser.get('http://...')
print(browser.page_source)#js加载完成的源码'''
如果需要选择器快一点就使用scrapy中的Selector
'''
Seit = Selector(text=browser.page_source)
print(Seit.xpath('//*[@...]/text').extract())
#注意js加载本身就慢,在scrapy的异步当中,爬取的内容很快,导致有些js没有加载完成
#这样的话,只需要睡几秒就行

动态加载的数据获取

import timefrom selenium import webdriver
from scrapy.selector import Selectorbrowser = webdriver.Chrome(executable_path='..')
browser.get('http://.....')Seit = Selector(text=browser.page_source)
Seit.xpath('//div[@class=""]/text()').extract().send_keys("00000000")
Seit.xpath('//div[@class=""]/text()').extract().send_keys('************')
Seit.xpath('//div[@class=""]/text()').extract().click()#下拉
for i in range(3):'''三次下拉操作  execute_script是用来执行js代码'''browser.execute_script("window.scrollTo(0,document.body.scrollHeight) var lenOfPage=docment.body.scrollHeight;return lenOfPage")time.sleep(3)
# phantomjs无头浏览器:http://phantomjs.org/download.html

 

import time



from selenium import webdriver

from scrapy.selector import Selector



browser = webdriver.Chrome(executable_path='..')

browser.get('http://.....')



Seit = Selector(text=browser.page_source)

Seit.xpath('//div[@class=""]/text()').extract().send_keys("00000000")

Seit.xpath('//div[@class=""]/text()').extract().send_keys('************')

Seit.xpath('//div[@class=""]/text()').extract().click()



#下拉

for i in range(3):

'''三次下拉操作 execute_script是用来执行js代码'''

browser.execute_script("window.scrollTo(0,document.body.scrollHeight) var lenOfPage=docment.body.scrollHeight;return lenOfPage")

time.sleep(3)

# phantomjs无头浏览器:http://phantomjs.org/download.html

转载于:https://www.cnblogs.com/ArtisticMonk/p/9741173.html

更多相关:

  • Sublime text 3不支持中文输入法,下面是我结合网上的各种资料摸索实践了一遍,为Sublime text 3成功添加了搜狗拼音输入法,特此记录以备参考。 前提条件: 事先安装并配置好搜狗拼音法和Sublime text 3编辑器,参考本博客相关文章。 1.安装相关依赖库 sudo apt-get install bui...

  • 当下人工智能是真心的火热呀,各种原来传统的业务也都在尝试用人工智能技术来处理,以此来节省人工成本,提高生产效率。既然有这么火的利器,那么我们就先来简单认识下什么是人工智能吧,人工智能是指利用语音识别、语义理解、图像识别、视觉处理、机器学习、大数据分析等技术实现机器智能自动化做出响应的一种模拟人行为的手段。而我们这里介绍的Magpie则...

  • 需求:单表关联问题。从文件中孩子和父母的关系挖掘出孙子和爷奶关系 样板:child-parent.txt           xiaoming daxiong          daxiong alice          daxiong jack 输出:xiaoming alice         xiaoming jack 分析设...

  •  hadoop 的核心还是 Map-Reduce过程和 hadoop分布式文件系统   第一步:定义Map过程 /**  *  * Description:  *  * @author charles.wang  * @created Mar 12, 2012 1:41:57 PM  *   */ public class MyMa...

  •