小言_互联网的博客

全网最全python库selenium自动化使用教程

366人阅读  评论(0)

前言:常码字,不易出精品,更难;如果没有你的关注,那我所做的努力将毫无意义~

希望: 喜欢博主的小伙伴,希望点个关注哦~,更多爬虫项目请收藏该栏目,不定期添加干货

目录

一、安装selenium

二、初始化浏览器

三、设置浏览器大小

四、访问页面

五、定位元素

六、定位元素的另一种写法

七、元素交互

八、执行js

九、Frame操作

十、cookie的操作

十一、选项卡管理

十二、鼠标事件

十三、等待

十四、前进、后退和刷新

十五、关闭浏览器


一、安装selenium

pip install Selenium

二、初始化浏览器

  • Chrome 是初始化谷歌浏览器
  • Firefox 是初始化火狐浏览器
  • Edge 是初始化IE浏览器
  • PhantomJS 是一个无界面浏览器。

  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()

三、设置浏览器大小

  •  maximize_window 最大化窗口
  • set_window_size 自定义窗口大小

  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.maximize_window()

四、访问页面


  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.get( 'https://www.baidu.com')

五、定位元素

  • 定位元素的基本方法如下
定位一个元素 定位多个元素 解释
find_element_by_id find_elements_by_id 通过元素id定位
find_element_by_name find_elements_by_name 通过元素name定位
find_element_by_xpath find_elements_by_xpath 通过xpath表达式定位
find_element_by_link_text find_elements_by_link_tex 通过完整超链接定位
find_element_by_partial_link_text find_elements_by_partial_link_text 通过部分链接定位
find_element_by_tag_name find_elements_by_tag_name 通过标签定位
find_element_by_class_name find_elements_by_class_name 通过类名进行定位
find_elements_by_css_selector find_elements_by_css_selector 通过css选择器进行定位
  • 实例演示:  找到百度首页的输入框

  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.get( 'https://www.baidu.com')
  4. driver.find_element_by_id( 'kw')

六、定位元素的另一种写法

  • 需引入By模块

  
  1. from selenium import webdriver
  2. from selenium.webdriver.common.by import By
  3. driver = webdriver.Chrome()
  4. driver.get( 'https://www.baidu.com')
  5. driver.find_element(By.ID, 'kw')

七、元素交互

方法

解释

click() 点击某个元素
send_keys(输入的值) 模拟输入
clear() 清除操作
submit() 提交表单
get_attribute(name) 获取元素的属性值
location 获取元素的位置
text 获取元素的文本值
size 获取元素的大小
id 获取元素的id值
tag_name 获取元素的标签名
  • 实例演示: 在百度输入框中输入我是autofelix并点击搜索按钮

  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.get( 'https://www.baidu.com')
  4. driver.find_element_by_id( 'kw').send_keys( '我是autofelix')
  5. driver.find_element_by_id( 'su').click()

八、执行js


  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.maximize_window()
  4. driver.get( 'https://www.baidu.com')
  5. js_sql = '''
  6. document.getElementById('kw').value = '我是autofelix'
  7. '''
  8. driver.execute_script(js_sql)

九、Frame操作

  • 网页中frame的话,需要执行切入切出操作

  • switch_to.from(子iframe的id名称) 切入

  • switch_to.parent_frame(父iframe的id名称) 切出


  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.maximize_window()
  4. driver.get( 'https://www.baidu.com')
  5. //这个网址并没有iframe,我臆测有,你们看看就行
  6. driver.switch_to.frame( '我臆测出来的iframe')

十、cookie的操作

方法 说明
delete_all_cookies() 删除当前页面所有cookies
get_cookie(name) 获取指定cookie值
get_cookies() 获取当前页面所有cookies值
add_cookie() 设置cookie值

  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.maximize_window()
  4. driver.get( 'https://www.baidu.com')
  5. driver.delete_all_cookies()
  6. driver.add_cookie({ 'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})

十一、选项卡管理

方法 解释
window_handles 保存所有选项卡的元组
switch_to.window() 切换选项卡

  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.maximize_window()
  4. driver.get( 'https://www.baidu.com')
  5. driver.get( 'https://www.taobao.com')
  6. driver.switch_to.window(driver.window_handles[ 0])
  7. driver.switch_to.window(driver.window_handles[ 1])

十二、鼠标事件

  • 鼠标事件需要引入ActionChains模块
方法 说明
move_to_element(above) 鼠标右击
double_click() 鼠标双击
drag_and_drop() 左键按住拖动
perform() 动作存储
  • 实例演示: 滑动滑块验证码

  
  1. from selenium import webdriver
  2. from selenium.webdriver import ActionChains
  3. from selenium.webdriver.common.by import By
  4. from selenium.webdriver.support.wait import WebDriverWait
  5. from selenium.webdriver.support import expected_conditions as EC
  6. # 初始化谷歌浏览器
  7. driver = webdriver.Chrome()
  8. # 最大化窗口
  9. driver.maximize_window()
  10. # 打开头条登陆网址
  11. driver.get( 'https://sso.toutiao.com')
  12. # 等待某个元素是否出现
  13. WebDriverWait(self.driver, 10).until(
  14. EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'发送')
  15. )
  16. # 实例化鼠标操作
  17. action = ActionChains(self.driver)
  18. # 按住滑块
  19. action.click_and_hold(self.driver.find_element_by_xpath( '//*[@id="captcha_container"]')).perform()
  20. # 将滑块移动x的距离
  21. action.move_by_offset(xoffset=x, yoffset= 0).perform()
  22. # 释放滑块
  23. action.release().perform()

十三、等待

  • 隐氏等待
  • 如果到一定时间,指定的元素还没有出现,进程不会阻塞,但是到指定时间还没有找到,就会抛出异常

  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.implicitly_wait( 10)
  4. driver.get( 'https://www.baidu.com')
  • 显示等待
  • 如果在一定时间内,指定的元素没有出现,进程会阻塞在这里,如果到指定时间还没有找到,就会抛出异常

  
  1. from selenium import webdriver
  2. from selenium.webdriver.common.by import By
  3. from selenium.webdriver.support.ui import WebDriverWait
  4. from selenium.webdriver.support import expected_conditions as EC
  5. driver = webdriver.Chrome()
  6. driver.implicitly_wait( 10)
  7. driver.get( 'https://www.baidu.com')
  8. WebDriverWait(driver, 10).until(
  9. EC.presence_of_element_located((By.ID, 'kw'))
  10. )

十四、前进、后退和刷新

  • back 后退

  • forward 前进

  • refresh 刷新浏览器


  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.get( 'https://www.baidu.com')
  4. driver.get( 'https://www.taobao.com')
  5. driver.get( 'https://www.jd.com')
  6. driver.back()
  7. driver.forward()
  8. driver.refresh()

十五、关闭浏览器

  • close 关闭当前标签页

  • quit 关闭整个浏览器


  
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.get( 'https://www.baidu.com')
  4. //打开百度页面后,关闭整个浏览器
  5. driver.quit()

猜你喜欢:

「python爬虫实战」使用多进程教你下载M3U8加密或非加密视频

「python爬虫实战」手把手教你从分析到实现,王者荣耀壁纸爬虫

「python爬虫实战」超简单爬取抖音无水印视频,程序猿如果想火就是这么简单

「python爬虫实战」python破解识别由canvas绘制成的滑块验证码


转载:https://blog.csdn.net/weixin_41635750/article/details/109266904
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场