selenium的使用

2023-11-19

selenium的使用

0.使用selenium

import time
from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By

1.创建一个浏览器对象(双击打开谷歌浏览器)

b = Chrome()

2.输入需要控制的网站的地址

b.get('https://www.baidu.com')

3.获取标签

1)浏览器对象.find_element(查找方式, 值) - 按照指定方式获取第一个满足条件的标签，返回一个标签对象

2)浏览器对象.find_elements(查找方式, 值) -按照指定方式获取所有满足条件的标签，返回一个列表，列表中的元素是标签

查找方式：

1)By.ID - 通过id属性值获取标签

2)By.CLASS_NAME - 通过class属性值获取标签

3)By.CSS_SELECTOR - 通过css选择器获取标签

search_box = b.find_element(By.ID, 'kw')
search_btn = b.find_elements(By.CSS_SELECTOR, '#su')
chenge_btn = b.find_element(By.ID, 'hotsearch-refresh-btn')

4.操作标签

# 1)输入框输入内容:输入框标签对象.send_keys(内容)
# search_box.send_keys('简笔画\n')

# 2)点击标签:标签对象.click()
time.sleep(1)
chenge_btn.click()

练习：打开京东-搜索巧克力

b = Chrome()
b.get('https://www.jd.com')

search_box = b.find_element(By.ID, 'key')
search_box.send_keys('巧克力\n')

5.页面滚动

js滚动页面的代码：window.scrollBy(x方向偏移量, y方向偏移量)

time.sleep(1)
for _ in range(10):
    for _ in range(10):
        b.execute_script('window.scrollBy(0, 500)')
        time.sleep(1)
    next_btn = b.find_element(By.CLASS_NAME, 'pn-next')
    next_btn.click()

# 点击下一页
next_btn = b.find_element(By.CLASS_NAME, 'pn-next')
next_btn.click()

print('滚动结束')
input()

1.打开和关闭浏览器

from selenium.webdriver import Chrome, Firefox, Safari, Ie
import time

1.创建浏览器对象(自动打开一个空的页面)

b = Chrome()
time.sleep(2)

2.打开指定页面

# 1)可以打开网页
b.get('https://www.baidu.com')
# 对浏览器内容截图
b.get_screenshot_as_file('files/baidu.png')
time.sleep(2)

# 2)打开本地的html文件
url = 'file:///D:/%E5%8D%83%E9%94%8B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90-2022%E5%B9%B4/02%E5%89%8D%E7%AB%AF%E5%BC%80%E5%8F%91/day4-%E4%BA%AC%E4%B8%9C%E7%99%BB%E5%BD%95%E9%A1%B5%E9%9D%A2/01%E4%BA%AC%E4%B8%9C%E7%99%BB%E5%BD%95%E9%A1%B5%E9%9D%A2.html'
b.get(url)
# 对浏览器内容截图
b.get_screenshot_as_file('files/jd.png')
time.sleep(2)

3.关闭当前页面

b.close()

2.控制浏览器大小

from selenium.webdriver import Chrome
import time

b = Chrome()

1.设置浏览器全屏显示

b.maximize_window()
b.get('https://www.baidu.com')
time.sleep(2)

2.设置窗口大小：500×500

b.set_window_size(500, 500)
time.sleep(2)

# 同时设置窗口的位置和大小
# set_window_rect(x, y, width, height)
b.set_window_rect(500, 300, 600, 300)
time.sleep(2)

b.close()
input()

3.刷新前进后退

from selenium.webdriver import Chrome
import time

b = Chrome()

# 第一次：打开百度页面
b.get('https://www.baidu.com')

time.sleep(2)
# 1.刷新页面
b.refresh()
time.sleep(2)

# 第二次：淘宝页面
b.get('https://www.taobao.com')
time.sleep(2)

# 第三次：京东页面
b.get('https://www.jd.com')
time.sleep(2)

# 2.后退
# 第一次后退到淘宝
b.back()
time.sleep(2)

# 第两次后退到百度
b.back()
time.sleep(2)

# 3.前进
# 前进到淘宝
b.forward()
time.sleep(2)

b.close()
input()

4.获取页面基本属性

from selenium.webdriver import Chrome
import time

b = Chrome()
b.get('https://movie.douban.com/top250')
time.sleep(2)

1.获取网页标标题

print(b.title)

2.获取当前网页地址

print(b.current_url)

3.获取浏览器名称

print(b.name)

4.获取当前页面的网页源代码(爬虫的时候使用)

print(b.page_source)

b.close()

5.定位标签

1.定位标签（获取标签）

浏览器对象.find_element(定位方式, 值) - 获取某一个标签，返回一个标签对象

浏览器对象.find_elements(定位方式, 值) - 获取多个标签，返回一个列表，列表中的元素是标签

1）定位方式

By.ID  - 根据标签的id属性的值获取标签
By.NAME  - 根据标签的name属性的值获取标签
By.CLASS_NAME  - 根据标签的class属性的值获取标签
By.TAG_NAME  - 根据标签名获取标签
By.LINK_TEXT  - 获取标签内容为指定值的a标签
By.PARTIAL_LINK_TEXT  - 获取标签内容包含指定值的a标签
By.CSS_SELECTOR  - 获取指定class选择器选中的标签

# a.获取第一个id属性值为'inp-query'的标签
result = b.find_element(By.ID, 'inp-query')
print(result)


# test:
result = b.find_element(By.ID, 'suggResult')
print(result)


# b.获取第一个name属性值为'search_text'的标签
result = b.find_element(By.NAME, 'search_text')
print(result)

# c.获取所有class属性值为'playable'的标签
result = b.find_elements(By.CLASS_NAME, 'playable')
print(result)
# 遍历拿到每一个class属性值为'playable'的标签，并且获取标签内容
for x in result:
    print(x.text)

# d.获取所有的p标签
result = b.find_elements(By.TAG_NAME, 'p')
for x in result:
    print(x.text)


# e.获取标签为'选电影'的内容
result = b.find_element(By.LINK_TEXT, '选电影')
print(result)
result.click()
# 练习：
result = b.find_element(By.LINK_TEXT, '排行榜')
print(result)


# f.获取标签内容中包含'影'的a标签
result = b.find_elements(By.PARTIAL_LINK_TEXT, '影')
for x in result:
    print(x.text)

result = b.find_elements(By.CSS_SELECTOR, 'ol.grid_view>li>div>.info>.hd>a>span:nth-child(1)')
for x in result:
    print(x.text)

input()

6.获取标签信息

from selenium.webdriver import Chrome
import time
from selenium.webdriver.common.by import By

b = Chrome()
b.get('https://www.baidu.com')
time.sleep(2)

# 获取标签
news = b.find_element(By.LINK_TEXT, '新闻')

# 1.获取标签内容
print(news.text)

# 2.获取标签指定属性的值
# 获取标签href的属性值
print(news.get_attribute('href'))
print(news.get_attribute('id'))

# 3.获取id(id不是id属性值，而是标签在网页中的编号）
print(news.id)

# 4.获取标签的位置（相对父标签）
print(news.location)

# 5.获取标签的大小
print(news.size)

# 6.获取标签名
print(news.tag_name)

7.键盘相关的交互操作

from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time
b = Chrome()
b.get('https://www.baidu.com')
time.sleep(2)

search_box = b.find_element(By.ID, 'kw')

# 1.输入框输入内容
search_box.send_keys('新冠')
time.sleep(2)

# 2.清空输入框
search_box.clear()
time.sleep(2)

# 3.回车确认
search_box.submit()
time.sleep(2)

search_box = b.find_element(By.ID, 'kw')
search_box.send_keys('疫情最新消息')
time.sleep(2)
# 4.模拟删除键
search_box.send_keys(Keys.BACK_SPACE)
time.sleep(2)

# ctrl+a -> ctrl+c ->清空 ->ctrl+v
# 5.模拟全选(ctrl+A)
search_box.send_keys(Keys.CONTROL, 'a')
time.sleep(2)

search_box.send_keys(Keys.CONTROL, 'c')
time.sleep(2)

search_box.send_keys(Keys.BACK_SPACE)
time.sleep(2)

search_box.send_keys(Keys.CONTROL, 'v')
time.sleep(2)

input()

8.鼠标相关的交互操作

from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
import time

b = Chrome()
b.get('https://www.baidu.com')
time.sleep(2)

1.左键:click()

logo = b.find_element(By.ID, 'lg')
logo.click()
time.sleep(2)

# 注意：除了按左键，其他的鼠标交互动作属于复杂的动作，需要动作链来完成
from selenium.webdriver.common.action_chains import ActionChains

2.右键:context_click()

ActionChains(b).context_click(logo).perform()
time.sleep(2)

3.双击:double_click()

div = b.find_element(By.CLASS_NAME, 'accessibility-icon')
ActionChains(b).double_click(div).perform()
time.sleep(3)

4.悬停

span = b.find_element(By.ID, 's-usersetting-top')
ActionChains(b).move_to_element(span).perform()
time.sleep(5)

5.拖拽

b.get('https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable')
time.sleep(2)

# 注意：如果在网页源代码中有iframe标签，并且需要操作的内容在这个iframe里面，那么操作之前需要切换窗口
new_window = b.find_element(By.ID,'iframeResult')
b.switch_to.frame(new_window)
goal_div = b.find_element(By.ID, 'droppable')
drag_div = b.find_element(By.ID, 'draggable')
ActionChains(b).drag_and_drop(drag_div, goal_div).perform()
time.sleep(3)

input()

9.选项卡切换

from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
import time

b = Chrome()

# 打开百度(b指向百度页面)
b.get('https://ww.baidu.com')
time.sleep(1)

# 点击新闻对应的a标签，在新的选项卡中打开新的页面(b还是指向百度首页)
news = b.find_element(By.LINK_TEXT, '新闻')
news.click()
# 1.选项卡切换
# 1)获取当前浏览器所有选项卡
all_handle = b.window_handles
print(all_handle)

# 2)切换选项卡
# 切换到新闻页面
b.switch_to.window(all_handle[1])
time.sleep(2)

# 获取新闻页面中的新闻图标
logo = b.find_element(By.CSS_SELECTOR, 'div.logo')
# print(logo)
logo.click()
time.sleep(1)

# 关闭新闻页面
b.close()

# 回到首页
b.switch_to.window(all_handle[0])
time.sleep(1)

search = b.find_element(By.ID, 'kw')
search.send_keys('你好\n')

10.拖拽的操作

from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
from selenium.webdriver.common.action_chains import ActionChains
import time

b = Chrome()
b.get('http://www.jm8008.com/SignIn.jsp')
time.sleep(2)

btn = b.find_element(By.CLASS_NAME, 'geetest_radar_tip_content')
btn.click()
time.sleep(5)

# 获取需要拖拽的目标标签
source = b.find_element(By.CLASS_NAME,'geetest_slider_button')

action = ActionChains(b)
# 将指定的标签在x轴方向拖拽150像素
action.drag_and_drop_by_offset(source, 180, 0)
action.perform()

input()

11.中国知网数据分析关键字提取

from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
import time

b = Chrome()
b.get('https://www.cnki.net/')
time.sleep(1)
# 搜索数据分析
search = b.find_element(By.ID,'txt_SearchText')
search.send_keys('数据分析\n')
time.sleep(1)

# 所有搜索结果对应论文名称标签
all_name = b.find_elements(By.CSS_SELECTOR, 'td.name>a')
print(all_name)
# 按顺序一个一个点击论文名字
for x in all_name:
    x.click()
    time.sleep(1)
    # 切换到详情页对应的选项卡
    all_handles = b.window_handles
    b.switch_to.window(all_handles[-1])
    time.sleep(1)
    # 获取关键词
    try:
        p = b.find_element(By.CLASS_NAME, 'keywords')
        print(p.text)
    except:
        print('没有关键词！')
    # 关闭当前详情页
    b.close()
    # 切换到首页
    b.switch_to.window(all_handles[0])

input()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

selenium

python

Chrome

selenium的使用的相关文章

嵌套字典中的 Django 模板

我正在使用 Django 模板并且遇到了嵌套字典的一个问题 Dict result dict type 0 file name abc count 0 type 1 file name xyz count 50 我的 HTML 文件中的模
将 transaction.commit_manually() 升级到 Django > 1.6

我继承了为 Django 1 4 编写的应用程序的一些代码我们需要更新代码库以使用 Django 1 7 并最终更新到 1 8 作为下一个长期支持版本在一些地方它使用旧风格 transaction commit manually and
Selenium 与 HtmlUnit？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我试图更好地理解测试框架并一直在研究 Selenium 我用过HTMLUnit http htmlun
使用 Python 创建 MIDI

本质上我正在尝试从头开始创建 MIDI 并将它们放到网上我对不同的语言持开放态度但更喜欢使用Python 两种语言之一如果这有什么区别的话并且想知道我应该使用哪个库提前致谢看起来这就是您正在寻找的适用于 Python 的简单
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
无法摆脱脚本中的硬编码延迟

我用 vba 结合 selenium 编写了一个脚本来解析网页中可用的所有公司名称该网页启用了延迟加载方法因此每个滚动中只有 20 个链接可见如果我滚动 2 次则可见链接数为 40 个依此类推该网页中有 1000 个可用链接我
如何从下面的html中提取数据？

我想要从中提取数据的 Html 是 div class infoMessageInner p span class ng binding Fiber r best lld till adressen Tj nsterna kan du be
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du

随机推荐

安装用jieba，实现用TF-IDF算法进行关键词的提取

文本知识提取目录 1 安装jieba 2 TF IDF算法 2 1算法的定义 2 2算法的应用 1 词性标注 2 去停用词 3 关键词提取 1 安装jieba Jieba分词官网 https github com fxsjy jieba
基于k8s的微服务一键部署解决方案

父项目msagd配置编写pom xml的属性标签
Day8_8 Java学习之List集合类

目录一 List集合的概述 ArrayList集合类的概述 ArrayList集合的语法定义 ArrayList集合的常用方法 LinkedList集合概述 LinkedList集合的语法定义 LinkedList集合类常用方法二 Se
Unity项目资源加载管理简易框架(Resource)

文章目录一背景二思路概述三具体实现代码及其思路梳理 1 资源路径 2 资源管理 3 资源加载 4 资源管理四说明一背景在Unity的轻量型项目中如果对优化没有特别搞得要求如果需要用到Resource Load这个接口
算高差改正数的计算机程序,水准测量中测量高差的改正数怎么计算？

原标题水准测量中测量高差的改正数怎么计算工程测量中高速铁路城市轨道涉及到二等水准一般铁路涉及三四等水准高速公路房建市政一般采用四等水准沉降观测各等级均涉及在水准测量中高差的改正三四等水准需要进行水准标尺长度改正正常水
基于51单片机简易电子琴设计（含Keil程序和Proteus文件）

一系统概述系统使用的模块有AT89C51单片机 8位共阳数码管矩阵键盘小灯按键蜂鸣器本次设计的电子琴系统以AT89C51单片机为控制核心使用数码管显示音符右侧的矩阵键盘可以理解为琴键按下不同的按键就能显示不同的音符按下
最新服务器CPUe5,看这里！2019 至强 Xeon E5 服务器系列 CPU 天梯图分享

排名名称评分 1Intel Xeon E5 2679 v4 2 50GHz25 236 2Intel Xeon E5 2699 v4 2 20GHz23 200 3Intel Xeon E5 2696 v3 2 30GHz22 548 4I
LNCS用户写作指南【 Springer Computer Science Proceedings 】

转自 http blog csdn net wyskys article details 18075471 重点是文末的参考文献格式主要的是链接期刊论文会议论文的引用格式下載地址 http static springer com
Jsoup 抓取网页内容demo

1 代码 public Document getDocument String url try return Jsoup connect url get catch IOException e e printStackTrace retur
为什么电脑的时间总是快2分钟

由于工作需要今天领到一台新的笔记本轻轻地抚摸新伙伴的同时发现笔记本的时间快了2分钟 o o表情明明已经联网了为啥还是快两分钟呢于是我就一顿操作猛如虎结果一看服务器连接的是 time windows com 这可不行我
【Linux】Ubuntu系统下用apt命令删除/卸载软件包

大家都知道在ubuntu中安装一个新的软件包时直接使用sudo apt get install命令就好那么如果要卸载或者删除一个软件包呢 1 删除为了满足依赖而安装的但现在不再需要的软件包包括已安装包保留配置文件这个命令容易
C/C++编程题开头字符串、数据输入几种写法

1 题设在IT公司编程题中多数会让你一并写上测试数据输入和结果输出的Demo 这也是程序员基本的功底想一想如果连自己的测试数据都无法给入后面的算法写的再好也无法测试它的准确性和效果下面分别从c c 以及字符串输入和数组输入来谈
Python 多线程、线程池、进程池

线程间的通讯机制消息队列 event 事件对象当线程创建完成之后并不会马上执行线程而是等待某一事件发生线程才会启动 import threading 创建 event 对象 event threading Event 重置代码中的
BeyondCompare破解版的下载安装

目前Beyond Compare的版本已经支持到4 2的release版本官网 https www scootersoftware com download php 支持 windows mac linux版本这里我们选择的mac版本
android设置白天模式和夜间模式

if isDay AppCompatDelegate setDefaultNightMode AppCompatDelegate MODE NIGHT YES else AppCompatDelegate setDefaultNightMo
python3GUI--抖音无水印视频下载工具（附源码）

文章目录一准备工作二预览 0 复制抖音分享短链接 1 启动 2 运行 3 结果三设计流程 1 总体设计 2 详细设计四源代码五说明总结 hello 大家好啊失踪人口回归了捂脸本次使用tkinter撰写一篇抖音无
QML中ListView数据的分组与定位显示

在QML中ListView的数据分组与定位显示时以前使用ListView进行数据分组时都是在model中加入分组数据分组的项然后将model中的数据排好序后全部显示到ListView中这样做也能达到数据分组的目的但是数据维护太费
为什么List,set,map 不继承Serializable接口

为什么List set map 不继承Serializable接口猜测应该是默认不继承但实际上可以继承只要是object都可以实现这个接口只是默认不这样干有三个可能一是不知道怎么实现默认接口二不允许实现默认接口三暂时没
UITextFeild Test

import
selenium的使用

selenium的使用 0 使用selenium import time from selenium webdriver import Chrome from selenium webdriver common by import By 1

selenium的使用

selenium的使用

0.使用selenium

1.创建一个浏览器对象(双击打开谷歌浏览器)

2.输入需要控制的网站的地址

3.获取标签

4.操作标签

5.页面滚动

1.打开和关闭浏览器

1.创建浏览器对象(自动打开一个空的页面)

2.打开指定页面

3.关闭当前页面

2.控制浏览器大小

1.设置浏览器全屏显示

2.设置窗口大小：500×500

3.刷新前进后退

4.获取页面基本属性

1.获取网页标标题

2.获取当前网页地址

3.获取浏览器名称

4.获取当前页面的网页源代码(爬虫的时候使用)

5.定位标签

1.定位标签（获取标签）

6.获取标签信息

7.键盘相关的交互操作

8.鼠标相关的交互操作

1.左键:click()

2.右键:context_click()

3.双击:double_click()

4.悬停

5.拖拽

9.选项卡切换

10.拖拽的操作

11.中国知网数据分析关键字提取

selenium的使用 的相关文章

随机推荐

热门标签

selenium的使用的相关文章