Python爬取携程酒店信息

2023-11-13

代码

from selenium import webdriver
from time import sleep
import xlwt  # 进行excel操作
#谷歌驱动 告诉电脑在哪打开浏览器
driver=webdriver.Chrome(executable_path="D:/chromedriver.exe")
#打开网页
driver.get("https://hotels.ctrip.com/?allianceid=4897&sid=798178&bd_vid=8152353566163309773")
#通过xpath点击搜索
driver.find_element_by_xpath("//*[@id='btnSearch']").click()
driver.implicitly_wait(20)#隐式休息20s 登录携程

names=[]
prices=[]
addresses=[]
percents=[]
peoples=[]
for i in range(1,11):
    for j in range(1,26):
        name=driver.find_element_by_xpath("//div[@id='hotel_list']/div["+str(j)+"]/ul[@class='hotel_item']/li[2]/h2/a")
        price=driver.find_element_by_xpath("//div[@id='hotel_list']/div["+str(j)+"]/ul/li[3]//a/span")
        address=driver.find_element_by_xpath("//div[@id='hotel_list']/div["+str(j)+"]/ul[@class='hotel_item']/li[2]/p")
        percent=driver.find_element_by_xpath("//div[@id='hotel_list']/div["+str(j)+"]/ul[@class='hotel_item']/li[4]/div//span[@class='total_judgement_score']/span")
        people=driver.find_element_by_xpath("//div[@id='hotel_list']/div["+str(j)+"]/ul[@class='hotel_item']/li[4]/div//span[@class='hotel_judgement']/span")

        names.append(name.get_attribute("textContent").replace('\n', '').replace('\t', ''))
        prices.append(price.get_attribute("textContent"))
        addresses.append(address.get_attribute("textContent").replace('\n', '').replace('\t', '').replace('【', '').replace("】", ''))
        percents.append(percent.get_attribute("textContent"))
        peoples.append(people.get_attribute("textContent"))
    driver.find_element_by_xpath("//*[@id='downHerf']").click()
    sleep(5)
    print("第"+str(i)+"页")
print("爬取完毕！")

#存数据
book = xlwt.Workbook(encoding="utf-8", style_compression=0)  # 创建workbook对象
sheet = book.add_sheet('携程', cell_overwrite_ok=True)  # 创建工作表
col = ("酒店名称","酒店价格","酒店地址","用户推荐","推荐人数")
for i in range(0, 5):
    sheet.write(0, i, col[i])  # 列名
for i in range(0,250):
    sheet.write(i+1,0,names[i])
for i in range(0,250):
    sheet.write(i+1,1,prices[i])
for i in range(0,250):
    sheet.write(i+1,2,addresses[i])
for i in range(0,250):
    sheet.write(i+1,3,percents[i])
for i in range(0,250):
    sheet.write(i+1,4,peoples[i])
book.save("携程.xls")  # 保存
print("关闭浏览器，保存数据")

结果
在这里插入图片描述

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

爬虫

python

Python爬取携程酒店信息的相关文章

pywinauto 32位用户警告

我正在尝试使用 pywinauto 在每次更新类文件时自动启动和停止 TomCat 但是当我尝试运行它时它会给出以下警告 UserWarning 32 bit application should be automated using
如何在 Windows 10 上使用 python 3.7 的 anaconda 包？

我使用的是 Windows 10 Pro 64 位版本我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
如何移动我的图像？ python 3.10.4 pygame

我会移动我的图像图像是matiskinfinal png 我尝试将像素添加到 x 或其他我不知道它是什么的东西因为我真的是 python 的初学者 pygame但是是 x x 变化但图像没有移动 import os import py
Python sqlite3参数化删除表

我在 python 中删除 sqlite3 表时遇到问题我正在使用标准sqlite3模块 self conn sqlite3 connect sql drop table self conn execute sql u table nam
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
Windows Defender 检测 Python EXE 为木马

我制作了一个 Python 脚本将 Windows 目录以 zip 形式邮寄给我我使用 sched 模块添加了一个调度程序每小时重复一次我试图制作一个简单的同步应用程序供个人使用在 Windows 启动时启动我使用将其转换为 e
OpenCV - 我需要将彩色图像插入黑白图像并且

我用以下代码将黑白图像插入彩色图像没问题 face grey cv cvtColor face cv COLOR RGB2GRAY for row in range 0 face grey shape 0 for column in ra
了解 asyncio 已经运行的永久循环和挂起的任务

我在理解如何将新任务挂起到已经运行的事件循环中时遇到问题这段代码 import asyncio import logging asyncio coroutine def blocking cmd while True logging in
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
在 vim 折叠线中语法高亮 Python

我发现代码折叠 http en wikipedia org wiki Code folding帮助我更好地组织我的文件因此在我的底部 vimrc 我启用vim代码折叠 http vimdoc sourceforge net htmldo
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
Python：帮助（numpy）在退出时导致段错误

我遇到了一个奇怪的现象在 python 解释器中我执行以下操作 gt gt gt import numpy gt gt gt help numpy 帮助显示正确但一旦我按 q 返回解释器 Segmentation fault core
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a
通过 ManyToManyField = Value 对 django 查询集进行排序

如果有一些模型例如 class Tag models Model name models CharField class Thing models Model title models CharField tags models Many
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

用C写小游戏（扫雷）

扫雷前言实现的基本要素菜单雷区设置与打印 1 雷区 2 布置雷 3 打印雷区雷范围标识与排雷 1 雷范围标识 2 排雷代码展示前言说到扫雷大家都不陌生吧特别是windowsXP开始的菜单中找到的小游戏中最吸引我们的便是扫雷
coroutines 学习随笔「一」

文章目录前言疑问1 为啥用协程还要添加一个额外的依赖库太奇怪了我的runBlocking launch withContext 等等都哪去了跟踪到标准库去看看从现在开始进入到标准库了下个小结论 this is BaseCont
猿创征文｜深聊MySQL，从入门到入坟之：应该是全网最详细的MySQL知识点汇总，必须收藏。

MySQL详细知识点汇总 1 引言 2 MySQL知识点汇总 2 1 链接与断开 2 2 启动与创建服务 2 3 数据库操作 2 4 表操作 2 5 数据操作 2 6 字符集编码 2 7 数据类型 2 7 1 数值类型 2 7 2 字符串类
multipart/form-data的使用注意

问题描述事情是这样的我在使用ajax FormData对象提交数据的时候使用request setRequestHeader Content Type application x www form urlencoded 但服务端接受的
用ACL实现防火墙功能

目录一实验目的二实验环境三实验内容实验步骤测试数据等 1 打开Cisco Packet Tracer 6 0 按以下拓扑图接好线路 PC与Server的IP地址掩码网关配置路由器连接配置 2 配置好设备的IP地址和静态
Java线程的5种状态及状态之间转换

Java中的线程的生命周期大体可分为5种状态 1 新建 NEW 新创建了一个线程对象 2 可运行 RUNNABLE 线程对象创建后其他线程比如main线程调用了该对象的start 方法该状态的线程位于可运行线程池中等待被线程调度选
笔记/OSI七层模型

层级名称功能协议设备协议数据单元 7 应用层为应用程序提供网络服务对应用程序提供接口 HTTP 80 TCP 超文本传输 Telnet 23 TCP 远程登陆 FTP 20 21 TCP 文件传输 SMTP 25 TCP 简单
AD器件距离过近报错 AD修改丝印的距离间距

今天画板子遇见了一个间距报错图片如下我当时想着修改丝印的间距就可以了查找了一些资料之后发现是这样修改并且我将其修改到了0 但是结果还是如上图一样报错最后发现除此之外我们还需要修改元件之间的电气距离修改完成之后就OK
Thinkpad笔记本快捷键大全

Thinkpad笔记本快捷键大全 FN F2 锁定屏幕 FN F3 关闭屏幕 FN F4 待机 FN F5 无线和蓝牙开关 FN F7 不同显示设备输出切换 FN F9 安全删除硬件 FN F12 休眠 FN 空格放大其实就是降低分辨率
JackSonUtil JSONArray转换工具

import com fasterxml jackson core type TypeReference import com fasterxml jackson databind ObjectMapper public final cla
Ubuntu安装nginx到配置ssl证书

1 命令安装nginx sudo apt get install nginx 配置文件默认在 etc nginx文件夹下面可以编辑nginx conf 或者 sites enabled文件夹下面的默认配置文件 default 2 常用命令
linux定时删除文件或文件夹

本文转载自 https blog csdn net jiangnan8710 article details 51849748 linux新人个人记录以后备用一常用的命令 1 查询命令 find 在删除日志前首先要做的是查找日志所在
dos命令之md详解及实例应用

dos命令之md详解及实例应用用来创建文件夹dos的命令只有md 其英文解释为 makedirectory在windows2000 xp vista win7使用方法及实例如下在命令行窗口输入md 可得到一份帮助信息如下图例1 如果在
python爬取整个网站的广告敏感词_Python实现敏感词过滤的4种方法

在我们生活中的一些场合经常会有一些不该出现的敏感词我们通常会使用去屏蔽它例如尼玛 gt 一些骂人的敏感词和一些政治敏感词都不应该出现在一些公共场合中这个时候我们就需要一定的手段去屏蔽这些敏感词下面我来介绍一些简单版本的敏感词屏蔽
全国首富排行居然有他？用Python采集全国富豪榜五百名。

背景今天刷到一则文章就是国内某富豪花重金迎娶泰国某皇后可谓是有点颠覆了我的三观啊有钱人都玩的这么花的吗这里内容就不一一讲了毕竟看咱文章的都是想来学技术的那就废话不多说开始干活正文相关模块今天不用其他的什么模块 pyt
linux系统使用rsync做主备服务器文件同步

根据本文档设置可以实现备机自动同步主机中的文件注意此方式缺陷为如果主机文件修改但是文件大小无变化或者文件变小时无法自动同步到备机中只有主机中文件修改后变大或者名称修改才能自动同步一 LINUX服务器间免密登录设置先执行 u
Scaling Instruction-Finetuned Language Models

Paper name Scaling Instruction Finetuned Language Models Paper Reading Note Paper URL https arxiv org pdf 2210 11416 pdf
【NLP】pkuseg：一个多领域中文分词工具包

大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore
软考-嵌入式系统设计师-笔记：标准化知识

文章目录国际标准国家标准行业标准企业标准基本知识嵌入式系统相关标准国际标准国家标准行业标准企业标准基本知识国际标准有效期5年 ISO 标准号杠分标准号冒号发布年号方括号中的内容可有可无国家标准 GB 中国
Python爬取携程酒店信息

代码 from selenium import webdriver from time import sleep import xlwt 进行excel操作谷歌驱动告诉电脑在哪打开浏览器 driver webdriver Chrome

Python爬取携程酒店信息

Python爬取携程酒店信息 的相关文章

随机推荐

热门标签

Python爬取携程酒店信息的相关文章