爬取豆瓣网站前top250电影名称和评分保存到本地excel中（附效果图和代码）

2023-05-16

import requests
from lxml import etree
import xlwt

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}

urls = ['https://movie.douban.com/top250?start={}&filter='.format(str(i * 25)) for i in range(0, 10)]
titles = []
point = []
count = []
remark = []
for url in urls:
    session = requests.Session()
    # 登录后，我们需要获取另一个网页中的内容
    response = session.get(url, headers=headers)
    a = response.text
    # 使用xpath解析从网络上获取的数据
    tree = etree.HTML(a)
    # 解析获取当页所有段子的标题
    title_list = tree.xpath("//ol[@class='grid_view']//div[@class='info']//a/span[text()][1]")
    for a in title_list:
        titles.append(a.text)
    # 解析豆瓣评分
    file_point = tree.xpath("//div[@class='star']//span[text()][1]")
    for b in file_point:
        point.append(b.text)
    # 解析电影名评价数量(解析出数量)
    flie_count = tree.xpath("//div[@class='star']//span[text()][2]")
    for i in flie_count:
        count.append(i.text)
    # 解析电影名备注
    flie_remark = tree.xpath("//p[@class='quote']//span")
    for i in flie_remark:
        remark.append(i.text)

print(len(titles), len(point), len(count), len(remark))
# 创建一个excel
workbook = xlwt.Workbook()
# 创建一个sheet页
worksheet = workbook.add_sheet('Input', 'w+b')
titiless = ['电影名称','豆瓣评分','评价人数']
for i in range(len(titiless)):
    worksheet.write(0, i, titiless[i])
for i in range (len(titles)):
    worksheet.write(1 + i, 0, titles[i])
    worksheet.write(1 + i, 1, point[i])
    worksheet.write(1 + i, 2, count[i])
    # worksheet.write(1 + i, 4, remark[i])
workbook.save(r"E:\PythonExcel\豆瓣top250.xls")

运行代码后生产excel的数据

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

爬取豆瓣网站前top250电影名称和评分保存到本地excel中（附效果图和代码）的相关文章

无人机高清远程直播+4G/5G智能多网路由系统

无人机高清远程直播 43 4G 5G智能多网路由系统交通拥堵问题一直是困扰交警的首要难题它所带来的时间浪费运营成本上升交通事故空气污染噪声污染等问题使得交通拥堵成为制约城市经济和社会发展的瓶颈尤其是交通早高峰时段 xff0c
无人机电网线路巡检有哪些优势？分享高效的图像实时回传解决方案

随着科技的高速发展 xff0c 相关数据和图像资料表明 xff0c 在观察输电线路设备运行情况时 xff0c 无人机技术可以起到相当关键的作用 xff0c 大大减轻了电力员工的作业负担通过无人机电力巡检 xff0c 可以清楚判断重要部件是
Mac软件推荐：NoMachine轻松带你远程控制桌面

使用NoMachine for Mac与你的设备建立远程桌面连接后 xff0c 通过网络远程桌面就能快速访问你的设备 xff0c 方便快捷 xff0c 安全可靠 xff0c nomachine mac版的功能强大 xff0c 而且还是免费软
lodash源码

function var undefined var VERSION 61 4 17 21 var LARGE ARRAY SIZE 61 200 var CORE ERROR TEXT 61 Unsupported core js use
mac系统如何安装nacos

一 xff1a 安装步骤 1 先到nacos官网 http nacos io zh cn 2 点击前往Github xff08 进去下拉文档 xff0c 找到 latest stable release 点进去 xff09 3 点击下载zi
使用Idea启动Nacos

通过Edit Configurations进行配置点击加号 xff0c 并且选择Shell Script 配置参数 xff1a Script path Mac系统的为bin目录 43 startup sh Windows系统为bin目录
BoundValueOps(RedisTemplate常用集合)

目录 boundValueOps Key Value BoundValueOperations set V value get set V value long timeout TimeUnit unit getAndSet V value
macOS安装RabbitMQ

Homebrew 是 MacOS 的一个流行的软件包管理器可从 Homebrew 的仓库中安装RabbitMQ 首先 xff0c 确保你已经安装了Homebrew 在终端上 xff0c 运行 brew version 1 安装用以下方法
Virtualbox加载虚拟机镜像

启动虚拟机打开这个文件夹双击蓝色图标会自动开启virtualbox虚拟机并加载当前镜像必须保证当前镜像文件所在全部路径都没有中文建议启动Virtualbox时使用单击右键 gt 管理员方式运行配置镜像参数选中镜像点击设置
Docker基础命令

目录 Docker命令格式 images命令 search命令 pull命令 rmi命令 run命令 ps命令 stop rm命令启动redis 关闭防火墙 Docker命令格式 Docker命令的语法结构 docker 子命令选项 d
MySQL数据库的应用

数据库常见术语 DB Database 数据库DBMS Database Management System xff1a 数据库管理系统SQL Structured Query Language xff1a 结构化的查询语言数据库的设计
List.Stream()各方法应用

目录 List Stream流 stream 优点 xff1a 流 stream 的操作类型分为两种 xff1a list stream filter T gt boolean distinct sorted sorted T T gt i
Hibernate-Validator(数据校验框架)

目录 1 Hibernate Validator 简介 2 项目中为什么要用校验框架 3 添加依赖 4 在实体类上添加对应注解 5 POST方法中应用 64 RequestBody 和 64 RequestParam区别 6 GET方法中应
@ApiLog编写spring日志打印注解

目录声明一个注解 64 interface 64 Target修饰注解 64 Retention修饰注解 64 Document修饰注解 64 Inherited修饰注解编写 64 ApiLog的实现切面类声明一个注解基本元素描述
OAuth 2 工作流程(转载)

OAuth 2 工作流程介绍可用的工作流程网络应用程序流程移动应用流程旧版应用程序流程后端应用流程刷新令牌 ALL 定义令牌令牌保护程序和所需的凭据 xff08 一 xff09 在每个请求上定义 Try Catch Toke
23种设计模式

目录一什么是设计模式二设计模式的三大分类及关键点三设计模式的几种原则四设计模式关系一什么是设计模式设计模式 xff08 Design pattern xff09 是解决软件开发某些特定问题而提出的一些解决方案也可以理解
判断浮点数是否相等以及CompareTo()的使用

目录 CompareTo 比较字符串类型如何判断两个浮点数是否相等 xff1f CompareTo 比较字符串类型 1 返回参与比较的前后两个字符串的ASCII码的差值 xff0c 如果两个字符串首字母不同 xff0c 则该方法返回首字母
Windows环境下使用vnc远程桌面连接Linux

VNC官网 xff1a https www realvnc com en connect download viewer VNC包括服务器端和客户端 xff0c 最终需要实现从Windows上使用vnc客户端能够远程连接到Linux xff
12c容器数据库相关操作：登录12c(容器数据库)、如何在oracle 12c中创建普通用户、 ORACLE 12C之CDB与PDB 、修改pdb名称

一登录12c 容器数据库 sqlplus as sysdba SQL gt show pdbs CON ID CON NAME OPEN MODE RESTRICTED 2 PDB SEED READ ONLY NO 3 XINBAOGG
程序员没有项目经验，如何写出漂亮的简历

前言国庆假期已经结束啦 xff08 文末送福利 xff09 已经嗨完了7天7夜有些人还没从假期中醒过来却也有人高兴不起来因为在这个金九银十一些同学还没找到满意的工作呢特别是对于没有工作经验的应届生来说做出一份可以进面试的简历

随机推荐

我用Python写了个金融数据爬虫，半小时干了组里实习生一周的工作量

前言最近 xff0c 越来越多的研究员基金经理甚至财务会计领域的朋友 xff0c 向小编咨询 xff1a 金融人需要学Python么 xff1f 事实上在2022年 xff0c 这已经不是一个问题了 Python已成为国内很多顶级投行
程序员必读的10本经典书（含资源）建议收藏

这是本文的目录前言01 代码整洁之道 02 程序员的自我修养 03 程序员修炼之道 04 计算机程序的构造与解释 05 编程珠玑 06 程序是怎么跑起来的 07 自学是门手艺 08 Python编程 09 黑客与画家 10 图解 HTTP
小米只能进fastboot和rec救砖

Bl锁已解 xff0c 手机变砖 xff0c 只能进fastboot和rec模式 xff0c 我们通常有以下方式解决 1 如果你是因为动了某个分区镜像而导致变砖的 xff0c 可以到手机官方网站寻找对应版本刷机包提取动过的镜像 xff0c
C#开发串口调试助手的详细教程

一串口助手是什么 xff1f 通过电脑串口 xff08 包括USB口 xff09 收发数据并且显示的应用软件 xff0c 一般用于电脑与嵌入式系统的通讯 xff0c 借助于它来调试串口通讯或者系统的运行状态也可以用于采集其他系统的数据
怎样使用类和对象——静态成员

静态数据成员用立方体类box定义两个对象 xff0c 引用不同对象中的静态数据成员 span class token macro property span class token directive hash span span cla
STM32CubeMX代码第一次烧录后无法再识别STM32

本文记录的是我在烧录时出现的问题 xff0c 具体细节会因为使用的软件或者STM32不同而不同在使用STM32CubeMX生成的代码 xff0c 经过keil5编写后 xff0c 使用usb接口烧录进STM32然后发现keil5中再也识别
算法练习2之单链表求和

笔试题目 xff1a 1 用单向链表表示十进制整数 xff0c 求两个正整数的和如下图 xff0c 1234 43 34 61 1268 xff0c 注意单向链表的方向 xff0c 不允许使用其他的数据结构题目分析 xff1a 题目中
git基础

1 git的相关配置 git自带一个git config工具来帮忙配置变量 xff0c git中这些变量存储在3个不同的位置并且有相关命令进行配置 xff0c 如下 xff1a git config system xff1a 存储在 etc
单例模式----双重检查锁

双重检查锁双重检查锁 xff1a 双检锁 xff1a 单例模式中用volatile和synchronized来满足双重检查锁机制 xff1b 在实现单例模式的时候往往会忽略掉多线程的情况 xff0c 就是写的代码在单线程的情况下是没问题的
【CSDN】关于博客中图片水印有关问题

默认效果 https img blog csdnimg cn 20210202141712123 png x oss process 61 image watermark type ZmFuZ3poZW5naGVpdGk shadow 10
C++（一）— cout输出格式（待完善）

C 43 43 cout输出格式 ios dec以10进制表示整数ios hex以16进制表示整数ios oct以8进制表示整数ios showbase为整数添加一个表示其进制的前缀ios internal在符号位和数值的中间插入需要数里
判断两台设备是否属于同一子网的简易程序(C++实现)

给定ip地址与子网掩码 xff0c 通过与运算判断是否属于同一子网 xff1a span class token macro property span class token directive hash span span class
Win11中换源失败

按照之前在win10中的换源方法 xff0c 在 condarc中换源 xff0c 因为pip时下载网速依旧很慢 xff0c 所以发现换源并不成功 xff0c 并且没有在下载的时候有如下图所示的换源语句 Looking in indexes
px4连接不了mavros的原因

本人多次试过机载重装系统后初次安装mavros 出现mavros连接不上的问题一 USB接口电压不够我之前遇到过的一种就是当px4通过USB线接入机载 xff0c 启动mavros时 xff0c 一直连接不上 xff0c 而且px4上常
Jetson Xaiver NX 安装 librealsense2-SDK

在Jetson Xaiver NX上使用英特尔的相机 xff0c 我们需要安装相机的驱动 xff0c 以下提供两种方法进行安装注 xff1a 采用手动安装方法可以驱动D400系列的相机但驱动不了T265 xff0c 如果需要同时驱动D4
PX4机载连接通过IP连接电脑QGC地面站

PX4接入Jetson系列机载时 xff0c 因为Jetson系列机载为ARM架构 xff0c 没有对应的QGC地面站可以安装使用在平时的连接都是通过将PX4接USB线连接至电脑 xff0c 通过电脑的QGC进行各种校准和参数更改接入机
一次成功流水帐 ros中使用serial包实现串口通信debug和教程汇总

会参考以下几个教程 xff0c 但是这几个都不完整 ros中使用serial包实现串口通信鲁班班班七号的博客 CSDN博客 ros 串口通信 ROS使用serial库编译时出现未定义的引用解决办法学术马的博客 CSDN博客 ros编
Haar特征+Adaboost人脸识别C实现

Haar特征 43 Adaboost的人脸识别C实现 xff0c 部分简单的功能借助Opencv实现 xff0c 数据是MIT人脸数据程序的实现主要是参考 Rapid Object Detection using a Boosted ca
Redhat6.5出现不识别CPU

Detected CPU family 6 model 6Z UNSUPPORTED HARDUARE DEVICE CPU family 6 model gt 59 Redhat6 5版本会出现开机不是别cpu重启服务器 xff0c 可解
爬取豆瓣网站前top250电影名称和评分保存到本地excel中（附效果图和代码）

import requests from lxml import etree import xlwt headers 61 39 User Agent 39 39 Mozilla 5 0 Windows NT 10 0 Win64 x64

爬取豆瓣网站前top250电影名称和评分保存到本地excel中（附效果图和代码）

爬取豆瓣网站前top250电影名称和评分保存到本地excel中（附效果图和代码） 的相关文章

随机推荐

热门标签

爬取豆瓣网站前top250电影名称和评分保存到本地excel中（附效果图和代码）的相关文章