爬虫学习：实现对彼岸图4k图片的下载

2023-10-27

在学习python爬虫一段时间后，进行第一个项目的实践。

本文使用的库为：requests库 time库 xpath库 os库,

目的：实现对彼岸图4k图片的下载

源码：

import requests
import time
from lxml import etree
import os

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36',
    'Cookie': '_xsrf=2|564c23e9|a46b8cac21ef08bf52221f1b840f5462|1565579147; Hm_lvt_2670efbdd59c7e3ed3749b458cafaa37=1565579182; BAIDU_SSP_lcr=https://cn.bing.com/; _qqq_uuid_="2|1:0|10:1565579148|10:_qqq_uuid_|56:NGVlZTIxMjdiYjYxMTQ5ZTU2NDk2YjhkMmM1ODM2Njg2N2I0Y2JjYw==|520099f3c590773f531a9c5f1eb1d82adba8893e730d3b508c3045904e1cfd9c"; _ga=GA1.2.349374621.1565579182; _gid=GA1.2.361209414.1565579182; Hm_lpvt_2670efbdd59c7e3ed3749b458cafaa37=1565580312'
            }
def handle_request(url,page):
        #由于首页的构建方式和后续界面不一致，所以需要进行判断
        if page==1:
            url=url
        else:
            url=url+'index_'+str(page)+'.html'
        #print(url)
        request = requests.get(url=url, headers=headers)
        #print(request.content)
        return request.text

#分析界面，生成下载的界面的链接，并且返回
def parse_content(content):
    #建造对象
    tree=etree.HTML(content)
    image_list=tree.xpath('//*[@id="main"]/div[3]/ul/li/a/@href')
    #懒加载技术
    #print(image_list)
    #print(len(image_list))
    for image_src in image_list:
        image_src='http://pic.netbian.com'+image_src
        parse_secondcontent(image_src)

def parse_secondcontent(image_src):
    request=requests.get(url=image_src,headers=headers)
    tree=etree.HTML(request.text)
    url_list=tree.xpath('//*[@id="img"]/img/@src')
    for url in url_list:
        image_url='http://pic.netbian.com'+url
        download_image(image_url)

def download_image(image_url):
    print('开始下载图片---请稍后')
    dirpath = '壁纸图片'
    # 创建文件夹
    if not os.path.exists(dirpath):
        os.mkdir(dirpath)
    # 创建文件名(返回文件path最后的的名称作为文件名）
    filename = os.path.basename(image_url)
    # 搞个文件路径（生成一个路径）
    filepath = os.path.join(dirpath, filename)
    # 发送请求，保存图片
    request = requests.get(url=image_url,headers=headers)
    with open(filepath, 'wb') as fp:
        fp.write(request.content)
    print('图片下载结束')

def main():
    number=int(input('请输入分类的代码：1.4k风景 2.4k美女 3.4k游戏 4.4k动漫 5.'))
    if number ==1:
        url='http://pic.netbian.com/4kfengjing'
    elif number ==2:
        url='http://pic.netbian.com/4kmeinv'
    elif number ==3:
        url='http://pic.netbian.com/4kyouxi'
    elif number==4:
        url='http://pic.netbian.com/4kdongman/'
    else:
        url='http://pic.netbian.com/'
    start_page = int(input('请输入你的起始页面'))
    end_page = int(input('请输入你的终止界面'))
    for page in range(start_page,end_page+1):
        print('开始下载%s页的内容'%page)
        #根据url和page去生成指定的请求request
        request=handle_request(url,page)
        parse_content(request)
        print('第%s页的图片下载完成'%page)
        time.sleep(3)
    print('谢谢你的使用，吃屎类')

if __name__ == '__main__':
    main()

实现结果：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

爬虫

学习

爬虫学习：实现对彼岸图4k图片的下载的相关文章

Win10 wsl-安装教程

一安装原生Win10 1 网上随便找一个win10版本制作成U盘启动并完成安装 2 安装原生的win10 上述方案安装的win10不是原生的存在各种问题进入win10操作系统下载最新的 MediaCreationTool 工具
webpack-----前端必会高频面试题

webpack学习总结面试题 1 什么是webpack 静态模块打包工具 2 webpack作用分析压缩打包代码 3 webpack好处减少文件体积减少文件数量提高网页加载速度 4 webpack工作流程 1 初始化参数从配
一个人再牛，最终还是要靠团队

软件行业个人英雄主义时代已经渐渐远去在CS以及自由软件盛行的年代确实造就了许多的软件英雄如今的互联网时代我们只能去怀念他们无论是创业还是软件平台的研发与运营我们都在强调着团队马云再牛没有十八罗汉他也只不过是一个到处吹牛到
报错解决TypeError: write() argument must be str, not list

今天写爬虫的时候遇到的问题将抓取的数据保存下来的时候报错 TypeError write argument must be str not list 字面意思是write写入的应该是str类型的数据而不是一个list类型的数据回到代码
x264的参考帧管理机制

x264介绍 X264是一款研究的是H 264编码的开源代码软件相比JM而言其编码性能有很大的提高其支持大多数H 264的特性工具包括 CABAC和 CAVLC高效嫡编码多参考帧预测所有的帧内预测宏块类型 16x6l和4x4 所
官宣——BSV工程师能力认证项目在CSDN推出线上学习平台

去年11月上海可一澈科技有限公司以下简称可一科技与CSDN联合推出了BSV区块链开发工程师能力认证项目以下简称 BSV工程师认证今天 BSV工程师认证项目正式推出一个全新的线上学习平台并发布首门课程比特币协议与设计本次推出
LDO基础知识：噪声 - 降噪引脚如何提高系统性能

使用低压降稳压器 LDO 来过滤开关模式电源产生的纹波电压并不是实现清洁直流电源的唯一考虑因素由于 LDO 是电子器件因此它们会自行产生一定量的噪声选择低噪声 LDO 并采取措施来降低内部噪声对于生成不会影响系统性能的清洁电源轨而言不

随机推荐

PYQT的最新界面代码

This Python file uses the following encoding utf 8 import sqlite3 import traceback from PyQt5 QtGui import QMouseEvent Q
springboot入门简单使用

springboot入门简单使用 1 SpringBoot项目创建并配置mysql数据库创建项目编写Controller测试配置数据库 2 SpringBoot集成mybatis plus 初始化数据库安装mybatis plus
使用 imshow() 绘制矩阵

使用 imshow 绘制矩阵基础的展示效果 import matplotlib pyplot as plt import numpy as np mat np arange 0 100 reshape 10 10 plt imshow m
linux文件编程（4）—— 用ANSIC标准C库函数进行文件编程：fopen、fread、fwrite、fseek

参考 linux文件编程 5 用ANSIC标准中的C库函数进行文件编程作者丶PURSUING 发布时间 2021 04 11 11 58 25 网址 https blog csdn net weixin 44742824 article
深度优先搜索的框架

深度优先搜索最少分支找到答案一准备 1 节点间的relationship 2 列表lst 存放遍历结果 3 集合set 去重二结构函数递归 def dfs root 1 首先判断根节点是否为空节点 if root is None
Python学习笔记-Python 变量类型

变量是存储在内存中的值这就意味着在创建变量时会在内存中开辟一个空间变量赋值 Python 中的变量赋值不需要类型声明每个变量在使用前都必须赋值变量赋值以后该变量才会被创建等号用来给变量赋值等号运算符左边是一个变量名等号运
【解决问题】mybatis-plus想要修改某字段为null问题

背景最近将框架的mybits换为mybits plus 然后在调用updateById时候想让某个字段修改null 一直失败问题 mybits plus调用updateById时候想让某个字段修改null 一直失败问题原因 myb
2022最新个人所得税计算（附代码）

相信大家一定很在意下面的三个问题个人所得税怎么计算年终奖如何扣税五险一金如何计算通过这篇文章我们用实际例子来计算我们需要交的税一个人所得税怎么计算第一步计算全年收入年终奖除外做个假设比如博主上班后开的工资是30k
React + antd +DatePicker组件禁用小于当下时间之前的时间，包括时，分

一 DatePicker组件的设置 showTime设置时间只显示时分不显示秒 disabledDate函数设置日期的禁用 disabledTime函数设置时间的禁用
Centos 8 安装向日葵(sunloginclient-10.0.0-1)

1 去官网下载最新的安装包下载地址 2 准备安装下面的问题可能遇到但愿你们遇不到如果没遇到问题直接 rpm ivh sunloginclient 10 0 1 24347 amd64 rpm root yaco ls opt to
JavaScript中对象的简单使用实例（String、Math、Date、Array）

String对象使用 JavaScript中的字符串对象和字符串的常用方法 var s string 查看目标字符串是否可以匹配一个字符串如果可以则返回该字符串否则返回空 alert s match str 返回字符出现的位置 al
【设计模式】观察者模式

观察者模式是一种行为型设计模式它定义了一种一对多的依赖关系当一个对象的状态发生改变时其所有依赖者都会收到通知并自动更新当对象间存在一对多关系时则使用观察者模式 Observer Pattern 比如当一个对象被修改时则会自动通
vite项目 router/indext.ts 中引入 views/**/*.vue 页面后报错的解决方法

报错现象 view 文件夹下新建文件夹新建的文件夹下新建view页面路由文件中引入views vue 页面时出现了报错报错现象如下解决方法在 tsconfig app json 文件中添加 src vue 注意添加保存后报错可能
uniapp 动态修改 tabbar 的高度

项目中使用了原生的tabbar tabbar的修改提供了两个API 看了 html5 plus的文档没有看到可以修改tabbar的部分
js正则表达式去除空行

表单文本域中的内容可能有时候会存在空行但我们保存时并不想要多余的空行所以要想办法去掉它只需要一个简单的正则表达式即可 n n n n
（易懂）Mybatis中${}和#{}的区别和使用注意

目录一区别 1 使用字符串拼接的方式拼接sql 如果数据是字符串类型或日期我们需要手动加引号而会自动加上引号 2 安全不安全容易造成sql注入 sql注入就是改变sql的语法规则进行sql命令攻击 3 是经过预编译的是安全
不重叠且分布均匀的气泡图解决方案（基于echarts）

气泡图是数据可视化需求中的一种常见图表形式然而截至目前像echarts d3 higncharts都还没有直接提供一个配置来完成不重叠且分布均匀的气泡图这项工作幸运的是我们可以通过配置echart的关系图来完成我们的气泡图需求下面
整体最小二乘拟合平面

目录 1 算法过程 2 参考文献 3 算法伪码 4 算法效果本文由CSDN点云侠原创原文链接 1 算法过程最小二乘拟合平面认为点云数据系数矩阵不存在误差然而由于观测条件的限制观测向量系数矩阵都有可能存在误差那么最小二乘方法就不
python处理excel词频统计

import pandas as pd import jieba from collections import Counter 读取 Excel 文件 df pd read excel your excel file xlsx 定义函数用
爬虫学习：实现对彼岸图4k图片的下载

在学习python爬虫一段时间后进行第一个项目的实践本文使用的库为 requests库 time库 xpath库 os库目的实现对彼岸图4k图片的下载源码 import requests import time from lxml

爬虫学习：实现对彼岸图4k图片的下载

爬虫学习：实现对彼岸图4k图片的下载 的相关文章

随机推荐

热门标签

爬虫学习：实现对彼岸图4k图片的下载的相关文章