Ajax-爬取多页图片

2023-11-01

文章目录

一、目的

爬取多页图片
图片网页地址：https://picsum.photos/images
关键点：上述的网页HTML代码中并无图片地址，图片是通过Ajax请求的json数据，我们需要找到图片真正的地址

二、代码

import requests
import os


def get_page(url):
    try:
        header = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'}
        r = requests.get(url, headers=header)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.json()

    except:
        print("出现异常")


def parse_page(data_list):
    imgs_url = []
    for data in data_list:
        imgs_url.append(data.get('download_url'))
    return imgs_url


def save_imgs(imgs_url):
    root = "images/"
    if not os.path.exists(root):
        os.mkdir(root)
    for img_url in imgs_url:
        img_name = root + img_url.split("/")[-3] + ".jpg"
        print('{0:<15}'.format(img_name), end=": ")
        if not os.path.exists(img_name):
            print("正在下载...", end=" ")
            r = requests.get(img_url)
            with open(img_name, "wb") as f:
                f.write(r.content)
            print("下载完成！")
        else:
            print("图片已存在！")


if __name__ == '__main__':
	# 爬取4页图片，也可以使用input()手动输入爬取页数
	# page_num = int(input("请输入爬取图片页数：")) 将5替换page_num即可
    for page in range(1, 5):
        url = "https://picsum.photos/v2/list?page="
        print("\n正在获取第" + str(page) + "页")
        url += str(page)
        # 获取页面html
        data_list = get_page(url)
        # 解析页面
        imgs_url = parse_page(data_list)
        # 保存图片
        save_imgs(imgs_url)
    print("所有图片下载完成！")

三、结果

图片存储在程序所在目录images/目录下

四、关键点

本次爬取图片的关键点在于找到图片真正的地址

按F12审查元素，发现图片地址
访问该地址，发现其中的图片下载地址download-url

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python爬虫

Ajax-爬取多页图片的相关文章

ggplot2中的条形图 geom_bar()

20150226 1 ggplot 能直接计算aes 中x变量各个分类的数目所以可以直接用原始数据而不用像plot 一样要table 数据 2 geom bar mapping NULL data NULL stat bin posit
从零搭建 Spring Cloud 服务（超级详细）

点击上方 Java后端选择设为星标优质文章及时送达作者 Anakki 链接 blog csdn net qq 29519041 article details 85238270 这里会介绍很多基础知识直接想开始搭建微服务的可以看
小学思品课如何使用计算机教学设计,关于小学思品教学设计与反思

关于小学思品教学设计与反思小学思想品德节约用水教学设计与反思节约用水教学设计与反思一指导思想品德与生活课注重学生的实践与参与性突出教学实效性让学生通过丰富的教学活动去亲身体验亲自感受水的重要与水资源的匮乏从而形成自觉的
Win10 系统下VisualStudio2019 配置Open3D-0.15.2（C++）

目录一下载Open3D 0 15 2 二编译 font color dd00dd 1 新建文件 CmakeList txt TestVisualizer h TestVisualizer cpp font color dd00dd 2
进程、线程与JVM、CLR

进程和线程的关系网上有一副很经典的图可以让我们来理解进程和线程的关系下面这副图是一个双向多车道的道路图假如我们把整条道路看成是一个进程的话那么图中由白色虚线分隔开来的各个车道就是进程中的各个线程了这副图出自 http ww
chroot命令的基本用法

chroot 切换根目录 chroot PATH TO TEMPROOT COMMAND chroot test virrot bin bash 切换根目录并明确指明运行那个目录下面的bash 例子切换根目录 root gdy ftpf
实战Elastic Stack分析K8S应用日志--部署logstash

logstash从kafka取数据输出到es 部署logstash docker pull logstash 6 8 6 docker images grep logstash docker tag d0a2dac51fcb harbor
【M malloc送书第二期】朋友圈大佬都去读研了，这份备考书单我码住了！

文章目录 01 数据结构与算法分析 02 计算机网络自顶向下方法 03 现代操作系统 04 深入理解计算机系统 01 概率论基础教程原书第10版 03 线性代数及其应用八九月的朋友圈刮起了一股晒通知书潮频频有大佬晒出研究生入学通知
JSONObject与JSONArray总结及部分使用

例如取出name4值过程步骤 1 将以上字符串转换为JSONArray对象 2 取出对象的第一项 JSONObject对象 3 取出name1的值JSONObject对象 4 取出name2的值JSONObject对象 5 取出name4
【react】高阶函数_函数柯里化

高阶函数如果一个函数符合下面2个规范中的任何一个那该函数就是高阶函数 1 若A函数接受的参数是一个函数那么A就可以称之为高阶函数 2 若A函数调用的返回值依然是一个函数那么A就可以称之为高阶函数常见的高阶函数有 Promise
JetBrain系列软件使用

一 PHPSTORM 非常好用的插件支持对一些动态调用的函数快速跳到函数定义处 DynamicReturnTypePlugin FIle gt Settings gt Plugins gt Marketplace 输入 DynamicRe
使用Python对一张图像进行高斯模糊

import cv2 src cv2 imread test jpg numpy数组第二个参数高斯核的宽和高建议是奇数第三个参数 x和y轴的标准差 result cv GaussianBlur src 45 45 15 cv2 im

随机推荐

MybatisPlus配置双数据库驱动

个人博客纯净版 MybatisPlus配置双数据库驱动代码搬运工最近项目中需要用到2种数据库驱动连接数据库下面我们基于MybatisPlus实现一下具体实现 1 在pom xml中添加如下依赖
三星修复软件+连接三星认证服务器,三星云服务从2月6日起不再支持第三方应用程序数据备份...

原标题三星云服务从2月6日起不再支持第三方应用程序数据备份 1 月 23 日消息三星近日向用户发送电子邮件称三星云服务将在 2 月 6 日停止支持第三方应用数据备份届时三星将清除已经从这些应用备份的数据用户将无法从这些备份中进行恢
时间序列分类总结（time-series classification）

时间序列分类总结 time series classification 一传统方法需要手工设计 1 DTW dynamic time warping KNN 2 基于特征的方法二深度学习 1 MLP FCN ResNet 2 LST
TestNg框架源码解析

TestNG是一个测试框架其灵感来自JUnit和NUnit 但引入了一些新的功能使其功能更强大使用更方便 TestNG是一个开源自动化测试框架 TestNG表示下一代 Next Generation的首字母 TestNG类似于JUni
Flutter TextField IOS 双击、长按异常

IOS端在长按Textfield唤起粘贴复制的时候会报错主要原因是Cupertino缺少了对应的非英文版本的支持 import package flutter cupertino dart import package flutter f
设计一个函数chline（ch，i，j），打印指定的字符j行i列

这里涉及到scanf 函数的读取知识和缓冲区的知识 scanf函数在读取时候是从缓冲区读取数据而我们输入的数据会在保存在缓冲区 scanf函数从缓冲区读取的数据后相应的数据会从缓冲区中消失但是没有被读取的数据还会在缓冲区在下次调用
【混合时变参数系统参数估计算法】使用范数总和正则化和期望最大化的混合时变参数系统参数估计算法（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现 1 概述文献来源本文解决了具有 eXogenou
Python基于BaseHTTPRequestHandler的HTTP代理V1.0

proxyHandler py coding utf8 from BaseHTTPServer import BaseHTTPRequestHandler HTTPServer import socket import urllib fro
Python GUI案例之看图猜成语开发（完结篇）

Python GUI案例之看图猜成语完结篇看图猜成语小程序开发完结篇总结完整代码 Python GUI案例之看图猜成语开发第一篇 Python GUI案例之看图猜成语开发第二篇 Python GUI案例之看图猜成语开发第三篇
POI单元格插入图片

RequestMapping outEsComEquipmentDetailExcels public void outEsComEquipmentDetailExcels RequestParam fid Integer fid Requ
c语言浮点数常量,C 浮点常量

浮点常量就是一种呈现有符号实数的十进制数字有符号实数的呈现包括一个整数部分一个小数部分还有指数可以使用浮点常量来呈现不可以被改变的浮点值语法浮点数常量小数常量指数部分可选浮点后缀可选数字序列指数部分浮点后缀可选
暗黑大陆游戏服务器为空请检查列表文件,游戏服务器为空请检查列表文件名...

游戏服务器为空请检查列表文件名内容精选换一换当应用中的云硬盘空间不足时可对该云硬盘进行扩容操作扩容操作属于高危操作请谨慎操作为了防止数据丢失磁盘只支持扩容不支持缩容如果磁盘已挂载在云服务器上需要您通过云服务器控制台重启
ES多个字段聚合分组，在结果上执行二次统计分析

Es版本 7 6 2 Test public void groupBucket 设置要查询的索引 SearchRequest request new SearchRequest indices EdaIndex EDaIndex FILE
JNI排坑记录：java.lang.UnsatisfiedLinkError导致JVM崩溃

本次坑不大不小在此记录一下希望能够帮助遇到同样问题的朋友 1 背景最近在进行Seetaface6开源人脸识别库的Java封装工作封装工作初步完成后 Java端进行封装测试调用库dll文件都成功了但调用本地Native方法 dll
基础编程题目集——7-15 计算圆周率

1 题目要求根据下面关系式求圆周率的值直到最后一项的值小于给定阈值输入格式输入在一行中给出小于1的阈值输出格式在一行中输出满足阈值条件的近似圆周率输出到小数点后6位 2 样例输入样例 0 01 输出样例 3 132157
QHash的使用(插入、取值、遍历、删除)

1 创建键值对的方式插入数据类型随意这里以键int 值QString示例 QHash
200行代码写一个简易的C++小黑窗贪吃蛇游戏

分享一个简易的小黑窗贪吃蛇一共就两百行代码左右包含注释很适合初学者巩固语法来练练手如果后续需要其他功能也可以再添加先小小展示一下源码在文末免费领取使用工具 VS2019 不是用VS的也可以直接找出cpp和h文件复制到你们用的I
在 RedHat 8.7 中安装 ROCm

1 official docs 1 1 graphics docs Overview amdgpu graphics and compute stack unknown build documentation 1 2 compute doc
异步加载Baidu地图失败error isTrusted:true

为什么会加载失败为了用户体验在用户使用地址组件之前不加载地图因此我们采用官网的例子异步加载百度地图这里做了一点改进 export function baiduMapInit const url https api map baidu
Ajax-爬取多页图片

文章目录一目的二代码三结果四关键点一目的爬取多页图片图片网页地址 https picsum photos images 关键点上述的网页HTML代码中并无图片地址图片是通过Ajax请求的json数据我们需要找到

Ajax-爬取多页图片

文章目录

一、目的

二、代码

三、结果

四、关键点

Ajax-爬取多页图片 的相关文章

随机推荐

热门标签

Ajax-爬取多页图片的相关文章