获取网页相关图片

2023-05-16

  1. 获取网页上相关图片.
# -*- coding: UTF-8 -*-"""
import requests
import tqdm


def configs(search, page, number):
    """

    :param search:
    :param page:
    :param number:
    :return:
    """
    url = 'https://image.baidu.com/search/acjson'
    # url = 'https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1657872367293_R&pv=&ic=&nc=1&z=0&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=0&height=0&face=0&istype=2&dyTabStr=MCwzLDgsNiwxLDQsNSw3LDIsOQ%3D%3D&ie=utf-8&sid=&word=%E5%87%8F%E9%80%9F%E5%B8%A6+%E5%A4%9C%E6%99%9A'
    params = {
        "tn": "resultjson_com",
        "logid": "11555092689241190059",
        "ipn": "rj",
        "ct": "201326592",
        "is": "",
        "fp": "result",
        "queryWord": search,
        "cl": "2",
        "lm": "-1",
        "ie": "utf-8",
        "oe": "utf-8",
        "adpicid": "",
        "st": "-1",
        "z": "",
        "ic": "0",
        "hd": "",
        "latest": "",
        "copyright": "",
        "word": search,
        "s": "",
        "se": "",
        "tab": "",
        "width": "",
        "height": "",
        "face": "0",
        "istype": "2",
        "qc": "",
        "nc": "1",
        "fr": "",
        "expermode": "",
        "force": "",
        "pn": str(60 * page),
        "rn": number,
        "gsm": "1e",
        "1617626956685": ""
    }
    return url, params


def loadpic(number, page):
    base = 1000                #修改文件起始编号
    """

    :param number:
    :param page:
    :return:
    """
    while (True):
        if number == 0:
            break
        url, params = configs(search, page, number)
        result = requests.get(url, headers=header, params=params).json()
        url_list = []
        for data in result['data'][:-1]:
            url_list.append(data['thumbURL'])
        for i in range(len(url_list)):
            getImg(url_list[i], 60 * page + i + base, path)
            bar.update(1)
            number -= 1
            if number == 0:
                break
        page += 1
    print("\nfinish!")


def getImg(url, idx, path):
    """

    :param url:
    :param idx:
    :param path:
    :return:
    """
    img = requests.get(url, headers=header)
    file = open(path + 'mark' + str(idx + 1) + '.jpg', 'wb')  #文件名称
    file.write(img.content)
    file.close()


if __name__ == '__main__':
    search = "交通红绿灯 白天"  #  搜索关键字
    number = 1000   #爬取数量
    path = '/home/wsy/data/wuxi/06_dataset_collection/dataset_traffic_light/data1/'  # 保存爬取的数据的文件夹
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}

    bar = tqdm.tqdm(total=number)
    page = 0
    loadpic(number, page)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

获取网页相关图片 的相关文章

随机推荐

  • 图神经网络对抗攻击的研究学习(一)

    目录 0 引入1 初窥1 1 图神经网络1 1 1 传统神经网络的不足1 1 2 图神经网络概况1 1 3 Graph Convolution Networks GCN 1 1 4 Graph Attention Networks GAT
  • 二叉树遍历方法——前、中、后序遍历(图解)

    目录 一 前序遍历 xff08 1 xff09 递归版本 xff08 2 xff09 非递归版本 二 中序遍历 xff08 1 xff09 递归版本 xff08 2 xff09 非递归版本 三 后序遍历 xff08 1 xff09 递归版本
  • VMware虚拟机安装Linux

    前言 接下来要分享一些Linux相关的内容 咱们来聊聊为啥要学Linux 首先 xff0c 运维靠这个吃饭 xff0c 测试要部署测试环境 大部分企业要用到Linux操作系统 xff0c 作为开发多少也要会是吧 所以 xff0c 他来了 一
  • MPU6050基本原理介绍及程序配置

    一 MPU6050简介 1 内部主要结构 xff1a 陀螺仪 加速度计 数字运动处理器DMP xff08 Digital Motion Processor xff09 PS MPU6050还含有第二IIC接口 xff0c 用于连接一个 第三
  • 2023年河北省天梯赛C语言 猜帽子游戏

    include lt stdio h gt int N K x int a 100 void solve int dui 61 0 int cuo 61 0 int mzuo 61 0 for int i 61 0 i lt N i 43
  • 树莓派4B环境配置

    前言 最近要用到树莓派 xff0c 荔枝整理了一份基础的树莓派4B配置总结 xff0c 有需要的大家自取 文章目录 前言 一 基础配置 1 1 烧录 1 2 进入桌面 1 3 开启SSH和VNC 二 更换国内源 三 查看python3版本并
  • Python之列表的基本操作

    目录 1 列表的创建与遍历 2 添加元素 3 删除元素 4 分片赋值 5 列表排序 完整代码 xff1a 本文的代码体为一个完整体 xff0c 即最开始的列表的创建与遍历中创建的列表 xff0c 为后续操作的主列表 如需从总体观看全部代码
  • Qt 实现简单的tcp网络通信

    文章目录 成品效果图 xff1a 代码 xff1a 工具头文件tool hUI文件代码 ui widget h 窗口头文件 widget h xff1a 窗口源文件widget cpp 相关代码说明 xff1a Qt获取本机ip Qt 打开
  • VNC可实现屏幕共享

    第一步 第二歩 第三步第四步 第五步 第六步 第七步
  • coco2017数据标签格式转到VOC2007格式

    以下代码是将coco2017数据集标签格式转到voc2007格式的代码 span class token operator span span class token operator span span class token opera
  • C库函数 ——strstr、strtok的详解

    x1f48c 内容专栏 xff1a C语言 进阶部分 x1f48c 本文概括 xff1a 理解C语言库函数strstr strtok的功能 x1f48c 本文作者 xff1a 花 碟 x1f48c 发布时间 xff1a 2023 3 14
  • 用Energia烧写MSP430F5529出现问题

    先前使用MSP430G2553的板子上传程序 xff0c 都没有问题的因为管脚太少了 xff0c 而选择使用MSP430F5529 xff0c 但第一个程序一烧写 xff0c 就出现了问题 xff0c 一直都不明白哪里有问题 xff0c 还
  • 修改mysql密码的四种方法

    方法1 xff1a 用SET PASSWORD命令 首先登录MySQL 格式 xff1a mysql gt set password for 用户名 64 localhost 61 password 新密码 例子 xff1a mysql g
  • 云计算赛项私有云服务搭建(最新版比赛步骤超详细)

    openstack平台搭建基础 题目 1 基础环境搭建 使用提供的用户名密码 xff0c 登录提供的 OpenStack 私有云平台 xff0c 在当前租户下 xff0c 使用 CentOS7 9 镜像 xff0c 创建两台云主机 xff0
  • 树莓派:使用VNC+远程桌面登录+一些无法登录问题及解决

    目录 一 VNC登录1 下载VNC2 VNC登录操作2 VNC无法登录的问题以及解决方法 xff01 二 xrdp远程桌面登录 xff08 建议 xff1a 如果VNC可以进去 xff0c 建议不要捣鼓远程桌面 xff0c 二者选其一 xf
  • 【算法基础三】算法如何入门?零基础入门算法应该学些什么?

    作者简介 xff1a 大家好 我是新小白2022 xff0c 让我们一起学习 xff0c 共同进步吧 xff01 x1f3c6 x1f4c3 个人主页 xff1a 新小白2022的CSDN博客 x1f525 系列专栏 xff1a 算法基础入
  • 51单片机学习:蜂鸣器实验

    实验名称 xff1a 蜂鸣器实验 接线说明 xff1a 实验现象 xff1a 下载程序后蜂鸣器发出声音 xff0c 一段时间后关闭 注意事项 xff1a include 34 reg52 h 34 typedef unsigned int
  • isalnum()

    isalnum 判断一个字符是否是字母或数字 int isalnum int c isalnum 函数用来检测一个字符是否是字母或者十进制数字 如果仅仅检测一个字符是否是字母 xff0c 可以使用 isalpha 函数 xff1b 如果仅仅
  • 云计算与大数据实验五 MapReduce编程

    一 实验目的 了解Mapper类 xff0c Reducer类和Job类 掌握什么是MapReduce及使用MapReduce进行运算 掌握挖掘父子辈关系 xff0c 给出祖孙辈关系的表格 二 实验内容 使用Map Reduce计算班级中年
  • 获取网页相关图片

    获取网页上相关图片 span class token operator span span class token operator span span class token operator span coding span class