python爬取4399页面

2023-05-16

提示:该段代码只可爬取4399页面的代码和图片,适合新手爬虫入门学习

python爬取4399页面

  • 代码
  • 总结


代码

代码如下:

import urllib.request
import re
import webbrowser
import requests
from urllib.request import urlopen#用于获取网页
from bs4 import BeautifulSoup#用于解析网页
res=requests.get('http://www.4399.com/')
res.raise_for_status()#查看状态判断异常
f=open('C:\\Users\\YANGNAI\\Documents\\4399页面.txt',"wb")#抓取的网页代码保存位置
for chunk in res.iter_content(100000):
    f.write(chunk)
m=input()
webbrowser.open(m)
url="http://www.4399.com/" #4399的网站

respose1=urllib.request.urlopen(url)
page=respose1.read()
listurl=re.findall(r'http://[a-zA-Z0-9\._/]+\.jpg',str(page))
i=0
for u in listurl :
 print('正在下载中...')
 f=open('C:\\Users\\YANGNAI\\Pictures\\Camera Roll\\'+str(i)+'.jpg',"wb+")#抓取网页上的图片并保存
 rep= urllib.request.urlopen(u)
 buf= rep.read()
 f.write(buf)
 print("下载完成"+str(i)+"张图片")
 i+=1
print("全部下载完成")
html = urlopen('http://www.4399.com/')
bsObj = BeautifulSoup(html, 'html.parser')
t1 = bsObj.find_all('a')
for t2 in t1:
    t3 = t2.get('href')
    print(t3)


总结

文件保存的地址根据个人进行设置,python模块记得下载,根据名称pip install xxx就可。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python爬取4399页面 的相关文章

随机推荐

  • ubuntu 16.04挂载磁盘,开机丢失

    一般磁盘可能要先格式化为指定格式 sudo mkfs t ext4 dev sdb1 直接mount磁盘分区 xff0c 比如 sudo mount dev sdb1 var 当时起作用了 xff0c 但是reboot之后 xff0c 就会
  • stm32使用外部flash w25Q128实现读写操作

    前言 数据保存是所有项目的基本功能 xff0c 但是对于STM32C8T6的原flash进行操作 xff0c 一方面大小有可能不够 xff0c 另一方面单片机的运行程序本来就放在这个里面 xff0c 所以还是外接的好 这里选用w25Q128
  • Keil(MDK)STM32和51版本详细安装

    前言 保姆级教程 xff0c 多次反复安装 xff0c 实测可用 链接包失效可留言 安装注意 keil公司被ARM公司收购 xff0c 收购后就改名MDK xff0c 所以keil的下载包也是以MDK命名 安装路径不能带有中文 目录不能和5
  • STM32 使用LCD12864显示屏(串行方式)

    LCD12864 简介 12864LCD液晶显示模块是一款4位 8位并行 2线或3线接口方式 xff0c 内部含有国际一级 二级简体中文字库的图形点阵液晶模块 显示分辨率为12864 xff0c 内置8198个1616点汉字 xff0c 和
  • 快速学习C语言指针操作

    一 了解底层 指针说到底是在对数据进行操作 先了解数据的存储 xff0c 看看指针操作的位置 一位数据的存储 xff1a 将一位数据置1 xff0c 如图所示 xff0c 首先地址位需要置1 xff0c 再将数据输入位置1 xff0c 那么
  • MG90S 舵机180°角度驱动

    MG90S简介 舵机 xff1a 是一种角度伺服电机 xff0c 一般是由齿轮组 电位器 舵机控制电路 直流电机构成 由发送控制信号来控制输出轴的位置 数字舵机与模拟舵机的区别 xff1a MG90S是一款常用的数字舵机 xff0c 还有一
  • MPU6050 6轴姿态传感器的分析与使用(一)

    一 MPU6050简介 MPU6050是一个6轴姿态传感器 xff08 3轴加速度计和3轴陀螺仪传感器 xff09 xff0c 可以测量芯片自身X Y Z轴的加速度 角度参数 xff0c 通过数据融合 xff0c 可以得到姿态角 二 简介分
  • 基于51单片机的步进电机驱动,亲测无误

    文章目录 前言一 我们该如何实现电机驱动 xff1f 二 驱动实现1 硬件准备2 软件编写3 实物 总结 前言 这一次要分享的项目是最近接单做的一个小玩意儿 xff0c 基于51单片机的步进电机驱动 最近积压了两个月的小项目会在后面陆续发出
  • 对 string 类的输入(直接看总结)

    一 简述 cin get 和 cin getline 解决 char 中的问题 xff0c 遇到换行符时才停止 对于 string 类 xff0c 不能使用cin get 和cin getline 进行输入 xff0c 会报错 xff0c
  • C++中字符串的比较(针对C-风格字符串)

    一 简述 在头文件 lt cstring gt 中 xff0c 有一个函数strcmp 二 详细介绍 strcmp 比较字符串 格式为 strcmp const char Str1 const char Str2 xff0c 由此可见 xf
  • 关于文件结束符EOF

    一 简述 我们知道 xff0c C 43 43 中可以通过cin xff0c cin get xff0c cin getline xff0c getline 等对字符串进行输入 xff08 若对这些输入模糊 xff0c 可以阅读这篇文章 x
  • ubuntu 1810上snap安装nextcloud

    尝试在ubuntu1810上安装nextcloud 因为服务器配置好了xrdp远程访问 xff0c 所以直接准备在sofware center进行安装 安装了半天却提示 unable to install nextcloud snap xx
  • 关于cout 输出 char 型字符 ++ch和 ch+1 不同的结果(直接看详解)

    一 简述 今天在做练习题时注意到了之前所没有注意到的问题 xff1a 若给同样的 ch xff0c cout lt lt 43 43 ch 与 cout lt lt ch 43 1 输出后的结果不一样 浅思之后明白了 xff0c 其实这个现
  • C++定义与声明

    一 简述 什么是定义 xff1f 什么是说明 xff1f 相信很多小伙伴都对这两个概念模糊不清 xff0c 下面我就对其简单介绍一下 二 详细说明 定义 全称为定义声明 xff0c 给变量分配空间 声明 全称为引用声明 xff0c 不给变量
  • MySQL学习日记(六)用户管理、权限安全

    文章目录 用户管理和权限安全1 user权限表1 1 用户列1 2 权限列1 3 安全列1 4 资源控制列 2 其他权限表 xff08 db tables priv columns priv procs priv xff09 2 1 db表
  • Linux上的网络配置——bonding配置

    网络接口配置bonding Bonding 将多块网卡绑定同一IP地址对外提供服务 xff0c 可以实现高可用或者负载均衡 直接给两块网卡设置同一IP地址是不可以的 通过bonding xff0c 虚拟一块网卡对外提供连接 xff0c 物理
  • python--直接通过cmd找到pip所安装库的位置

    https blog csdn net weixin 44345862 article details 87003478
  • 家中闲置旧电脑改装家用NAS(入门教程)

    家中闲置旧电脑改装家用NAS xff08 纯小白入门教程 xff09 什么是NAS xff1f NAS的基本知识在国内的常用品牌 NAS品牌的配置问题作者的硬件配置 装机正文准备工作旧电脑的准备工作 xff08 已经完成或无这方面问题的可跳
  • 适用于 Linux 的 Windows 子系统 (WSL)

    适用于 Linux 的 Windows 子系统 xff08 WSL xff09 描述什么是 适用于 Linux 的 Windows 子系统 系统要求Windows 10 Windows 11 查看计算机系统的版本 虚拟化功能启用虚拟化功能禁
  • python爬取4399页面

    提示 xff1a 该段代码只可爬取4399页面的代码和图片 xff0c 适合新手爬虫入门学习 python爬取4399页面 代码总结 代码 代码如下 xff1a import urllib span class token punctuat