python爬取4399页面

2023-05-16

提示：该段代码只可爬取4399页面的代码和图片，适合新手爬虫入门学习

python爬取4399页面

代码
总结

代码

代码如下：

import urllib.request
import re
import webbrowser
import requests
from urllib.request import urlopen#用于获取网页
from bs4 import BeautifulSoup#用于解析网页
res=requests.get('http://www.4399.com/')
res.raise_for_status()#查看状态判断异常
f=open('C:\\Users\\YANGNAI\\Documents\\4399页面.txt',"wb")#抓取的网页代码保存位置
for chunk in res.iter_content(100000):
    f.write(chunk)
m=input()
webbrowser.open(m)
url="http://www.4399.com/" #4399的网站

respose1=urllib.request.urlopen(url)
page=respose1.read()
listurl=re.findall(r'http://[a-zA-Z0-9\._/]+\.jpg',str(page))
i=0
for u in listurl :
 print('正在下载中...')
 f=open('C:\\Users\\YANGNAI\\Pictures\\Camera Roll\\'+str(i)+'个.jpg',"wb+")#抓取网页上的图片并保存
 rep= urllib.request.urlopen(u)
 buf= rep.read()
 f.write(buf)
 print("下载完成"+str(i)+"张图片")
 i+=1
print("全部下载完成")
html = urlopen('http://www.4399.com/')
bsObj = BeautifulSoup(html, 'html.parser')
t1 = bsObj.find_all('a')
for t2 in t1:
    t3 = t2.get('href')
    print(t3)

总结

文件保存的地址根据个人进行设置，python模块记得下载，根据名称pip install xxx就可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

4399

python爬取4399页面的相关文章

Spark 请求最大计数

我是 Spark 的初学者我尝试请求允许我检索最常访问的网页我的要求如下 mostPopularWebPageDF logDF groupBy webPage agg functions count webPage alias cntW
Python中Decimal类型的澄清

每个人都知道或者至少每个程序员都应该知道 http docs oracle com cd E19957 01 806 3568 ncg goldberg html 即使用float类型可能会导致精度错误然而在某些情况下精确的解决方
django_openid_auth TypeError openid.yadis.manager.YadisServiceManager 对象不是 JSON 可序列化

I used django openid auth在我的项目上一段时间以来它运行得很好但今天我测试了该应用程序并遇到了这个异常 Environment Request Method GET Request URL http local
Python - 将宽字符字符串从二进制文件转换为 Python unicode 字符串

这是漫长的一天我有点困惑我正在读取一个包含大量宽字符字符串的二进制文件我想将它们转储为 Python unicode 字符串为了解压非字符串数据我使用 struct 模块但我不知道如何对字符串执行相同的操作例如阅读系列一
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f

随机推荐

ubuntu 16.04挂载磁盘，开机丢失

一般磁盘可能要先格式化为指定格式 sudo mkfs t ext4 dev sdb1 直接mount磁盘分区 xff0c 比如 sudo mount dev sdb1 var 当时起作用了 xff0c 但是reboot之后 xff0c 就会
stm32使用外部flash w25Q128实现读写操作

前言数据保存是所有项目的基本功能 xff0c 但是对于STM32C8T6的原flash进行操作 xff0c 一方面大小有可能不够 xff0c 另一方面单片机的运行程序本来就放在这个里面 xff0c 所以还是外接的好这里选用w25Q128
Keil（MDK）STM32和51版本详细安装

前言保姆级教程 xff0c 多次反复安装 xff0c 实测可用链接包失效可留言安装注意 keil公司被ARM公司收购 xff0c 收购后就改名MDK xff0c 所以keil的下载包也是以MDK命名安装路径不能带有中文目录不能和5
STM32 使用LCD12864显示屏（串行方式）

LCD12864 简介 12864LCD液晶显示模块是一款4位 8位并行 2线或3线接口方式 xff0c 内部含有国际一级二级简体中文字库的图形点阵液晶模块显示分辨率为12864 xff0c 内置8198个1616点汉字 xff0c 和
快速学习C语言指针操作

一了解底层指针说到底是在对数据进行操作先了解数据的存储 xff0c 看看指针操作的位置一位数据的存储 xff1a 将一位数据置1 xff0c 如图所示 xff0c 首先地址位需要置1 xff0c 再将数据输入位置1 xff0c 那么
MG90S 舵机180°角度驱动

MG90S简介舵机 xff1a 是一种角度伺服电机 xff0c 一般是由齿轮组电位器舵机控制电路直流电机构成由发送控制信号来控制输出轴的位置数字舵机与模拟舵机的区别 xff1a MG90S是一款常用的数字舵机 xff0c 还有一
MPU6050 6轴姿态传感器的分析与使用（一）

一 MPU6050简介 MPU6050是一个6轴姿态传感器 xff08 3轴加速度计和3轴陀螺仪传感器 xff09 xff0c 可以测量芯片自身X Y Z轴的加速度角度参数 xff0c 通过数据融合 xff0c 可以得到姿态角二简介分
基于51单片机的步进电机驱动，亲测无误

文章目录前言一我们该如何实现电机驱动 xff1f 二驱动实现1 硬件准备2 软件编写3 实物总结前言这一次要分享的项目是最近接单做的一个小玩意儿 xff0c 基于51单片机的步进电机驱动最近积压了两个月的小项目会在后面陆续发出
对 string 类的输入（直接看总结）

一简述 cin get 和 cin getline 解决 char 中的问题 xff0c 遇到换行符时才停止对于 string 类 xff0c 不能使用cin get 和cin getline 进行输入 xff0c 会报错 xff0c
C++中字符串的比较（针对C-风格字符串）

一简述在头文件 lt cstring gt 中 xff0c 有一个函数strcmp 二详细介绍 strcmp 比较字符串格式为 strcmp const char Str1 const char Str2 xff0c 由此可见 xf
关于文件结束符EOF

一简述我们知道 xff0c C 43 43 中可以通过cin xff0c cin get xff0c cin getline xff0c getline 等对字符串进行输入 xff08 若对这些输入模糊 xff0c 可以阅读这篇文章 x
ubuntu 1810上snap安装nextcloud

尝试在ubuntu1810上安装nextcloud 因为服务器配置好了xrdp远程访问 xff0c 所以直接准备在sofware center进行安装安装了半天却提示 unable to install nextcloud snap xx
关于cout 输出 char 型字符 ++ch和 ch+1 不同的结果（直接看详解）

一简述今天在做练习题时注意到了之前所没有注意到的问题 xff1a 若给同样的 ch xff0c cout lt lt 43 43 ch 与 cout lt lt ch 43 1 输出后的结果不一样浅思之后明白了 xff0c 其实这个现
C++定义与声明

一简述什么是定义 xff1f 什么是说明 xff1f 相信很多小伙伴都对这两个概念模糊不清 xff0c 下面我就对其简单介绍一下二详细说明定义全称为定义声明 xff0c 给变量分配空间声明全称为引用声明 xff0c 不给变量
MySQL学习日记（六）用户管理、权限安全

文章目录用户管理和权限安全1 user权限表1 1 用户列1 2 权限列1 3 安全列1 4 资源控制列 2 其他权限表 xff08 db tables priv columns priv procs priv xff09 2 1 db表
Linux上的网络配置——bonding配置

网络接口配置bonding Bonding 将多块网卡绑定同一IP地址对外提供服务 xff0c 可以实现高可用或者负载均衡直接给两块网卡设置同一IP地址是不可以的通过bonding xff0c 虚拟一块网卡对外提供连接 xff0c 物理
python--直接通过cmd找到pip所安装库的位置

https blog csdn net weixin 44345862 article details 87003478
家中闲置旧电脑改装家用NAS（入门教程）

家中闲置旧电脑改装家用NAS xff08 纯小白入门教程 xff09 什么是NAS xff1f NAS的基本知识在国内的常用品牌 NAS品牌的配置问题作者的硬件配置装机正文准备工作旧电脑的准备工作 xff08 已经完成或无这方面问题的可跳
适用于 Linux 的 Windows 子系统（WSL）

适用于 Linux 的 Windows 子系统 xff08 WSL xff09 描述什么是适用于 Linux 的 Windows 子系统系统要求Windows 10 Windows 11 查看计算机系统的版本虚拟化功能启用虚拟化功能禁
python爬取4399页面

提示 xff1a 该段代码只可爬取4399页面的代码和图片 xff0c 适合新手爬虫入门学习 python爬取4399页面代码总结代码代码如下 xff1a import urllib span class token punctuat

python爬取4399页面

python爬取4399页面

代码

总结

python爬取4399页面 的相关文章

随机推荐

热门标签

python爬取4399页面的相关文章