无法使用 urllib2 从网络保存图像

2023-12-31

我想使用 python 保存网站上的一些图像urllib2但是当我运行代码时它会保存其他东西。

这是我的代码：

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
url = "http://m.jaaar.com/"
r = urllib2.Request(url, headers=headers)
page = urllib2.urlopen(r).read()

soup = BeautifulSoup(page)
imgTags = soup.findAll('img')
imgTags = imgTags[1:]


for imgTag in imgTags:
    imgUrl = "http://www.jaaar.com" + imgTag['src']
    imgUrl = imgUrl[0:-10] + imgUrl[-4:]
    fileName = "khabarnak-" + imgUrl[-12:]
    print fileName

    imgData = urllib2.urlopen(imgUrl).read()
    print imgUrl

    output = open("C:\wamp\www\py\pishkhan\\" + fileName,'wb')
    output.write(imgData)
    output.close()

有什么建议么？

该网站正在向您返回标准图像，因为您正在抓取该网站。检索图像时使用相同的设置标题的“技巧”：

imgRequest = urllib2.Request(imgUrl, headers=headers)
imgData = urllib2.urlopen(imgRequest).read()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

beautifulsoup

urllib2

无法使用 urllib2 从网络保存图像的相关文章

TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
更改 python tkinter canvas 中的线坐标

我画了一条线tkinter Canvas现在我想移动一端这可能吗例如和itemconfig import tkinter tk tkinter Tk canvas tkinter Canvas tk canvas pack line c
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
由于 json 字符串化 dict 键导致数据丢失

考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
如何将回溯/sys.exc_info() 值保存在变量中？

我想将错误名称和回溯详细信息保存到变量中这是我的尝试 import sys try try print x except Exception ex raise NameError except Exception er print 0 s
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
更改 Python Cmd 模块处理自动完成的方式

我有一个 Cmd 控制台设置为自动完成 Magic the Gathering 收藏管理系统的卡牌名称它使用文本参数在数据库中查询卡片并使用结果自动完成建议卡片然而这些卡片名称有多个单词 Cmd 会从last到行尾的空间例如
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X

随机推荐

VSCode C#“转到定义”(F12) 不起作用

我正在使用 VSCode 1 19 并尝试在 C 文件中转到 gt 转到定义就像在 Visual Studio 中一样但它什么也没做在 js 文件中它运行良好我猜测是否有一些解决方法该文件夹中可能有多个项目而 VSCode
NSPredicate 带有 !=?

我有核心数据实体人和边界他们具有多对多的关系每个人可以有多个边界每个边界可以有多个人我正在尝试创建一个列表列出 Fred 也没有关系的界限 Person person Person MR findFirstByAttribute
尝试从 user32.dll 的 GetWindowText() 读取窗口时发生未处理的“System.ExecutionEngineException”类型异常

在我的应用程序中我正在读取同一过程的窗口文本我正在使用 User32 dll 的 GetWindowText 但是当它尝试调用该方法时我收到异常 aaaa exe 中发生了类型为 System ExecutionEngineExcep
Iframe 的标签在 IE8 中不起作用

我得到了这样的 IE 的 HTML 结构 div div
React Native ios 构建失败，显示同一模拟器和相同 UDID 的多个实例，标记为“com.apple.compilers.llvm.clang.1_0.compiler”

2023 04 10 12 54 39 743 xcodebuild 37229 209830 DVTCoreDeviceEnabledState DVTCoreDeviceEnabledState Disabled set via use
SonarQube 不包括文件、目录和生成的代码？

我正在使用的代码库有很多生成的代码此外还有一些我想从 SonarQube 分析中排除的已弃用文件我已经阅读了文档并查看了这里的一些答案但这对我的情况没有帮助我有一个多模块 Maven 项目因此我的工作区中有多个项目它们都是大
Spark MLLib 2.0 管道中的分类特征

我正在尝试构建基于日志文件的决策树某些功能集很大包含数千个唯一值我正在尝试在 Java 中使用管道和数据框架的新习惯用法我为每个分类特征列构建了一个具有多个 StringIndexer 管道阶段的管道然后我使用 VectorAss
使用Spring，为什么H2事务回滚在嵌入式数据库模式下可以正常工作，但在服务器模式下却不能正常工作？

一个简单的 spring 服务其方法执行插入并在插入后抛出运行时异常运行时异常应该导致回滚 Transactional public void insertAndThrowRuntimeEx Order order new Order
Python 2.7 64 位错误地引用 32 位 (x86) 的包含文件

我正在使用 64 位的 Python 2 7 18 进行一些遗留工作例如当 PIP 调用编译器 Python 的 VC 时它会错误地引用 32 位 x86 源来查找包含文件 IC Program Files x86 MySQL MyS
添加上下文来重写规则

在下面的代码中我想重写g f as h如果可能可能有案例h还没有类的实例但我想在可能的情况下进行重写我收到一条错误消息表明这是可以实现的但我不确定我到底需要更改什么这是一些示例代码 LANGUAGE TypeFamilies
当应用程序进入后台时，iOS 外部配件断开连接

我有一个外部配件当应用程序进入后台时它似乎会断开连接有什么办法可以解决这个问题吗在您的应用程序 plist 文件中添加以下标志所需的后台模式应用程序与配件通信此解决方案仅适用于 iOS 5 及更高版本
任何人都可以帮助我理解运行 ngserve (Angular 8) 时 cmd 中的这条消息吗？

当我跑步时ng serve这是输出我无法理解它的含义谁能告诉它是否是一个错误 i wds Project is running at http localhost 4200 webpack dev server i wds webpac
获取 iOS 中当前的设备语言？

我想显示设备用户界面当前使用的语言我会使用什么代码我想要这个作为NSString以完全拼写的格式不是 en US 编辑对于那些路过的人来说这里有大量有用的评论因为答案随着新的 iOS 版本而演变提供的解决方案实际上将返回设备的
C++ 中的类型转换

我正在使用 C 编程原理与实践这本书学习 C 两个月现在我想澄清一些关于我的选角的疑问当我执行隐式转换时例如 char c a int b c 这里 c 的值被隐式转换为 int 类型而不使用任何显式运算符这算不算选角或者当我
如何根据一年中的星期计算每月中的星期？

我找到了一个node js https stackoverflow com questions 33647513 get the week number of the month from week number of the year解决
如何在优先约束编辑器中使用在执行 SQL 任务中创建的变量值？

I need to run n multiple Execute SQL Task based on n multiple variable value isnull true or false This variable is creat
Windows 文件名中的分号

我的一位用户问为什么我的应用程序不支持文件名中的分号我单步执行了我的代码看起来 Windows 功能获取打开文件名截断任何包含分号的文件名例如一二 wav gt 一微软说不允许使用冒号但没有提到分号命名文件路径和命名空间
使 HTML 内容展开以填充窗口

我有一个 HTML 页面垂直分为 Header Body Footer 身体又被水平分为左侧有一个大 DIV 周围有滚动条显示图表的一部分右边有一个表格页眉和页脚是固定高度的正文应垂直扩展以填充窗口中未被页眉和页脚占据的部分同
使用Spring（mvc）进行文件上传和下载

我对 Spring MVC 很陌生但对 Java 并不陌生我正在尝试向数据库上传数据以及从数据库下载数据我在这个网站上做了类似的事情使用 spring mvc 文件上传和下载 https gardiary wordpress com
无法使用 urllib2 从网络保存图像

我想使用 python 保存网站上的一些图像urllib2但是当我运行代码时它会保存其他东西这是我的代码 user agent Mozilla 4 0 compatible MSIE 5 5 Windows NT headers User

无法使用 urllib2 从网络保存图像

无法使用 urllib2 从网络保存图像 的相关文章

随机推荐

热门标签

无法使用 urllib2 从网络保存图像的相关文章