Python urlparse：小问题

2024-01-09

我正在制作一个解析 html 并从中获取图像的应用程序。使用 Beautiful Soup 解析很容易，下载 html 和图像也可以使用 urllib2。

我确实在使用 urlparse 从相对路径中创建绝对路径时遇到问题。这个问题最好用一个例子来解释：

>>> import urlparse
>>> urlparse.urljoin("http://www.example.com/", "../test.png")
'http://www.example.com/../test.png'

正如你所看到的，urlparse 并没有去掉 ../ 。当我尝试下载图像时，这出现了问题：

HTTPError: HTTP Error 400: Bad Request

有没有办法解决 urllib 中的这个问题？

“..”会带您进入一个目录（“.”是当前目录），因此将其与域名 url 结合起来没有多大意义。也许你需要的是：

>>> urlparse.urljoin("http://www.example.com","./test.png")
'http://www.example.com/test.png'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

urllib2

urlparse

Python urlparse：小问题的相关文章

我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
python 中的代表

我实现了这个简短的示例来尝试演示一个简单的委托模式我的问题是这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
填充两个函数之间的区域

import matplotlib pyplot as plt import numpy as np def domain x np arange 0 10 0 001 f1 lambda x 2 x x 2 0 5 plt plot x
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

控制文件下载

我正在使用 TWebBrowser 为我的程序构建一个更新程序 OnCreate 时 TWebBrowser 导航到给定的 URL 要下载更新用户需要单击链接单击链接时会出现此弹出窗口所以我想知道是否可以绕过该弹出窗口并允许自动下载
JQueryMobile 自动完成点击条目不更改输入值

我尝试使用 jquery mobile 进行自动完成输入所以我在这里找到了一个演示 http demos jquerymobile com 1 4 0 listview autocomplete remote http demos jqu
Java静态导入导致编译错误。可能是编译器错误？

这在 Eclipse JDT 中可以正常编译但在 1 6 30 或 1 7 25 上则不行 package doh import static doh Wtf InnerClass innerclassMethod import java
SQL Server 级联

我正在制作一个网站用户可以在其中发布帖子然后用户可以对这些帖子进行评论我有一个包含 3 个表的数据库一项包含用户信息一项包含帖子信息最后一项包含评论信息我想设置规则以便如果用户被删除他们的所有帖子和评论都会被删除如果
Vue 使用 select、v-for 和 v-model 预选值

我在用着select with v model并有选项v for和对象作为值选项是一些由id标识的元素如何根据自定义相等性预先选择选项在本例中为相等 id场地我正在寻找类似于 angularjs 的东西track by from n
在多级继承中从子类调用“大”父函数[重复]

这个问题在这里已经有答案了 public class GrandParent public void walk public class Parent public void walk public class Child public v
JavaFX 中的样式文本？

我正在将聊天客户端从 Swing 切换到 JavaFX 但遇到了图形问题以前我使用的是JTextPane插入样式文本但切换到 FX 后我找不到能够执行所需操作的单个组件JTextPane做了并且从this https stacko
在对话框中启用 GPS 后 Android 位置返回 null

当我进入屏幕时我会检查 GPS 是否已打开如果未打开则会显示启用 GPS 的对话框当用户单击是时 onActivityResult gt GPS 已打开我尝试获取位置但始终返回 null 当我在 GPS 已打开的情况下进入屏
意外标记“(”与 mv !(build) 附近出现语法错误

我正在尝试使用 Jenkins 构建过程运行以下 shell 命令 mv build build 现在构建失败了 bin bash xe tmp jenkins2925091423898519645 sh tmp jenkins292509
如何使用Pandoc图像对齐来对齐同一行中的两个图像？

从 pandoc 文档我知道如何插入图像 http johnmacfarlane net pandoc README html images http johnmacfarlane net pandoc README html images
在每个视图中包含用户模型

我正在创建一个具有表单身份验证的 ASP NET MVC4 网站但在以正确的方式在视图中包含多个模型时遇到了困难具体来说有一个属于给定视图的模型例如 CartModel 但是考虑到站点的当前 UI 部分视图中使用了一个模型该模型
Helm _helpers.tpl：调用其他模板定义中定义的模板

头盔 helpers tpl Helm 允许使用进行模板化 https golang org pkg text template 在 Kubernetes 的资源文件中一个名为 helpers tpl通常用于使用以下语法定义 Go 模板助
更新 Windows 服务的过程？自动还是手动？

如果我的服务器上有 Windows 服务更新该服务的最佳实践是什么假设其中有一个错误或者我需要向它添加更多功能有没有办法可以关闭服务修补它并以更自动化的方式启动并运行它任何带有代码的链接都很棒好吧你总是可以在安装程序上升
C 标准 I/O 的限制以及为什么我们不能将 C 标准 I/O 与套接字一起使用

我最近在读CSAPP 在10 9节中它说标准I O不应该与socket一起使用原因如下 1 标准I O的限制限制1 输入函数在输出函数之后一个输入如果没有中间调用函数无法跟随输出函数 fflush fseek fsetpos 或
从 Gradle 运行后台作业

我创建了一个启动远程作业的任务例如 task mytask type Exec commandLine ssh args f l me myserver start split 它有效但是它似乎等待作业终止但它永远不会终止也不应该
dev_appserver.py app.yaml 产生： ImportError：导入多数组 numpy 扩展模块失败

我运行这个命令 dev appserver py app yaml 我收到一个错误 Traceback most recent call last File C Users sehrlich AppData Local Google Clo
Javascript：长度方法有效吗？

我正在做一些 javascript 编码我想知道 length 方法是否是预先计算的或者由 JS 引擎记住所以问题是如果我经常检查数组长度并且假设我不更改它通过闭包使其不可变我是否应该预先计算 length 方法并将其存储
如何为生产中的网站设置代理设置

我用 Angular 开发了一个网站并在 proxy conf js 文件中有以下代理设置 const proxyConfig context web api webclients target https 10 109 102 109
Python Pandas 按二级索引（或任何其他级别）切片多索引

有很多关于按级别范围切片多索引的 level 0 的帖子1 http pandas pydata org pandas docs stable advanced html using slicers 但是我找不到解决我的问题的方法也就是
Python urlparse：小问题

我正在制作一个解析 html 并从中获取图像的应用程序使用 Beautiful Soup 解析很容易下载 html 和图像也可以使用 urllib2 我确实在使用 urlparse 从相对路径中创建绝对路径时遇到问题这个问题最好用一个

Python urlparse：小问题

Python urlparse：小问题 的相关文章

随机推荐

热门标签

Python urlparse：小问题的相关文章