无法在 urllib.request 中使用 https 代理

2024-04-13

我使用 python 创建了一个脚本urllib.request申请https其中的代理。我尝试过如下操作，但遇到了不同类型的问题，如urllib.error.URLError: <urlopen error [WinError 10060] A connection attempt failed----。该脚本应该从该站点获取 IP 地址。脚本中使用的 IP 地址是占位符。我已采纳了所提出的建议here https://stackoverflow.com/a/34577116/9189799.

第一次尝试：

import urllib.request
from bs4 import BeautifulSoup

url = 'https://whatismyipaddress.com/proxy-check'

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'}
proxy_host = '60.191.11.246:3128'

req = urllib.request.Request(url,headers=headers)
req.set_proxy(proxy_host, 'https')
resp = urllib.request.urlopen(req).read()
soup = BeautifulSoup(resp,"html5lib")
ip_addr = soup.select_one("td:contains('IP')").find_next('td').text
print(ip_addr)

另一种方式（使用os.environ):

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'}
proxy = '60.191.11.246:3128'

os.environ["https_proxy"] = f'http://{proxy}'
req = urllib.request.Request(url,headers=headers)
resp = urllib.request.urlopen(req).read()
soup = BeautifulSoup(resp,"html5lib")
ip_addr = soup.select_one("td:contains('IP')").find_next('td').text
print(ip_addr)

我尝试过的另一种方法：

agent = 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'
proxy_host = '205.158.57.2:53281'
proxy = {'https': f'http://{proxy_host}'}

proxy_support = urllib.request.ProxyHandler(proxy)
opener = urllib.request.build_opener(proxy_support)
urllib.request.install_opener(opener)
opener.addheaders = [('User-agent', agent)]
res = opener.open(url).read()

soup = BeautifulSoup(res,"html5lib")
ip_addr = soup.select_one("td:contains('IP')").find_next('td').text
print(ip_addr)

如何以正确的方式在 urllib.request 中使用 https 代理？

当我们测试代理时，有来自您的计算机网络的异常流量 https://support.google.com/websearch/answer/86640?hl=en对于 Google 服务，这就是响应错误的原因，因为WhatismyIP地址 https://whatismyipaddress.com/proxy-check使用 Google 的服务。但该问题并未影响 stackoverflow 等其他网站。

from urllib import request
from bs4 import BeautifulSoup

url = 'https://whatismyipaddress.com/proxy-check'

proxies = {
    # 'https': 'https://167.172.229.86:8080',
    # 'https': 'https://51.91.137.248:3128',
    'https': 'https://118.70.144.77:3128',
}

user_agent = 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'
headers = {
    'User-Agent': user_agent,
    'accept-language': 'ru,en-US;q=0.9,en;q=0.8,tr;q=0.7'
}

proxy_support = request.ProxyHandler(proxies)
opener = request.build_opener(proxy_support)
# opener.addheaders = [('User-Agent', user_agent)]
request.install_opener(opener)

req = request.Request(url, headers=headers)
try:
    response = request.urlopen(req).read()
    soup = BeautifulSoup(response, "html5lib")
    ip_addr = soup.select_one("td:contains('IP')").find_next('td').text
    print(ip_addr)
except Exception as e:
    print(e)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

无法在 urllib.request 中使用 https 代理的相关文章

在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

git push 忽略 cocoapods

我开发 iOS 应用程序已有几个月了现在我想将其推送到 bitBucket 上问题是 git push 忽略与 cocoapods 相关的所有文件例如 project xcworkspace Podfile Podfile lock
在页面中多次获取相同数据的最佳方法是什么？

我想在多次从 MySQL 获取数据的页面中显示相同的数据首先我想使用MySQL从MySQL获取数据mysql fetch assoc 在 while 循环中然后将其显示为菜单第二次我想在页脚中显示与站点地图相同的数据我现在正在打电话
Ember Data：重写 Save 方法

您好 Ember 数据世界我一直在研究自定义适配器试图找出如何覆盖保存方法根据我的理解你似乎需要做这样的事情 DS RESTAdapter extend save function return this super 但是当我尝试
Bootstrap 4 多个固定顶部导航栏

Bootstrap 4 中是否可以有多个固定顶部导航栏相互显示 1 目前覆盖了另一个这不是我想要的是的这是可能的但你必须相应地定位第二个导航栏的高度约为 56 像素 fixed top 2 margin top 56px body
阿迪和苏比之间到底是什么“关系”？

我应该回答这个问题经过一番研究后发现 add 和 sub 具有相同的操作码仅在功能领域有所不同这是答案还是其他什么 Update Nios II CPU 手册中提供了它 subi subtract immediate Operatio
如何配置 jshint 才不会出现错误“之前换行错误”？

它给了我错误之前的错误换行因为我有如下代码 var one 1 two 2 three 3 如果我把在行的末尾而不是下一行的开头它不会抱怨但我想这样编码有什么办法可以让它不显示此警告吗我虽然看了JSHint 的选项 http
使用 MediaCodec 截断视频

我使用Android MediaCodec库对视频文件进行转码主要是改变分辨率示例代码在这里 https stackoverflow com questions 29943121 mediamuxer video compression
sc.textFile 之后的 zipWithIndex 会给出正确的行号吗？

说如果我这样做如下所示 val rdd sc textFile someFile txt val rddWithLines rdd zipWithIndex zipWithIndex 添加的索引是否对应于输入文件中的行号第一行当然是 0
Powershell：递归替换目录的选择子文件中的字符串

我在 Windows XP 上使用 Powershell 并尝试编写一个命令来 1 read all bat cfg and config files 2 replace a string it s actually the path th
尝试对变量列表进行所有操作组合

我有一个值列表例如 values 1 2 3 4 我想尝试此列表中的所有组合例如 1 2 1 3 1 4 1 2 1 3 1 4 1 2 3 1 2 4 1 3 4 etc 以最简洁的方式获得所有这些可能的操作组合的最直接的方法是什么
Mongodb子文档之间的多对多关系

TL DR 想象一下第一个 match 阶段给了你几个文档但你想要refine他们在里面就像 redact做但问题是你的子文档有关系而你想要 where就像他们之间的检查一样怎样才能做到这一点呢我无法 unwind 因为它会导致
RxJava 中的 n 元笛卡尔积

现在我持有一个Observable
算术恒等式和 EFLAGS

因为 x not x 1 意味着 a b a not b 1 那么 sub rax rcx 相当于 mov temp rcx not temp add rax temp add rax 1 其中 temp 是一些被认为是易失性的寄存器换句
在“UITableView”中选择行时调用新视图

我目前正在编写我的第一个 iPhone 应用程序但遇到了问题我有一个包含 UITableView 的视图这是我第一次尝试这样做这是我试图实现的行为当用户选择其中一行时我希望调用一个新视图将用户带到另一个页面显示参考他们选择的
iOS 16 FairPlay 变化

FairPlay 逻辑有任何变化吗我的应用程序具有受 FairPlay 保护的视频和音频它们在 iOS 15 7 之前完美运行但在 iOS 16 中 makeStreamingContentKeyRequestData is thro
如何通过 JavaScript 文件将所有 JavaScript 文件包含在目录中？

我有一堆 JavaScript 文件我想将它们包含在页面中但我不想继续编写那么有没有办法包含目录中的所有文件大小未知我可以做一些像 getScript js js 获取 js 目录中的所有 JavaScript 文件我怎样才能使
访问网络驱动器上的文件

背景我有一个必须从网络驱动器 Z 上的文件读取的应用程序这在我的办公室域中工作得很好但是它在现场在不同的域中不起作用据我所知域用户和网络驱动器的设置方式相同但是我无权访问客户域中的用户等当我无法访问网络驱动器时我想我需要
如何使用Android 4.4中出现的ImageReader？

Android 4 4 Kit Kat 推出了图像读取器 http developer android com reference android media ImageReader html用于访问 Surface 中的图像的类对于实时
如何在 Rails 应用程序的数据库/模型中存储营业时间？

我正在创建一个 Rails 应用程序它将存储企业的营业时间和营业时间最初我想到简单地使用文本数据类型并使其成为自由格式 Monday to Friday 9am to 5pm Saturday 11am to 4pm Closed S
无法在 urllib.request 中使用 https 代理

我使用 python 创建了一个脚本urllib request申请https其中的代理我尝试过如下操作但遇到了不同类型的问题如urllib error URLError

无法在 urllib.request 中使用 https 代理

无法在 urllib.request 中使用 https 代理 的相关文章

随机推荐

热门标签

无法在 urllib.request 中使用 https 代理的相关文章