Python请求错误10060

2023-11-30

我有一个抓取网站的脚本。直到今天它运行完美，但现在不这样做了。

它给中小企业以下错误：

 Connection Aborted Error(10060 ' A connection attempt failed becvause the connected party did not properly respond after a period of time, or established a connection failed because connected host has failed to respond'

我一直在研究答案和设置，但我不知道如何解决这个问题......

在 IE 中，我没有使用任何代理（连接 -> LAN 设置 -> 代理 = 已禁用）

它在这段代码中中断，有时是第一次运行，有时是第二次......等等

def geturls(functionurl, runtime):
startCrawl = requests.get(functionurl, headers=headers)
mainHtml = BeautifulSoup(startCrawl.content, 'html.parser')
mainItems = mainHtml.find("div",{"id": "js_multiselect_results"})
for tag in mainItems.findAll('a', href=True):
    tag['href'] = urlparse.urljoin(url,tag['href'])
    if shorturl in tag['href'] and tag['href'] not in visited:
        if any(x in tag['href'] for x in keepout):
            falseurls.append(tag['href'])
        elif tag['href'] in urls:
            doubleurls.append(tag['href'])
        else:
            urlfile.write(tag['href'] + "\n")
            urls.append(tag['href'])

totalItemsStart = str(mainHtml.find("span",{"id": "sab_header_results_size"}))
if runtime == 1:
    totalnumberofitems[0] = totalItemsStart
    totalnumberofitems[0] = strip_tags(totalnumberofitems[0])
return totalnumberofitems

我怎样才能解决这个问题？

尝试增加timeout你的参数requests.get方法：

requests.get(functionurl, headers=headers, timeout=5)

但很可能您的脚本被服务器阻止以防止报废尝试。如果是这种情况，您可以尝试通过设置适当的标头来伪造网络浏览器。

{"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)", "Referer": "http://example.com"}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

webcrawler

pythonrequests

urllib

Python请求错误10060 的相关文章

将 ical 附件的邮件消息的内容类型设置为“text/calendar; method=REQUEST”

我正在尝试使用 App Engine 邮件 API 从 App Engine 发送 iCalendar 格式的 ics 文件这在 GMail 中非常有效但是 Outlook 无法识别该文件我认为问题在于内容类型设置为文本日历而不
函数名称未定义

我有一段代码看起来像这样 if name main main def main print hello 但是当我尝试运行此代码时出现错误 NameError 名称 main 未定义我是否没有在函数 def main 的第一行定义名称
pandas read_csv 之前预处理数据文件

我使用 SAP 的数据输出但它既不是 CSV 因为它不引用包含其分隔符的字符串也不是固定宽度因为它具有多字节字符它是一种固定宽度字符为了将其放入 pandas 我当前读取文件获取分隔符位置对分隔符周围的每一行进行切片然后
在 Python 中延迟转置列表

所以我有一个延迟生成的可迭代的三元组我试图弄清楚如何将其转换为 3 个可迭代对象分别由元组的第一个第二个和第三个元素组成然而我希望这件事能懒惰地完成所以举例来说我希望 1 2 3 4 5 6 7 8 9 将变成 1 4 7
如何在Python + Selenium中获取元素的值

我在我的 Python 3 6 3 代码中得到了这个 HTML 元素作为 Selenium网页元素当然 span class ocenaCzastkowa masterTooltip style color 000000 alt 5 sp
如何在plotly（python）中的刻度标签和图形之间添加空格？

如果我使用绘图创建水平条形图则每个条形的标签都与图表相对应我想在标签和图表之间添加一些空间填充边距我怎样才能做到这一点 Example import plotly offline as py import plotly graph
对法语文本进行词形还原[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一些法语文本需要以某种方式进行处理为此我需要首先将文本标记为单词然后对这些单词进行词形还原以避免多次处理相同的词根据我
将列表值转换为 pandas 中的行

我有数据帧其中一列具有相同长度的 numpy ndarray 值 df list 0 Out 92 array 0 0 0 0 29273096 0 30691767 0 27531403 我想将这些列表值转换为数据框并从 df iloc
cxfreeze virtualenv 中缺少 distutils 模块

从 python3 2 项目运行 cxfreeze 二进制文件时我收到以下运行时错误 project dist project distutils init py 13 UserWarning The virtualenv distuti
Python 中“is”运算符的语义是什么？

如何is运算符确定两个对象是否相同它是如何工作的我找不到它的记录来自文档 http docs python org reference datamodel html 每个对象都有一个身份一个类型和一个值对象的身份一旦发生就永远
使用 python 从 CSV 创建字典

我有一个 CSV 格式的文件其中 A B 和 C 是标题我如何以Python方式将此CSV转换为以下形式的字典 A 1 B 4 C 7 A 2 B 5 C 8 A 3 B 6 C 9 到目前为止我正在尝试以下代码 import csv
尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
Pandas 中每列的曲线拟合 + 外推值

我有一个包含大约 300 列的数据集每一列都与深度相关 Pandas DataFrame 的简化版本看起来像这样 import matplotlib pyplot as plt import numpy as np import pand
类变量：“类列表”与“类布尔值”[重复]

这个问题在这里已经有答案了我不明白以下示例的区别一次类的实例可以更改另一个实例的类变量而另一次则不能示例1 class MyClass object mylist def add self self mylist append 1
Pygame：有人可以帮我实现双跳吗？

我知道已经有其他关于此问题的帖子了但我的运动系统与我发现的有点不同所以随后我问这个问题我的运动系统基于一个名为的命名元组Move up left right down 然后就是这个 def update self move block
机器学习的周期性数据（例如度角 -> 179 与 -179 相差 2）

我使用 Python 进行核密度估计并使用高斯混合模型对多维数据样本的可能性进行排名每一条数据都是一个角度我不确定如何处理机器学习的角度数据的周期性首先我通过添加 360 来删除所有负角因此所有负角都变成了正角 179 变成了
列表中的特定范围（python）

我有一个从文本字符串中提取的整数列表因此当我打印该列表我称之为test I get 135 2256 1984 3985 1991 1023 1999 我想打印或制作一个仅包含特定范围内的数字的新列表例如1000 2000之间我尝试
如何将 django ModelForm 字段显示为不可编辑

接受我的初步教训django ModelForm 我想让用户能够编辑博客中的条目 BlogEntry has a date postedTime title and content 我想向用户展示一个编辑表单其中显示所有这些字段但仅包含
为数据集生成随机 JSON 结构排列

我想生成 JSON 结构的许多不同排列作为同一数据集的表示最好不需要对实现进行硬编码例如给定以下 JSON name smith occupation agent enemy humanity nemesis neo 应该产生许多不同
如何仅读取 CSV 文件每行的第一列 [重复]

这个问题在这里已经有答案了如何在Python中读取CSV文件每行的第一列我的数据是这样的 1 abc 2 bcd 3 cde 我只需要循环第一列的值另外当我在 calc 中打开 csv 文件时每行中的数据都在同一个单元格中这正常

随机推荐

使用 Ruby 对字符串中的字符进行转义

给定以下格式的字符串 Posterous API 以这种格式返回帖子 s u003Cp u003E 我怎样才能将它转换为实际的ascii字符这样s p 在 OSX 上我成功地使用了Iconv iconv ascii java s 但一旦
使用 Spring AOP 触发了哪个接口（扩展 CrudRepository）的删除方法？

Repository public interface UserRepository extends JpaRepository
Visual Studio 不再打开 Winforms 的图形编辑器

我正在构建非常小的 15 分钟应用程序它可以帮助我和我的同事完成简单的日常业务工作为此我经常使用 WinForm 因为它非常快只需制作一个带有 2 个文本框和一个提交按钮的窗口不幸的是最近我想我按下了一个按钮图形编辑器将不再打
如何在android中获取准确的UTC时间戳

我不知道哪一个适合获取 UTC 时间我的代码是 System currentTimeMillis 对于 java 安卓国际化的结果正确吗也许用户可以更改设备时间并且结果会有所不同对UTC有影响吗在Linux平台上系统时钟应设置为
在本地 NTFS 驱动器上查找回收站

我正在尝试编写一些简单的代码该代码将返回本地驱动器上回收站的目录看起来很简单谷歌上应该有一千个答案还没找到我发现 FAT 和 NTFS 驱动器具有不同的基本名称 RECYCLED 和 RECYCLER 我发现回收站是一个虚拟文
Kmeans 对 pandas 数据框中的每个组进行聚类并分配聚类

我想通过使用 kmeans 聚类对组月的 X2 和 X3 进行聚类我需要对两个变量进行聚类另外我想根据每个簇的平均值将簇 0 簇 1 和簇 2 分配为强平均弱最高意味着强簇下面是我的示例数据集 df pd DataFrame
如何将 JSON null 反序列化为 NullNode 而不是 Java null？

注意杰克逊 2 1 x 问题很简单但到目前为止我找不到解决方案我浏览了现有文档等但找不到答案基类是这样的 JsonTypeInfo use Id NAME include As PROPERTY property op JsonS
使用自定义 Cordova 插件将本机 iOS 事件绑定到 webView

我必须创建一个插件来捕获 iOS 应用程序的 Cordova webView 中发生的事件并触发应用程序本机部分中的操作反之亦然我已关注本教程它工作完美当我尝试将其适应另一个应用程序时我希望它比教程更通用它从 webView 到本
mysql 查询 - 输出的日期格式？

在我的表中日期存储如下 2011 03 03T13 30 00 我正在尝试输出这样的日期 2011 年 3 月 3 日下午 1 30 我更愿意将其放入查询中而不是使用 php 来格式化它但我在这方面遇到了一些困难尝试 DATE FO
R：有什么方法可以在 Windows 中自动更新我的 R 吗？

是啊我懒得去下载最新版本的包了我想知道如何设置我的 R 或者是否有一些代码可以让我在 Windows 中自动更新我的 R 如有任何帮助我们将不胜感激也许这会帮助你解决你的问题 installing loading the packa
如何以编程方式获取美国州际公路出口的纬度和经度？

有没有办法使用开源地图 API Google Map API Microsoft Live Map API 来做到这一点或者有没有办法从地图文件遍历道路和交叉路口如果我购买商业地图数据 Thanks 编辑开源或API 基于 opens
如何在 React 中引用本地图像？

如何从本地目录加载图像并将其包含在reactjs img src tag 我有一张图片叫one jpeg在与我的组件相同的文件夹中我尝试了两者 img src one jpeg and img src 在我里面render功能正常但是图
为什么当类返回 Lambda 时反射不起作用

我遇到了一种有点奇怪的行为我使用注释来标记具有特定用途的某些类然后使用 org reflections 库查找具有特定注释的所有类然而当一个类实现一个返回 lambda 函数的方法时反射将不再找到带注释的类类的签名没有改变注释
如何自定义 Jersey JAXB 序列化的 XML 输出

我有一些 javax xml bind annotation Xml 带注释的类用于 REST Web 服务 Jersey 设置在 Spring 管理的 Web 容器中并且 Web 服务返回格式良好的 xml 我们使用 maven en
Joomla 登录重定向回上一页

我有某些页面需要用户登录 Joomla 当他们单击这些页面的链接时 iframe 覆盖层中会出现一个登录框一旦他们登录我想将他们重定向回他们尝试登录的页面但是 Joomla 似乎只允许用户重定向到登录表单参数中预定义的页面有没有办法
通过单独的任务更新 BindingSource 中的元素

我有一个类比如 Person 有一个 ID 和一个名字此类正确实现了 INotifyPropertyChanged 补充有些人要求Person类我真正的问题是一个更复杂的类我已将其简化为一个相当简单的 POCO 以确保这不是因为我
如何通过 WebAssembly 将 Rust 闭包返回给 JavaScript？

的评论关闭 rs非常棒但是我无法让它从 WebAssembly 库返回闭包我有一个这样的函数 wasm bindgen pub fn start game start time f64 screen width f32 screen h
真实的 iPhone 设备上有类似“getStreamsToHost”的东西吗？

我想使用苹果的示例代码将 NSOutputStream 写入服务器 NSURL website NSURL URLWithString str IP NSHost host NSHost hostWithName website host
如何使用文本框中的 onchange() 事件获取旧值

我有一个文本输入当页面加载时一个值会被填充到其中如果用户更改文本框中的任何内容那么我想获取更改后的值新值和旧值但打电话ELEMENT value它只返回更改的新的值我如何获得旧值这是我的代码
Python请求错误10060

我有一个抓取网站的脚本直到今天它运行完美但现在不这样做了它给中小企业以下错误 Connection Aborted Error 10060 A connection attempt failed becvause the connec

Python请求错误10060

Python请求错误10060 的相关文章

随机推荐

热门标签