Python请求错误10060

2023-11-30

我有一个抓取网站的脚本。 直到今天它运行完美, 但现在不这样做了。

它给中小企业以下错误:

 Connection Aborted Error(10060 ' A connection attempt failed becvause the connected party did not properly respond after a period of time, or established a connection failed because connected host has failed to respond'

我一直在研究答案和设置,但我不知道如何解决这个问题......

在 IE 中,我没有使用任何代理(连接 -> LAN 设置 -> 代理 = 已禁用)

它在这段代码中中断,有时是第一次运行,有时是第二次......等等

def geturls(functionurl, runtime):
startCrawl = requests.get(functionurl, headers=headers)
mainHtml = BeautifulSoup(startCrawl.content, 'html.parser')
mainItems = mainHtml.find("div",{"id": "js_multiselect_results"})
for tag in mainItems.findAll('a', href=True):
    tag['href'] = urlparse.urljoin(url,tag['href'])
    if shorturl in tag['href'] and tag['href'] not in visited:
        if any(x in tag['href'] for x in keepout):
            falseurls.append(tag['href'])
        elif tag['href'] in urls:
            doubleurls.append(tag['href'])
        else:
            urlfile.write(tag['href'] + "\n")
            urls.append(tag['href'])

totalItemsStart = str(mainHtml.find("span",{"id": "sab_header_results_size"}))
if runtime == 1:
    totalnumberofitems[0] = totalItemsStart
    totalnumberofitems[0] = strip_tags(totalnumberofitems[0])
return totalnumberofitems

我怎样才能解决这个问题?


尝试增加timeout你的参数requests.get方法 :

requests.get(functionurl, headers=headers, timeout=5)

但很可能您的脚本被服务器阻止以防止报废尝试。如果是这种情况,您可以尝试通过设置适当的标头来伪造网络浏览器。

{"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)", "Referer": "http://example.com"}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python请求错误10060 的相关文章

  • 将 ical 附件的邮件消息的内容类型设置为“text/calendar; method=REQUEST”

    我正在尝试使用 App Engine 邮件 API 从 App Engine 发送 iCalendar 格式的 ics 文件 这在 GMail 中非常有效 但是 Outlook 无法识别该文件 我认为问题在于内容类型设置为 文本 日历 而不
  • 函数名称未定义

    我有一段代码 看起来像这样 if name main main def main print hello 但是 当我尝试运行此代码时 出现错误 NameError 名称 main 未定义 我是否没有在函数 def main 的第一行定义名称
  • pandas read_csv 之前预处理数据文件

    我使用 SAP 的数据输出 但它既不是 CSV 因为它不引用包含其分隔符的字符串 也不是固定宽度 因为它具有多字节字符 它是一种 固定宽度 字符 为了将其放入 pandas 我当前读取文件 获取分隔符位置 对分隔符周围的每一行进行切片 然后
  • 在 Python 中延迟转置列表

    所以 我有一个延迟生成的可迭代的三元组 我试图弄清楚如何将其转换为 3 个可迭代对象 分别由元组的第一个 第二个和第三个元素组成 然而 我希望这件事能懒惰地完成 所以 举例来说 我希望 1 2 3 4 5 6 7 8 9 将变成 1 4 7
  • 如何在Python + Selenium中获取元素的值

    我在我的 Python 3 6 3 代码中得到了这个 HTML 元素 作为 Selenium网页元素当然 span class ocenaCzastkowa masterTooltip style color 000000 alt 5 sp
  • 如何在plotly(python)中的刻度标签和图形之间添加空格?

    如果我使用绘图创建水平条形图 则每个条形的标签都与图表相对应 我想在标签和图表之间添加一些空间 填充 边距 我怎样才能做到这一点 Example import plotly offline as py import plotly graph
  • 对法语文本进行词形还原[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一些法语文本需要以某种方式进行处理 为此 我需要 首先 将文本标记为单词 然后对这些单词进行词形还原以避免多次处理相同的词根 据我
  • 将列表值转换为 pandas 中的行

    我有数据帧 其中一列具有相同长度的 numpy ndarray 值 df list 0 Out 92 array 0 0 0 0 29273096 0 30691767 0 27531403 我想将这些列表值转换为数据框并从 df iloc
  • cxfreeze virtualenv 中缺少 distutils 模块

    从 python3 2 项目运行 cxfreeze 二进制文件时 我收到以下运行时错误 project dist project distutils init py 13 UserWarning The virtualenv distuti
  • Python 中“is”运算符的语义是什么?

    如何is运算符确定两个对象是否相同 它是如何工作的 我找不到它的记录 来自文档 http docs python org reference datamodel html 每个对象都有一个身份 一个类型 和一个值 对象的身份 一旦发生就永远
  • 使用 python 从 CSV 创建字典

    我有一个 CSV 格式的文件 其中 A B 和 C 是标题 我如何以Python方式将此CSV转换为以下形式的字典 A 1 B 4 C 7 A 2 B 5 C 8 A 3 B 6 C 9 到目前为止我正在尝试以下代码 import csv
  • 尝试校准keras模型

    我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功 有人可以说我做错了什么吗 这是模型代码 def create m
  • Pandas 中每列的曲线拟合 + 外推值

    我有一个包含大约 300 列的数据集 每一列都与深度相关 Pandas DataFrame 的简化版本看起来像这样 import matplotlib pyplot as plt import numpy as np import pand
  • 类变量:“类列表”与“类布尔值”[重复]

    这个问题在这里已经有答案了 我不明白以下示例的区别 一次类的实例可以更改另一个实例的类变量 而另一次则不能 示例1 class MyClass object mylist def add self self mylist append 1
  • Pygame:有人可以帮我实现双跳吗?

    我知道已经有其他关于此问题的帖子了 但我的运动系统与我发现的有点不同 所以随后我问这个问题 我的运动系统基于一个名为的命名元组Move up left right down 然后就是这个 def update self move block
  • 机器学习的周期性数据(例如度角 -> 179 与 -179 相差 2)

    我使用 Python 进行核密度估计 并使用高斯混合模型对多维数据样本的可能性进行排名 每一条数据都是一个角度 我不确定如何处理机器学习的角度数据的周期性 首先 我通过添加 360 来删除所有负角 因此所有负角都变成了正角 179 变成了
  • 列表中的特定范围(python)

    我有一个从文本字符串中提取的整数列表 因此当我打印该列表 我称之为test I get 135 2256 1984 3985 1991 1023 1999 我想打印或制作一个仅包含特定范围内的数字的新列表 例如1000 2000之间 我尝试
  • 如何将 django ModelForm 字段显示为不可编辑

    接受我的初步教训django ModelForm 我想让用户能够编辑博客中的条目 BlogEntry has a date postedTime title and content 我想向用户展示一个编辑表单 其中显示所有这些字段 但仅包含
  • 为数据集生成随机 JSON 结构排列

    我想生成 JSON 结构的许多不同排列作为同一数据集的表示 最好不需要对实现进行硬编码 例如 给定以下 JSON name smith occupation agent enemy humanity nemesis neo 应该产生许多不同
  • 如何仅读取 CSV 文件每行的第一列 [重复]

    这个问题在这里已经有答案了 如何在Python中读取CSV文件每行的第一列 我的数据是这样的 1 abc 2 bcd 3 cde 我只需要循环第一列的值 另外 当我在 calc 中打开 csv 文件时 每行中的数据都在同一个单元格中 这正常

随机推荐

  • 使用 Ruby 对字符串中的字符进行转义

    给定以下格式的字符串 Posterous API 以这种格式返回帖子 s u003Cp u003E 我怎样才能将它转换为实际的ascii字符 这样s p 在 OSX 上 我成功地使用了Iconv iconv ascii java s 但一旦
  • 使用 Spring AOP 触发了哪个接口(扩展 CrudRepository)的删除方法?

    Repository public interface UserRepository extends JpaRepository
  • Visual Studio 不再打开 Winforms 的图形编辑器

    我正在构建非常小的 15 分钟应用程序 它可以帮助我和我的同事完成简单的日常业务工作 为此 我经常使用 WinForm 因为它非常快 只需制作一个带有 2 个文本框和一个提交按钮的窗口 不幸的是 最近我想我按下了一个按钮 图形编辑器将不再打
  • 如何在android中获取准确的UTC时间戳

    我不知道哪一个适合获取 UTC 时间 我的代码是 System currentTimeMillis 对于 java 安卓 国际化的结果正确吗 也许用户可以更改设备时间并且结果会有所不同 对UTC有影响吗 在Linux平台上 系统时钟应设置为
  • 在本地 NTFS 驱动器上查找回收站

    我正在尝试编写一些简单的代码 该代码将返回本地驱动器上回收站的目录 看起来很简单 谷歌上应该有一千个答案 还没找到 我发现 FAT 和 NTFS 驱动器具有不同的基本名称 RECYCLED 和 RECYCLER 我发现 回收站 是一个虚拟文
  • Kmeans 对 pandas 数据框中的每个组进行聚类并分配聚类

    我想通过使用 kmeans 聚类对组月的 X2 和 X3 进行聚类 我需要对两个变量进行聚类 另外 我想根据每个簇的平均值将簇 0 簇 1 和簇 2 分配为 强 平均 弱 最高意味着强簇 下面是我的示例数据集 df pd DataFrame
  • 如何将 JSON null 反序列化为 NullNode 而不是 Java null?

    注意 杰克逊 2 1 x 问题很简单 但到目前为止我找不到解决方案 我浏览了现有文档等 但找不到答案 基类是这样的 JsonTypeInfo use Id NAME include As PROPERTY property op JsonS
  • 使用自定义 Cordova 插件将本机 iOS 事件绑定到 webView

    我必须创建一个插件来捕获 iOS 应用程序的 Cordova webView 中发生的事件并触发应用程序本机部分中的操作 反之亦然 我已关注本教程它工作完美 当我尝试将其适应另一个应用程序时 我希望它比教程更通用 它从 webView 到本
  • mysql 查询 - 输出的日期格式?

    在我的表中 日期存储如下 2011 03 03T13 30 00 我正在尝试输出这样的日期 2011 年 3 月 3 日下午 1 30 我更愿意将其放入查询中 而不是使用 php 来格式化它 但我在这方面遇到了一些困难 尝试 DATE FO
  • R:有什么方法可以在 Windows 中自动更新我的 R 吗?

    是啊 我懒得去下载最新版本的包了 我想知道如何设置我的 R 或者是否有一些代码可以让我在 Windows 中自动更新我的 R 如有任何帮助 我们将不胜感激 也许这会帮助你解决你的问题 installing loading the packa
  • 如何以编程方式获取美国州际公路出口的纬度和经度?

    有没有办法使用开源地图 API Google Map API Microsoft Live Map API 来做到这一点 或者有没有办法从地图文件遍历道路和交叉路口 如果我购买商业地图数据 Thanks 编辑 开源或API 基于 opens
  • 如何在 React 中引用本地图像?

    如何从本地目录加载图像并将其包含在reactjs img src tag 我有一张图片叫one jpeg在与我的组件相同的文件夹中 我尝试了两者 img src one jpeg and img src 在我里面render功能正常 但是图
  • 为什么当类返回 Lambda 时反射不起作用

    我遇到了一种有点奇怪的行为 我使用注释来标记具有特定用途的某些类 然后使用 org reflections 库查找具有特定注释的所有类 然而 当一个类实现一个返回 lambda 函数的方法时 反射将不再找到带注释的类 类的签名没有改变 注释
  • 如何自定义 Jersey JAXB 序列化的 XML 输出

    我有一些 javax xml bind annotation Xml 带注释的类 用于 REST Web 服务 Jersey 设置在 Spring 管理的 Web 容器中 并且 Web 服务返回格式良好的 xml 我们使用 maven en
  • Joomla 登录重定向回上一页

    我有某些页面需要用户登录 Joomla 当他们单击这些页面的链接时 iframe 覆盖层中会出现一个登录框 一旦他们登录 我想将他们重定向回他们尝试登录的页面 但是 Joomla 似乎只允许用户重定向到登录表单参数中预定义的页面 有没有办法
  • 通过单独的任务更新 BindingSource 中的元素

    我有一个类 比如 Person 有一个 ID 和一个名字 此类正确实现了 INotifyPropertyChanged 补充 有些人要求Person类 我真正的问题是一个更复杂的类 我已将其简化为一个相当简单的 POCO 以确保这不是因为我
  • 如何通过 WebAssembly 将 Rust 闭包返回给 JavaScript?

    的评论关闭 rs非常棒 但是我无法让它从 WebAssembly 库返回闭包 我有一个这样的函数 wasm bindgen pub fn start game start time f64 screen width f32 screen h
  • 真实的 iPhone 设备上有类似“getStreamsToHost”的东西吗?

    我想使用苹果的示例代码将 NSOutputStream 写入服务器 NSURL website NSURL URLWithString str IP NSHost host NSHost hostWithName website host
  • 如何使用文本框中的 onchange() 事件获取旧值

    我有一个文本输入 当页面加载时 一个值会被填充到其中 如果用户更改文本框中的任何内容 那么我想获取更改后的值 新值 和旧值 但打电话ELEMENT value它只返回更改的 新的值 我如何获得旧值 这是我的代码
  • Python请求错误10060

    我有一个抓取网站的脚本 直到今天它运行完美 但现在不这样做了 它给中小企业以下错误 Connection Aborted Error 10060 A connection attempt failed becvause the connec