Jsoup SocketTimeoutException：读取超时

2024-02-09

I get a SocketTimeoutException当我尝试使用 Jsoup 解析大量 HTML 文档时。

例如，我得到了一个链接列表：

<a href="www.domain.com/url1.html">link1</a>
<a href="www.domain.com/url2.html">link2</a>
<a href="www.domain.com/url3.html">link3</a>
<a href="www.domain.com/url4.html">link4</a>

对于每个链接，我解析链接到 URL（来自 href 属性）的文档，以获取这些页面中的其他信息。

所以我可以想象这需要很多时间，但是如何关闭这个异常这是整个堆栈跟踪：

java.net.SocketTimeoutException: Read timed out
    at java.net.SocketInputStream.socketRead0(Native Method)
    at java.net.SocketInputStream.read(Unknown Source)
    at java.io.BufferedInputStream.fill(Unknown Source)
    at java.io.BufferedInputStream.read1(Unknown Source)
    at java.io.BufferedInputStream.read(Unknown Source)
    at sun.net.www.http.HttpClient.parseHTTPHeader(Unknown Source)
    at sun.net.www.http.HttpClient.parseHTTP(Unknown Source)
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream(Unknown Source)
    at java.net.HttpURLConnection.getResponseCode(Unknown Source)
    at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:381)
    at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:364)
    at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:143)
    at org.jsoup.helper.HttpConnection.get(HttpConnection.java:132)
    at app.ForumCrawler.crawl(ForumCrawler.java:50)
    at Main.main(Main.java:15)

我想你可以做

Jsoup.connect("...").timeout(10 * 1000).get();

将超时设置为 10 秒。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Jsoup

Jsoup SocketTimeoutException：读取超时的相关文章

如何对由 keycloak 保护的 SpringBoot 控制器进行单元测试？

我知道已经有类似的问题了here https stackoverflow com questions 49144953 mocking a keycloak token for testing a spring controller and
Log4j2 自动配置

我在应用时遇到问题log4j2 xml自动配置正确我认为这与我的文件夹排列有关我在用着maven添加 log4j2 库并按如下方式安排我的项目一个包含所有通用类的项目供我的系统的服务器和客户端使用另一个核心项目服务器端应
将 Spring 的 @Scheduled 注解与特定执行器一起使用

如何告诉我的 Spring 计划方法使用特定的执行器运行例如这是我的 spring 调度程序方法之一 Scheduled fixedRate 1000 public void scheduleJobs doThese 这是我的 Java
如何在gradle中执行jar文件？

当我使用 ant 构建我的 android 项目时我需要这样的任务
合并两个 Jasper 报告

我有一个带有下拉菜单的网络应用程序用户可以从中选择报告可视化的类型报告 1 报告 2 报告 3 等根据所选的报告 Jasper 报告将在服务器上编译并以 PDF 格式的弹出窗口打开在服务器端我使用下面的代码以单独的方法实现每个报告
String.split() 的 ArrayIndexOutOfBoundsException

这是从文件中读取输入的代码该文件包含表单中的学生详细信息roll name age street city zipcode 其中很少有值可以null even 对于以下代码我得到java lang ArrayIndexOutOfBoun
这是重载，不同类中具有相同名称和不同签名的方法吗？

如果我有以下 Java 代码 class A public int add int a int b return a b class B extends A public float add float a float b return a
如何在 Java 中通过 TLS v.1.2 创建安全的 TCP 连接

我想通过 TLS v1 2 在两个系统之间创建通信其中包含的信息是保密的我想避免 https Web 服务调用而直接想在 TCP 层执行消息交换您能否建议如何实现此功能以便我可以通过 TLS v1 2 安全地传输数据 EDIT 阅
用于查看算法花费多长时间的计时器表示我的二分搜索比线性搜索花费的时间更长

这是要点课程https gist github com 2605302 https gist github com 2605302 我已经用不同的文件对其进行了多次测试即使二分搜索进行的比较较少所花费的时间也总是更多出了什么问题 pu
Java：getInstance 与静态

目的是什么getInstance 在Java中在我的研究过程中我一直在读getInstance 有助于实现单例设计模式根据我的理解这意味着整个程序中只有一个实例但我不能只使用静态吗这不是静态的全部意义吗如果我只有静态方法和字段
Hibernate添加带有子实体id的实体

我的对象状态 java Entity Table name STATE public class State Id GeneratedValue strategy GenerationType AUTO private Long id C
JPanel 上的圆形边框

我这里得到的是一个带有圆形边框的 JPanel 其设置如下 panel setBorder new LineBorder PanelColor 5 true 问题是在每个角上都有 2 条从外角到内角的对角不透明线即边框的长度边界后面的
如何将报告导出为 PDF/A-1a、PDF/A-1b？

在 jasper report 中生成 PDF A 包含许多陷阱并且某些版本的 jasper report 不支持这就是为什么我决定通过这个Question Answer 帖子指示将带有图表的简单报告导出为 PDF A 所需的步骤和库
使用三十、LocalDate 获取每月的第一天和最后一天

我有一个 LocalDate 需要获取该月的第一天和最后一天我怎么做 eg 13 2 2014我需要得到1 2 2014 and 28 2 2014 in 本地日期 https docs oracle com javase 8 docs
Android 折叠工具栏在折叠时没有隐藏其他元素

我在 Android 上有一个布局支持设计折叠工具栏其中包含 TextView 但是当我折叠工具栏时一些带有工具栏标题的 TextView 我想隐藏所有其他内容而不是工具栏和标题这是我的布局
如何在 spring-ws 中解析 SoapFaultClientException

我正在使用 spring ws 2 3 1 在为 Web 服务创建客户端时有时我得到SoapFaultClientException像下面这样
jdbcAuthentication() 而不是 inMemoryAuthentication() 不提供访问权限 - Spring Security 和 Spring Data JPA

我只是使用 spring mvc gradle spring security spring data jpa 创建简单的应用程序现在我想测试 spring security 是如何工作的但是我有一个问题首先我向您展示一些代码然后我
XStream：xstream 1.3.1 中具有属性和文本节点的节点？

我想使用 XStream 将对象序列化为这种形式的 XML
@Transactional 方法调用另一个没有 @Transactional 注解的方法？

我在 Service 类中看到了一个方法该方法被标记为 Transactional 但它还调用同一类中的一些其他方法这些方法未标记为 Transactional 这是否意味着对单独方法的调用导致应用程序打开与数据库的单独连接或挂起父事务
整个程序可以是不可变的吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我熟悉不可变性并且可以设计不可变类但我主要拥有学术知识缺乏实践经验请参考上面的链接图片尚不允许嵌入从下往上看学生需要新地址

随机推荐

套接字编程-setsockopt：协议不可用？

我正在用 C 语言进行一些基本的套接字编程并且在尝试运行代码的每台计算机上都会遇到此错误代码编译得很好但是当我尝试运行它时我收到错误setsockopt 协议不可用这似乎不是一个很常见的错误但我尝试运行它的每台计算机上都会遇到这
如何创建二维以上的 pandas 数据框？

我希望能够创建n dimensional数据框我听说过一种使用 3D 数据帧的方法panels in pandas但是如果可能的话我想通过将不同的数据集组合成一个将维度扩展到超过 3 个维度超级数据框我尝试了这个但我不知道如何在
是否可以从 vb.net dll 中的 dll 导入 c# 类？

集成开发环境 VS2010 框架网 4 0 我在 Visual Studio 2010 下创建了一个 C dll 项目其中包含几个公共类我想在另一个 dll 项目中使用它的类但用 vb net 编写在vb net dll项目中我引
禁用所有 jquery datepicker 输入的自动完成功能

我想禁用autocomplete对于使用 jquery ui datepicker 的所有输入无需手动对每个输入执行此操作这怎么可能做到呢尝试这个 datepicker on click function e e preventDef
两个字段的唯一约束及其相反

我有一个数据结构必须在其中存储元素对每对恰好有 2 个值因此我们使用一个表其中包含字段左值右值这些对应该是唯一的如果密钥发生更改它们将被视为相同 Example Fruit Apple is the same as App
从 ASP.NET 应用程序获取入口程序集 [重复]

这个问题在这里已经有答案了可能的重复用于 Web 应用程序的 GetEntryAssembly https stackoverflow com questions 4277692 getentryassembly for web app
使用 int 13h 读取的扇区数量多于磁道上的扇区数量

顺序是什么int 13h with ah 02h会读19部门起始于 C H S 0 0 1 提供了 2 个磁头每磁道 18 个扇区每面 80 个磁道的软盘磁盘几何结构或者更一般地说当它到达磁道 0 的末尾磁头 0 时会发生什
如何处理数据透视表中的重复条目以及如何在 Excel 仪表板中填充查询

我有两张桌子capacity and demand 容量表如下所示 RESOURCE NAME SKILL GROUP PROJECT START DATE END DATE COST PER HOUR CAPACITY Resource
分片数据库的 ID 生成（Azure 联合数据库）

我一直在寻找一些有关 Azure 联合数据库 id 生成联合主键最佳实践的文章或指南但没有发现任何引人注目的内容联合表不支持标识列因此在我看来唯一实用的 id 类型是 GUID 因为尝试集中创建和使用 BigInt 会在应用程序
将 xib 文件替换为 App 委托类中的 Main.storyboard 文件

现在项目正在应用程序委托类中使用 MainWindow xib 作为主 nib 文件 main m 文件中有此代码 int main int argc char argv NSAutoreleasePool pool NSAutorelea
Bootstrap 4 的数据表看起来很混乱

当尝试将 Datatables 与 Bootstrap 4 一起使用时它看起来不太好我尝试遵循数据表网站上的基本示例但它看起来仍然像这样请参见下面的屏幕截图我链接到 Datatables 在其自定义页面上提供的文件这是我的 ht
GWT/GXT 标签编辑器？ [复制]

这个问题在这里已经有答案了我正在寻找基于 GWT 或 GXT 的标签编辑器控件类似于http tagedit webwork albrecht de http tagedit webwork albrecht de or http le
Bean 方法验证

public class Register NotNull private String password NotNull private String passwordRepeat AssertTrue private boolean c
使用 Java 1.6 和 Windows 7 操作系统进行深度递归时出现 java.lang.StackOverflowError

我有一个程序在执行时会遇到非常深的递归在这中间我得到java lang StackOverflowError我的应用程序冻结了我使用的是 JDK 1 6 和 Windows 7 操作系统奇怪的是我不明白这个StackOverfl
与内存相关的“竞技场”一词的含义是什么？

我正在读一本关于内存作为编程概念的书在后面的一章中作者大量使用了这个词arena 但从未定义它我搜索了这个词的含义以及它与记忆的关系但一无所获以下是作者使用该术语的一些上下文序列化的下一个例子采用了一种称为从特定的内存分配ar
iPhone 应用程序在后台运行 10 分钟后终止

我正在开发一个需要在 iOS4 上后台运行的应用程序我希望它像常规的基于位置的应用程序一样因此背景模式是设置为位置应用程序进入后台后运行良好状态但 10 分钟后它不再响应或许它被暂停终止我想做的是永远在后台运行应用程
为什么我不能在任何方法之外修改类成员变量？ [复制]

这个问题在这里已经有答案了我有一个带有一些变量的类当我在主类中实例化该类的对象时我只能访问和修改一个方法中的成员变量任何方法不在他们之外这是为什么我被困住了似乎无法在谷歌上找到答案 class SomeVariables S
第一次尝试简单的 GUI

我正在尝试自学如何使用 Java swing 和 Window Builder Pro 制作 GUI 在观看了几个 youtube 视频并阅读了一些教程后我已经完成了以下任务 import javax swing JFrame impor
按带有日期值的单个键对对象数组进行排序

我有一个包含多个键值对的对象数组我需要根据 updated at 对它们进行排序 updated at 2012 01 01T06 25 24Z foo bar updated at 2012 01 09T11 25 13Z foo ba
Jsoup SocketTimeoutException：读取超时

I get a SocketTimeoutException当我尝试使用 Jsoup 解析大量 HTML 文档时例如我得到了一个链接列表 a href www domain com url1 html link1 a a href ww

Jsoup SocketTimeoutException：读取超时

Jsoup SocketTimeoutException：读取超时 的相关文章

随机推荐

热门标签

Jsoup SocketTimeoutException：读取超时的相关文章