为什么 LinkedBlockingQueue.take() 即使有元素也会阻塞？

2024-03-27

我有 10 个网络爬虫，它们共享一个LinkedBlockingQueue.

从 Eclipse 中的调试视图中，我发现当我获取多个 URL（大约 1000 个）时，list.take()通话时间很长。

它是这样工作的：

private (synchronized) URL getNextPage() throws CrawlerException {
    URL url;
    try {
        System.out.println(queue.size());
        url = queue.take();
    } catch (InterruptedException e) {
        throw new CrawlerException();
    }
    return url;
}

我只添加了synchronized and queue.size()出于调试目的，查看列表是否真的已填满take()被叫。是的，确实如此（本次运行中有 1350 个元素）。

queue.put()另一方面，只有当 URL 确实是新的时才会被调用：

private void appendLinksToQueue(List<URL> links) throws CrawlerException {
    for (URL url : links) {
        try {
            if (!visited.contains(url) && !queue.contains(url)) {
                queue.put(url);
            }
        } catch (InterruptedException e) {
            throw new CrawlerException();
        }
    }
}

然而，所有其他爬虫似乎也不会产生太多新 URL，因此队列不应该真正阻塞。这是队列中的 URL 数量（以 5 秒为间隔）：

Currently we have sites: 1354
Currently we have sites: 1354
Currently we have sites: 1354
Currently we have sites: 1354
Currently we have sites: 1355
Currently we have sites: 1355
Currently we have sites: 1355

根据Java文档contains()继承自AbstractCollection所以我想这至少与多线程没有任何关系，因此也不能成为阻塞的原因。

重点是，从我的调试中我还可以看到其他线程似乎也被 list.take() 阻塞。然而，它不是一个永恒的块。有时，其中一个爬虫可以继续前进，但它们会卡住一分钟多。目前，我看不到其中任何一个正在发生。

你知道这是怎么发生的吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Multithreading

为什么 LinkedBlockingQueue.take() 即使有元素也会阻塞？的相关文章

为什么这不会绘制图像？

我想做的是当我运行应用程序时它会启动线程并且图像显示 3 秒 3000 毫秒然后线程停止运行图片路径正确图片文件存在线程本身运行但是图像似乎没有显示可能出什么问题了这是我的代码 package org main impo
Java Swing透明JPanel问题

我有一个 JLayeredPane 其中添加了 3 个 JPanel 我将 JPanel 设为透明未设置背景并 setOpaque false 我在 JPanel 上绘制线条只有最后添加的 JPanel 上的线条可见其他 JPanel
如何找出已使用的 JAR？

在更大的项目中我们可能会使用大量的 JAR 如何找出项目而不是整个项目中的某个模块包正在使用哪些 JAR 有什么工具技术等吗较大的项目通常使用类似的构建工具maven http maven apache org or ant h
低级键盘钩子不在 UI 线程上

我想为键盘挂钩创建一个好的库我使用 SetWindowsHookEx 方法我注意到如果我的应用程序的主线程繁忙则应在任何系统 KeyDown 事件中调用的方法 hookProc 不会执行我认为钩子应该这样制作以便另一个线程负责它
Spring - 两种不同的 POST 方法，具有相同的 URL，但生成的内容类型不同

我有以下控制器 RequiredArgsConstructor RestController public class OwnerViewController implements ApiOwnerViewController privat
JUnit 测试方法无法返回值

为什么 JUnit 测试方法无法返回值文档 https junit org junit5 docs current user guide writing tests classes and methods说强调我的测试方法和生命周期方
Tomcat：具有强密码的 TLSv1.2 不起作用

我安装了Tomcat 7 配置了对 TLSv1 2 的支持在端口 8443 上我的连接器配置协议 org apache coyote http11 Http11NioProtocol SSLEnabled true 方案 https 安
当目标是属性时，@Throws 不起作用

在看的同时这个问题 https stackoverflow com q 47737288 7366707 我注意到申请 Throws to a get or setuse site 没有影响此外唯一有效的目标 for Throws ar
如何将 openapi-generator 中的客户端包含在 gradle java 应用程序中？

我想创建一个 gradle java 应用程序它从 openAPI 规范文件生成客户端并使用该客户端所以我创建了一个java应用程序gradle init 类型应用程序语言 Java DSL groovy 测试框架 Junit Ju
关于java中同步的问题；何时/如何/到什么程度

我正在开发我的第一个多线程程序并在同步的几个方面陷入困境我已经浏览了 oracle sun 主页上的多线程教程以及这里的一些关于 SO 的问题所以我相信我知道什么是同步然而正如我提到的有几个方面我不太确定如何弄清楚我以明确问
Android 3.1 USB 主机 - BroadcastReceiver 未收到 USB_DEVICE_ATTACHED

我经历过USB 主机的描述和示例位于developer android com http developer android com guide topics usb host html检测连接和分离的 USB 设备如果我在清单文件中使用
如何调试内部错误？

所以我有课Foo最终应该调整并重新加载类它也有一个方法 private void redefineClass String classname byte bytecode ClassFileLocator cfl ClassFileLoc
javax.el.PropertyNotFoundException：在 java.lang.String 类型上找不到属性“tname”

我之前使用的是 scriptlet 但现在我改用了 mvc 我无法检索 JSP 页面上的值并收到错误 javax el PropertyNotFoundException Property tname not found on type j
kafka消费端Offsets的一致性

我有复制因子为 3 的卡夫卡主题min insync replicas 2 一个向该主题发送 X 条消息的生产者acks all 一段时间后 1 分钟内在所有消息发送到主题后将使用 java kafka 客户端为此主题创建新的消费者使
改造添加带有令牌和 ID 的标头

我在获取经过身份验证的用户时遇到问题在此之前我得到了令牌和用户 ID 现在我需要使用访问令牌和 ID 从服务器获取用户我有标题格式 https i stack imgur com OQ87Y png 现在我尝试使用拦截器添加带有用户令牌
如果在构造函数中使用 super 调用重写方法会发生什么

有两个班级Super1 and Sub1 超1级 public class Super1 Super1 this printThree public void printThree System out println Print Thre
重构 google 的 NetworkBoundResource 类以使用 RxJava 而不是 LiveData

谷歌的android架构组件教程here https developer android com topic libraries architecture guide html有一部分解释了如何抽象通过网络获取数据的逻辑在其中他们使用
为什么ArrayList的非静态内部类SubList有一个成员变量“parent”？

java util ArrayList SubList 是 java util ArrayList 的非静态内部类这意味着它保存对其封闭类的引用我们可以使用ArrayList this来访问java util ArrayList的成员
POJO 支持使用omnifaces 自动完成primefaces

我正在尝试在我的项目中使用 primefaces 自动完成组件以避免将特定转换器写入我尝试使用的每个列表对象全能面孔 http showcase omnifaces org converters ListConverter如建议的here
JAAS keytab 配置的相对路径

我有一个系统其中 NET 客户端使用 Kerberos 针对 Java 服务器进行身份验证一切正常但我正在尝试改进服务器配置目前一个keytab根目录中需要文件C 因为我的jaas配置文件看起来像这样 Server com sun

随机推荐

MuiThemeProvider.render()：必须返回有效的 React 元素（或 null）

我正在使用 Material UI 和 React 来创建一个下拉菜单如果我将下拉组件保留在我的src app js一切都呈现良好但是如果我将其移至单独的文件中 fruits js我收到以下错误 MuiThemeProvider re
包装递归函数总是一个好的做法吗？

我正在使用递归函数来计算从一个节点开始到另一个给定的一组规则例如最小最大确切的停止次数的图表中可能的遍历次数我想知道调用调用递归函数而不是直接调用它的包装函数是否是一个好习惯大多数时候我看到人们使用包装函数只是想知道为什么以
在与 WebPack 捆绑在一起的 Visual Studio 中调试 JavaScript 代码

我是 JS 开发新手在 Visual Studio 2013 中调试 JS 代码时遇到问题我们的 Web 应用程序的 JS 部分由 WebPack 捆绑到单个 app bundle js 文件中每次任何 js 文件更改时该文件都会自
关于 .Equals() 与 == 运算符以及基元与对象比较的混淆

考虑这段代码 int a 0 short b 0 int c 0 object a1 a object b1 b object c1 c Console WriteLine 1 comparing primitives int vs sho
有什么好的 javascript 库可以实现跨浏览器和打印机友好的页面吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Karma 用于自动用户交互测试？

我正在测试一个设置Karma http karma runner github io Mocha http visionmedia github io mocha 其中一件事是这个可能要做的是在各种浏览器上测试用户交互包括Phantom
QT-creator 中架构 x86_64 的未定义符号

我刚刚开始使用 C 正在学习如何使用 QT 创建者作为 IDE 所以我怀疑这可能非常简单但我可能会遗漏一些东西我安装了apollo MQ并安装了apache CMS C 消息服务 http activemq apache org cms
访问链接后，Firefox 有选择地跳过状态更改或 a:visited 样式

单击具有常见 href 的链接本地页面或网站后并且href加载成功 FF2和IE7都会显示带有 a visited 样式的链接对于带有 href javascript anyfunc 的链接 IE7 的工作方式如上而 FF2 不
比较两个数据库之间的数据模型的选项？

我需要确定 2 个数据库之间的数据模型差异 DB1 和 DB2 我需要一种方法来识别丢失额外的数据库对象和命名差异您是否可以推荐用于此目的的 sproc 或免费工具要比较两个数据库架构您可以使用 Visual Studio 2015
具有平方像素的 ImageView（无插值）

我有一个 9X11 像素的位图代表一个迷宫路径为绿色墙壁为黑色开始为橙色结束为蓝色它的矩阵是 int map new int 1 1 1 1 1 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 0 1 1 0
将数字字段中带有逗号的数据导入到 redshift 中

我正在使用 SQL 将数据导入 redshiftCOPY陈述数据在数字字段中包含逗号千位分隔符COPY声明拒绝 The COPY语句有许多选项来指定字段分隔符日期和时间格式以及 NULL 值但是我没有看到任何指定数字格式的内容我是否
ExpressJS 服务器 - 如何处理多个域

我在 Express 上闲逛了一下我想知道最正确的方法是处理链接到同一服务器的多个域假设我们有 foo com bar net baz com 这一切都指向111 222 333 444 该机器正在运行 NodeJS 和 Expre
ClickOnce 无法在 Internet Explorer 9 中运行

My 单击一次 http en wikipedia org wiki ClickOnce部署曾经完美地工作但它在 Internet Explorer 9 中停止工作它只显示桌面应用程序XML 文件它仍然有效谷歌浏览器 http en
“bundle exec rake db:migrate”有什么作用？

根据我的研究 bundle exec 负责在包的上下文中执行命令无论如何我还不太明白它对于命令的作用有何不同rake db migrate与相比bundle exec rake db migrate 例如在我的例子中我执行了第一个命
如何在 Ruby 中对世界杯小组表进行排序

我正在编写一种算法来根据比赛数据创建世界杯小组表并对其进行排序因此给出以下匹配数据 id 1 home team Honduras away team Chile home score 0 away score 1 id 2 home
如何禁用 Android 和 IOS 的复制和粘贴文本功能，该功能在 Phonegap 应用程序中长按屏幕后出现

Phone Gap issue 如何禁用 ANDROID 以及 IOS 的默认文本复制粘贴功能该功能在 Phonegap 应用程序中长按屏幕后出现我提到如何禁用 jQuery Mobile iOS 中锚点的默认行为 https stac
如何使用“Check”语句来验证 mysql 中的字段值？

如何使用 Check 语句来验证 mysql 中的字段值看这个page http dev mysql com doc refman 5 1 en create table html 手册中没有讨论check keyword In MySq
具有一元运算符的 IIFE：现实世界用例[重复]

这个问题在这里已经有答案了我们可以假装使用一元运算符作为 IIFE 如下所示 function return 5 5 function return 5 5 function return 5 6 function return 5 fa
返回第一个字符为非字母的行

我正在尝试检索 SQlite 中以任何非字母字符开头的所有列但似乎无法使其工作我目前已经得到了这段代码但它返回每一行 SELECT FROM TestTable WHERE TestNames NOT LIKE A z 有没有办法检索
为什么 LinkedBlockingQueue.take() 即使有元素也会阻塞？

我有 10 个网络爬虫它们共享一个LinkedBlockingQueue 从 Eclipse 中的调试视图中我发现当我获取多个 URL 大约 1000 个时 list take 通话时间很长它是这样工作的 private synch

为什么 LinkedBlockingQueue.take() 即使有元素也会阻塞？

为什么 LinkedBlockingQueue.take() 即使有元素也会阻塞？ 的相关文章

随机推荐

热门标签

为什么 LinkedBlockingQueue.take() 即使有元素也会阻塞？的相关文章