Ruby NET::HTTP 在正文之前读取标头（没有 HEAD 请求）？

2024-01-10

我使用 Net::HTTP 和 Ruby 来抓取 URL。

我不想抓取流音频，例如：http://listen2.openstream.co/334 http://listen2.openstream.co/334

事实上我只想抓取Html内容，所以没有pdf、视频、txt..

现在，我将 open_timeout 和 read_timeout 设置为 10，因此即使我抓取这些流音频页面，它们也会超时。

url = 'http://listen2.openstream.co/334'
path = uri.path

req= Net::HTTP::Get.new(path, {'Accept' => '*/*', 'Content-Type' => 'text/plain; charset=utf-8', 'Connection' => 'keep-alive','Accept-Encoding' => 'Identity'})

uri = Addressable::URI.parse(url)   

resp =  Net::HTTP.start(uri.host, uri.inferred_port) do |httpRequest|
    httpRequest.open_timeout = 10
    httpRequest.read_timeout = 10
    #how can I read the headers here before it's streaming the body and then exit b/c the content type is audio?
    httpRequest.request(req)
end

但是，有没有办法在我读取 http 响应正文之前检查标头以查看它是否是音频？我想这样做而不发送单独的 HEAD 请求。

net/http支持流式传输，您可以使用它在正文之前读取标题。

代码示例，

url = URI('http://stackoverflow.com/questions/41306082/ruby-nethttp-read-the-header-before-the-body-without-head-request')

Net::HTTP.start(url.host, url.port) do |http|
  request = Net::HTTP::Get.new(url)
  http.request(request) do |response|

    # check headers here, body has not yet been read
    # then call read_body or just body to read the body

    if true  
      response.read_body do |chunk|
        # process body chunks here
      end
    end
  end
end

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

rubyonrails

ruby

Ruby NET::HTTP 在正文之前读取标头（没有 HEAD 请求）？的相关文章

解析包含 json 字符串的 json

我有一个 json 里面有另一个 json 但它在双引号内因此它给了我一个解析错误除了使用之外还有什么方法可以解析这个jsongsub替换双引号 obj Name FirstName Douglas LastName Crockford
为 .API 文件启用自动完成功能？

有谁知道如何使用 N 站点上提供的 API 文件在 Notepad 中自动完成工作在 API 文件夹中具有 XML 自动完成文件的语言中自动完成功能工作得很好但对于使用 API 文件的语言 ruby AutoIt 等完全不起作用根
在所有延迟的作业之前挂钩

是否可以在所有delayed job任务之前运行一个方法基本上我们试图确保每台运行delayed job的服务器都有我们代码的最新实例因此我们希望运行一个方法来在每个作业运行之前检查这一点我们已经有了 check 方法并在其他地方使
包括 collection_select 帮助程序的空白和默认值

我希望在 Rails 应用程序的下拉列表中有一个选择一个选项选项我正在使用collection select辅助标签它看起来像这样我希望下拉菜单的默认选项是选择国家地区 Use the include blank option
表单元素的自定义 HTML 错误包装器

我想找到一种方法来自定义默认错误html div class field with errors div 参加我自己的课程 div class clearfix error div
如何将 STDOUT 捕获到字符串？

puts hi puts bye 我想存储到目前为止代码的 STDOUT 在本例中 hi nbye 到变量中说结果并打印它 puts result 我这样做的原因是我已将 R 代码集成到我的 Ruby 代码中当 R 代码运行时其输出
将 Rails 5.2 升级到 6.0 时出现参数错误数量错误

我正在尝试将旧站点从 Rails5 2 升级到 6 0 然后再升级到 6 1 推荐的路径我收到了有关参数数量错误的各种错误其中一些错误我已通过更新或删除各种 gem 设法清除最后我被困在了这一点上 rbenv versions 3 0
使用 PostgreSQL 的模式和 Rails 创建多租户应用程序

我已经想通的事情我正在学习如何在 Rails 中创建多租户应用程序该应用程序根据用于查看应用程序的域或子域来提供来自不同模式的数据我已经回答了一些问题如何让 subdomain fu 也能与域一起使用这是有人问了同样的问题 htt
迭代比线性代码慢吗？哪一个更可取？

最近几天我脑子里一直有一个问题在用 ruby 编写代码时线性代码是否比迭代更快更好让我举个例子有一个用于相同功能的代码块以两种不同的方式编写 Way 1 dog cat tiger each do pet name puts I
从轨道控制器返回

这是一个初学者 Rails 问题我这样做之后 format xml head ok 如何从控制器端点返回而不显示视图如果我此时放弃函数的末尾我会得到我所期望的结果但如果我调用返回我最终会进入视图或者在我的情况下会出现缺少的视图
如何阻止“gem”实用程序访问我的主目录？

当我跑步时 gem install
匹配一对未转义的平衡分隔符

如何匹配一对不被反斜杠转义的平衡分隔符本身不被反斜杠转义无需考虑嵌套例如对于反引号我尝试了此操作但是转义的反引号无法按转义的方式工作 regex lt lt hello how are you gt 1 how expected
Rails 2.3.14：如何序列化 ActionController::Request 对象？

我需要编写一些根据 Rails 2 3 14 控制器收到的请求对象类型执行操作的方法但是我不想启动整个应用程序甚至不想启动控制器我只想拥有这样一个对象的编组副本以便我可以在 Rails 环境之外使用不幸的是 ActionCont
如何显示 RSpec 测试生成的 SQL 查询日志？

我正在为我的 Rails 3 应用程序编写规范我想测试数据库事务是否真的有效如果能够看到我的应用程序在规范驱动下生成的 sql 查询这将非常有帮助有没有办法像在 Rails 控制台中一样查看查询我正在使用 Rails 3 0 9
日期时间到 NSDate

如何转换字符串2010 11 19T20 00 00Z进入一个NSDate object 我尝试过使用 dateFormatter setDateFormat yyyy MM ddTHH mm ssZ 但看起来我的自定义格式样式错误 PS
使用 Ruby 通过 Outlook 发送消息的最简单方法是什么？

我的工作要求我为某些测试自动生成电子邮件我一直在四处寻找但一直未能找到可以快速实施的合理解决方案它需要在 Outlook 中而不是其他邮件服务器中因为我们有一些奇怪的身份验证规则并且我们需要保存草稿的选项而不仅仅是发送消息显
如何在 Rails 3 中查看用户的实时活动？

我想做的是让我的管理员用户能够实时通过一些 AJAX jQuery 功能看到我的用户正在做什么我该如何去做呢我认为它与会话活动有关并且我已经开始将会话保存到数据库而不是 cookie 但一般来说我如何获取该信息并实时解析它我
如果数组包含一个或多个相同值，则合并数组

我有一个数组数组 a 1 2 3 3 4 5 6 7 8 8 9 9 10 我想合并包含一个或多个相同值的所有数组所以 a 1 2 3 4 5 6 7 8 9 10 我正在努力寻找一种简洁的方法来解决这个问题有任何想法吗我相信这是正确
如何最好地将地址关联到 Rails 中的多个模型？

这个问题 https stackoverflow com questions 648463 best way to model customer addresson SO 似乎与我的问题有关但我不确定我的问题是否得到了回答一个地址可以属
Ruby：基于控制台的菜单

我有一个名称和 URL 数组并希望以向上向下滚动菜单的形式向用户呈现名称列表基本上是什么dialog允许在外壳内我调查过ncurses ruby rdialog and HighLine但它们似乎要么作为一个项目被放弃要么甚至从它

随机推荐

Angular2：更改要上传的文件时不会触发的验证

当文件输入更改时 Angular 2 似乎无法运行验证我做了一个punk来说明这个问题我做了一个类似的表单组 this frm new FormGroup file new FormControl this validateFile 在
Python DataFrame 中 Timedelta 值的聚合

我有一个大 DataFrame df 如下所示 Acc num date diff 0 29 0 04 43 1 29 0 01 43 2 29 2 22 45 3 29 0 16 21 4 29 0 58 20 5 30 0 00 35
在 Magento 管理面板的目录产品页面中动态设置选择选项

需要在选择属性中具有一组动态值具体取决于另一个选择属性例如将有两个下拉属性 1 父下拉菜单 2 子下拉菜单如果在父下拉列表中选择 A 则下拉列表中将显示 Air Apple Ant 如果在父属性中选择 B 则将显示 Ball Box
PHP 避免静态类以避免依赖关系，但我需要在任何地方使用全局

很多次我听到避免静态类因为他们将插入依赖项这将使您的代码在其他项目中无法使用并且不允许对其进行单元测试 https stackoverflow com a 5673247 260080 假设我们有一个典型的class DB访问数据库此
:sub: 之类的排版快捷方式在哪里定义？

特别是有没有办法添加像这样的快捷方式 nsub to NotSubset For NotSubset 默认别名是 sub 当然正如 HPMark 的回答中提到的如果您对此不满意可以更改InputAliases对于当前笔记本 oldO
在此服务器上找不到请求的 URL /ProjectName/users。拉维尔

我正在关注 laravel 的快速入门它说 type users 但不为我工作我在浏览器中写了 http DomainServer ProjectName users它抛出在此服务器上找不到请求的 URL ProjectName us
从作为几个局部变量之一的 JTextField 获取数据

所以我正在读取一个文件并获取该文件中的行数基于此我生成了我的界面现在我需要能够通过 UI 编辑值 Rows 是具有输入文档行数的变量当然下面的代码不起作用我想将新值写入我从中读取的数组 for int i 0 i
如何监听 1200 个设备 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在使用德尔福我有一个设备设备
bash 中的三单引号是什么意思？

我在 bash 中见过很多单引号和双引号以及反引号的用法但从未见过接下来的内容下面的文字记录是什么意思它似乎表明 bash 认为三重单引号是有意义的并且进一步似乎表明这个东西中的单引号也有特殊的含义可以进行插值我没有找到这方面的
如何在 VSCode 中使用 Flake8？

我的 VSCode 使用本地安装的 anaconda 环境位于默认目录将其放置在 Program Files 中因此我无法通过 VSCode 安装 flake8 出现权限错误如果我在本地更新 conda 环境来安装 flake8
Windows 调度程序不执行批处理脚本，但脚本在命令行中运行良好

我想创建以今天的日期作为文件夹名称的文件夹然后我想将数据从远程计算机移动到新创建的文件夹我写了一个批处理脚本看起来像我的批处理脚本名称运行 bat ECHO off SET CurrentDate date 4 4 date
为什么在 Xcode 11 上，UICollectionViewCell 一旦滚动就会改变大小（我已经在 sizeForItem AtIndexPath 中设置了大小：）？

我在表视图单元格中有集合视图我使用笔尖作为我的集合视图单元格其中我对图像视图和标签使用自动布局并且它处于自由格式模式我在 tableviewcell 类中设置单元格大小该类通过以下方法处理其中的 collectionview 委托
根据一列从表中删除重复行

我创建了一个包含 4 个表的多个内部联接的表但结果返回了重复的记录这是我正在使用的代码 SELECT tblLoadStop LoadID tblCustomer CustomerID tblLoadMaster BillingID t
Spinner 项目的自定义布局

我在警报对话框中有一个微调器我想减少微调项目之间的填充因此我实现了以下内容 spinner row xml
Javascript 使用 Genie 效果最小化
？ [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我想最小化
地图函数返回的列表在使用一次后消失[重复]

这个问题在这里已经有答案了我是Python新手我正在使用 Python 3 3 2 我很难弄清楚为什么以下代码会给我一个错误 strList 1 2 3 intList map int strList largest max intLi
MVC4 - 有没有办法将根路由到“正常”未处理的 html 页面？

我有一个 MVC4 应用程序但我主要将它用于 WebAPI 部分我想要一个普通的旧 HTML 文件发送回用户然后将使用 KnockoutJS 或 KendoUI 从 webapi 控制器中提取 JSON 我知道我可以这样做 rout
Java 可以用来确定下载的持续时间吗？

只是问一下你会如何做这件事我知道有一些方法可以获取总体百分比来通知用户下载进度但我不知道如何在一段时间内执行类似的操作例如下载完成所需时间 5 分钟我所知道的就是百分比写出写入的字节然后将其除以长度然后将其转换为百分比如
android 服务 onBind SecurityException

我不知道为什么但是在一些设备我的服务不允许绑定 java lang RuntimeException Unable to create application mypackage MyApplication java lang Securi
Ruby NET::HTTP 在正文之前读取标头（没有 HEAD 请求）？

我使用 Net HTTP 和 Ruby 来抓取 URL 我不想抓取流音频例如 http listen2 openstream co 334 http listen2 openstream co 334 事实上我只想抓取Html内容所以没

Ruby NET::HTTP 在正文之前读取标头（没有 HEAD 请求）？

Ruby NET::HTTP 在正文之前读取标头（没有 HEAD 请求）？ 的相关文章

随机推荐

热门标签

Ruby NET::HTTP 在正文之前读取标头（没有 HEAD 请求）？的相关文章