使用 ruby 获取 URL 的内容长度

2024-05-07

我正在尝试编写一个 ruby 脚本，该脚本使用以下命令获取有关网站上文件的一些详细信息net/http。我的代码如下所示：

require 'open-uri'
require 'net/http'

url = URI.parse asset
res = Net::HTTP.start(url.host, url.port) {|http|
  http.get(asset)
} 

headers = res.to_hash
p headers

我想从这个请求中获取两条信息：膨胀内容的总长度，以及（酌情）缩小内容的长度。

有时，标题会包含content-length参数，它似乎是内容的 gzip 压缩长度。我还可以使用 res.body.length 来估算内容的膨胀大小，但这并不是万无一失的。有关的文档net/http表示 gzip 标头会自动从列表中删除（以help我，天哪，谢谢）所以我似乎无法可靠地处理这些信息。

感谢任何帮助（包括其他宝石，如果他们能更轻松地做到这一点）。

知道了！仅当您未指定自己的接受编码标头时，才会发生此处的“神奇”行为。修改后的代码如下：

require 'open-uri'
require 'net/http'
require 'date'
require 'zlib' 

headers = { "accept-encoding" => "gzip;q=1.0,deflate;q=0.6,identity;q=0.3" }
url = URI.parse asset
res = Net::HTTP.start(url.host, url.port) {|http|
  http.get(asset, headers)
}

headers = res.to_hash

gzipped = headers['content-encoding'] && headers['content-encoding'][0] == "gzip"
content = gzipped ? Zlib::GzipReader.new(StringIO.new(res.body)).read : res.body 


full_length = content.length,
compressed_length = (headers["content-length"] && headers["content-length"][0] || res.body.length),

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ruby

nethttp

使用 ruby 获取 URL 的内容长度的相关文章

我可以通过 GH API 获取两次提交之间一个文件的差异数据吗？

我知道如何通过 API 以及 SHA 和所有这些好东西来获取文件的提交但是假设我只想要 1 次提交中的文件差异或两次提交中同一文件的差异例如在这次提交 https github com rails rails commit ea75
用 ruby 漂亮地打印到文件

我正在尝试将哈希打印到文件中我尝试了unix重定向逐步添加不同的标志 echo pp mymap tee summary out 2 gt 1 和文件IO my file File new dir myfile out w my fil
Watir 不会下载 PDF，只能在查看器中打开

我试图用 Selenium 进行测试但无法下载 pdf pdf 一直打开参见我的另一篇文章 RUBY Selenium Webdriver 设置为下载 pdf 文件而不是打开它们 https stackoverflow com ques
帮助重构这个讨厌的 Ruby if/else 语句

所以我有这个大而多毛的 if else 语句我将跟踪号码传递给它然后它确定它是什么类型的跟踪号码我怎样才能简化这件事具体来说就是想减少代码行数 if num length lt 8 tracking service false el
将表列添加到 Group by 子句 - Ruby on Rails - Postgresql

我正在尝试使用 Heroku 显然 Postgresql 对于聚合函数来说比 SQL 严格得多当我推送到 Heroku 时我收到一条错误消息内容如下关于另一个问题 https stackoverflow com questions
Ruby 元编程方法列表？

刚刚开始学习 Ruby 元编程看看 Object methods 我得到 Object methods gt allocate new superclass freeze lt gt lt lt gt gt to s included m
脚本标头过早结束：媒体（与以下问题相关：rails 应用程序部署+passenger+ubuntu+apache）

我刚刚设置了一个 linode 服务器并在其上部署了我的 Rails 3 应用程序它已启动并正在运行问题是某些图像没有显示在生产中在本地它们工作正常我仔细检查了日志文件生产 log 但什么也没找到然后我检查服务器 error
是否可以在 proc 中查看 ruby 代码？

p Proc new puts ok 是否可以在过程中看到 ruby 代码 inspect返回内存位置 puts p inspect
在 Windows 上安装 RMagick

我对此进行了研究并且在我的一台计算机上花了几个小时大约三周前我在我的台式计算机上安装了 RMagick 它相当复杂我不记得我采取的具体步骤我真的很沮丧我已将 ImageMagick 安装到我的计算机上的目录 C ImageMag
使用自定义 gem 在 Dreamhost/Passenger 上部署 Sinatra 应用程序

我有一个 Sinatra 应用程序正在尝试在 Dreamhost 上运行该应用程序利用 pony 发送电子邮件为了让应用程序从一开始就启动并运行在添加小马之前我必须gem unpack rack and gem unpack si
使用 Ruby 替换文件中的特定行

我有一个如下所示的文本文件 a txt open close open open close open 我需要找到一种方法将第三行替换为 close 我做了一些搜索大多数方法都涉及搜索该行而不是替换它在这里不能真正做到这一点因为我不想
为 .API 文件启用自动完成功能？

有谁知道如何使用 N 站点上提供的 API 文件在 Notepad 中自动完成工作在 API 文件夹中具有 XML 自动完成文件的语言中自动完成功能工作得很好但对于使用 API 文件的语言 ruby AutoIt 等完全不起作用根
如何将 STDOUT 捕获到字符串？

puts hi puts bye 我想存储到目前为止代码的 STDOUT 在本例中 hi nbye 到变量中说结果并打印它 puts result 我这样做的原因是我已将 R 代码集成到我的 Ruby 代码中当 R 代码运行时其输出
平衡付款 - 有关获取现有买家和商家账户参考信息的文档

我如何获得已创建的买家和商家帐户的参考我只是找到创建买家和商家帐户的示例我没有找到任何有关获取该信息以供重用的示例是否有关于此的现有文档或只是 rdoc 中的内容根据对 rdoc 的引用我假设您在这里使用 Ruby gem 使用唯
Rails：将参数从视图传递到控制器

我在 Rails 中有以下模型 class Task lt ActiveRecord Base attr accessible description name project belongs to project validates na
ruby CSV重复行解析

我有一些需要处理的 CSV 数据但无法找到匹配重复项的方法数据看起来有点像这样 line id name item 1 item 2 item 3 item 4 1 251 john foo foo foo foo 2 251 john
Ruby `split'：UTF-8 中的无效字节序列（ArgumentError）

我正在尝试填充电影对象但是在解析时u item文件我收到此错误 split UTF 8 中的无效字节序列 ArgumentError File open Data u item r do infile while line infile
忽略 GEM，因为它的扩展尚未构建

在我的工作和家用计算机上我最近将 Ruby 升级到 2 3 1 使用ruby install I use chruby作为我的 Ruby 切换器我开始在我的终端中看到这个警告 Ignoring bcrypt 3 1 11 because
如果数组包含一个或多个相同值，则合并数组

我有一个数组数组 a 1 2 3 3 4 5 6 7 8 8 9 9 10 我想合并包含一个或多个相同值的所有数组所以 a 1 2 3 4 5 6 7 8 9 10 我正在努力寻找一种简洁的方法来解决这个问题有任何想法吗我相信这是正确
ActiveRecord 查询，按关联排序，最后一个 has_many

我试图列出所有Users by the created at最近创建的关联记录通讯列到目前为止我所拥有的 User includes communications order communications created at IS

随机推荐

用于根据源列表移动文件的 Powershell 脚本 (.txt

我的目录中有数千个文件 pdf xls doc 它们都有相似的命名约定类型始终是常量字符串即账单或发票帐户名称帐号 type pdf 帐户名称帐号 type doc 帐户名称帐号 type xls 手头的任务是接收帐户名和帐
SeleneseTestCase 已弃用 - 如何调用 verify* 方法？

当我在 Selenium IDE 中使用 JUnit 4 格式化程序生成的代码时我收到警告称类 SeleneseTestCase 已弃用这是有道理的因为它应该采用 JUnit 4 语法并使用注释而不是从测试类派生问题是当我修改代
Twitter 宝石搜索方法

我的代码在这里 require twitter search Twitter Search new containing obama 它返回我们
laravel 基本查询中“允许的内存大小已耗尽 134217728 字节”

我不知道为什么我无法让以下工作正常工作 DB table twitter hashtags gt paginate 5 每次我得到第二个数字往往不同 Allowed memory size of 134217728 bytes exhau
Verilog 双向握手示例

我正在完成一个项目要求是处理器内部功能单元之间的双向握手我知道它是什么但是有没有任何标准或一个简单的例子我唯一能想到的就是两个单元之间当它们之间有一条数据线并且当 X 发送到 Y 时会给出一个单独的发送信号当 Y 接收
如何让IDLE在启动时自动导入模块？

通常当我使用 IDLE shell 时我会导入pickle模块能不能让它自动导入pickle我什么时候开始呢您可以使用 c or r争论 From idle h c cmd run the command in a shell or
在 Django 管理界面中更改模型类名称[重复]

这个问题在这里已经有答案了可能的重复 django 中管理模型类的详细名称 https stackoverflow com questions 5959462 verbose name for admin model class in d
我无法在 Android 中使用 setMultiChoiceItems 在对话框中显示列表

我有一个方法返回 CharSequence 并且不为空用日志检查但不显示在对话框中我必须初始化 boolean 数组吗我没有看到任何错误所以也许我错过了一些东西我的代码是 dbManager open final CharSeq
Proguard：如何保留除特定条件之外的所有内容？

我正在使用 Proguard 来混淆我的代码并且我需要保留每个第三方库例如 keep class com layer dontwarn com layer keep class com twitter keep class androi
SPARQL (Jena) UPDATE 可以通过文字集合（而不是文字）进行参数化吗？

我可以调用参数化的 SPARQL UPDATE 如 Jena 的ParameterizedSparqlString 将属性设置为多个例如字面值例如我有 Set
在书签中使用本地存储

我非常喜欢使用带有小脚本的书签例如我编辑了注释编辑脚本这个帖子 http www reddit com r LifeProTips comments 265rxe lpt use a browser tab as a quick and
在显示另一个对话框之前隐藏所有可见的 Metro 对话框

我在用着MahApps Metro http mahapps com在我的 WPF 项目中我正在构建一个类来帮助我展示Dialogs http mahapps com controls dialogs html 我想知道是否有一种方法可以
有没有办法在 asp.net core 3.1 Rest-API 中使用 Identity Server 功能

我正在使用 asp net core 3 1 在服务器中使用 Rest API 的项目以 Angular 作为单页应用程序的前端从每个客户端用户需要提供其用户名和密码才能访问 Web API 的受保护部分我想使用 Identity
DATEADD(day, -7, GETDATE()) - 是否考虑了时间？

我正在通过 Amazon Redshift 在 Aginity 中编写 SQL 查询来提取过去 7 天的数据这Date我调用的列是变量类型 DATE 输出示例如下 5 30 2017 0 00 当我调用下面的函数时运行此查询在一天中的什
Haskell 中美元符号 ($) 和 id 函数之间有关系吗？

这几天我正在读一篇评论莫纳德挑战 http mightybyte github io monad challenges 我强烈推荐给像我这样的 Haskell 初学者我最终得到了这个线程 https news ycombinator co
如何从symfony2中的表单对象获取每个字段的错误消息？

我按照这个教程http symfony com doc current forms html http symfony com doc current forms html我完美地呈现了我的插入表单但只有一个问题我无法解决当表单无效时
Solr 过滤查询 - 字符串与整数

假设我正在尝试查询一堆具有类别的文档并且我想将查询限制为指定的类别据我所知这只是使用 fq 参数过滤器查询我想知道将参数设置为整数而不是字符串或数据通常的情况是否会提高性能我只是会在右侧犯错但我想我应该仔细检查一下以防万一
将 ElasticSearch SearchResponse 对象转换为 JsonObject

我想将elasticsearch搜索结果转换为Json对象我还没有找到任何直接转换的正确方法 SearchResponse response client prepareSearch index setExplain true execu
创建一个类的所有常量的数组？

我正在使用一个定义了近 20 个常量的类因为我希望所有这些常量值都在一个数组中我只想知道有没有什么方法可以创建一个类的所有常量的数组我尝试过compact https www php net manual en function c
使用 ruby 获取 URL 的内容长度

我正在尝试编写一个 ruby 脚本该脚本使用以下命令获取有关网站上文件的一些详细信息net http 我的代码如下所示 require open uri require net http url URI parse asset res N

使用 ruby​​ 获取 URL 的内容长度

使用 ruby​​ 获取 URL 的内容长度 的相关文章

随机推荐

热门标签

使用 ruby 获取 URL 的内容长度

使用 ruby 获取 URL 的内容长度的相关文章