如何在不下载内容的情况下执行 GET 请求？

2024-06-19

我正在开发一个链接检查器，一般来说我可以执行HEAD请求，但是有些网站似乎禁用了这个动词，所以在失败时我还需要执行GET请求（仔细检查链接是否确实已失效）

我使用以下代码作为我的链接测试器：

public class ValidateResult
{
  public HttpStatusCode? StatusCode { get; set; }
  public Uri RedirectResult { get; set; }
  public WebExceptionStatus? WebExceptionStatus { get; set; }
}


public ValidateResult Validate(Uri uri, bool useHeadMethod = true, 
            bool enableKeepAlive = false, int timeoutSeconds = 30)
{
  ValidateResult result = new ValidateResult();

  HttpWebRequest request = WebRequest.Create(uri) as HttpWebRequest;
  if (useHeadMethod)
  {
    request.Method = "HEAD";
  }
  else
  {
    request.Method = "GET";
  }

  // always compress, if you get back a 404 from a HEAD it can be quite big.
  request.AutomaticDecompression = DecompressionMethods.GZip;
  request.AllowAutoRedirect = false;
  request.UserAgent = UserAgentString;
  request.Timeout = timeoutSeconds * 1000;
  request.KeepAlive = enableKeepAlive;

  HttpWebResponse response = null;
  try
  {
    response = request.GetResponse() as HttpWebResponse;

    result.StatusCode = response.StatusCode;
    if (response.StatusCode == HttpStatusCode.Redirect ||
      response.StatusCode == HttpStatusCode.MovedPermanently ||
      response.StatusCode == HttpStatusCode.SeeOther)
    {
      try
      {
        Uri targetUri = new Uri(Uri, response.Headers["Location"]);
        var scheme = targetUri.Scheme.ToLower();
        if (scheme == "http" || scheme == "https")
        {
          result.RedirectResult = targetUri;
        }
        else
        {
          // this little gem was born out of http://tinyurl.com/18r 
          // redirecting to about:blank
          result.StatusCode = HttpStatusCode.SwitchingProtocols;
          result.WebExceptionStatus = null;
        }
      }
      catch (UriFormatException)
      {
        // another gem... people sometimes redirect to http://nonsense:port/yay
        result.StatusCode = HttpStatusCode.SwitchingProtocols;
        result.WebExceptionStatus = WebExceptionStatus.NameResolutionFailure;
      }

    }
  }
  catch (WebException ex)
  {
    result.WebExceptionStatus = ex.Status;
    response = ex.Response as HttpWebResponse;
    if (response != null)
    {
      result.StatusCode = response.StatusCode;
    }
  }
  finally
  {
    if (response != null)
    {
      response.Close();
    }
  }

  return result;
}

这一切都运行良好且花花公子。除了当我执行GET请求，整个有效负载被下载（我在wireshark中观看了这个）。

有没有办法配置底层ServicePoint or the HttpWebRequest根本不缓冲或急切加载响应主体？

（如果我手动编码，我会将 TCP 接收窗口设置得非常低，然后只抓取足够的数据包来获取标头，一旦我有足够的信息，就停止确认 TCP 数据包。）

_{for those wondering what this is meant to achieve, I do not want to download a 40k 404 when I get a 404, doing this a few hundred thousand times is expensive on the network}

当您执行 GET 时，服务器将从文件的开头到结尾开始发送数据。除非你打断它。当然，以 10 Mb/秒的速度，这将是每秒 1 兆字节，因此如果文件很小，您将获得整个文件。您可以通过多种方式最大限度地减少实际下载量。

首先，你可以打电话request.Abort收到回复后致电之前response.close。这将确保底层代码在关闭响应之前不会尝试下载整个内容。我不知道这是否对小文件有帮助。我确实知道它会阻止您的应用程序在尝试下载多千兆字节的文件时挂起。

您可以做的另一件事是请求一个范围，而不是整个文件。请参阅AddRange http://msdn.microsoft.com/en-us/library/f2cwk28s方法及其重载。例如，你可以写request.AddRange(512)，这只会下载文件的前 512 个字节。当然，这取决于支持范围查询的服务器。大多数都是这样。但是，大多数也支持 HEAD 请求。

您可能最终不得不编写一个按顺序尝试事物的方法：

尝试执行 HEAD 请求。如果有效（即不返回 500），那么就完成了
尝试使用范围查询进行 GET。如果没有返回 500，那么您就完成了。
执行常规 GET，并使用request.Abort after GetResponse返回。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在不下载内容的情况下执行 GET 请求？的相关文章

ExecuteNonQueryAsync 并在 SQL 事务中提交

我正在寻求对我创建的一段代码的帮助我正在尝试在事务中从 C 进行异步 SQL 调用例如我可能正在更新或删除表中的行这是我到目前为止所拥有的但我似乎无法找到有关在事务中执行此操作的太多信息根据我在这里所拥有的以及到目前为止我所理解的
资源文件中的控制字符 C#

我想添加Left To Right控制字符在resource resx文件输入Visual Studio 我在互联网上搜索并找到了一个名为在 NET 资源文件中转义序列的另一种方法 http www devx com tips Tip 34
如何防止函数中的隐式转换？

我正在编写一个实用程序类其中包含 IsEquals 和 IsGreaterThanEquals 等接受 double 类型参数的方法当我将浮点值发送到方法时它们会隐式转换为双精度值并进行比较我不希望这种事发生当我发送 float
安装/编译 pylzma（lzma python 绑定）

我已经向作者提出了这个问题website http www joachim bauch de projects pylzma comment page 1 comment 5211 但我想我也可以在这里问我一直在尝试使用以下设置安装 py
文件已创建但无法写入

我的计划检查Settings txt 文件如果该文件不存在则创建文本并自动写入其中如果 Settings txt 文件已存在请忽略不要创建或写入现有文件我的问题当文件不存在时 Settings txt 文件会创建但它是空的
ofstream::operator<<(streambuf) 是一种复制文件的缓慢方法

我需要一种跨平台无需外部库的复制文件的方式在我的第一遍中我想出了省略错误处理 char buffer LEN ifstream src srcFile ios in ios binary ofstream dest destFile
llvm clang 编译器上的dynamic_cast失败

我看到一个奇怪的失败dynamic cast正在返回NULL在 clang 编译器上但相同的代码可以在 gcc 环境下运行您能否指出根本原因是什么之间可能有什么区别dynamic cast关于 llvm 和 gcc 我正在使用两个编译
使用 C# 在 XML 文档中查找特定值的好方法是什么？

我正在调用 Oracle 公开的 WebService 它接受 ItemID 的输入并向我返回相应的 Item Number 我想获取从响应中包含的 XML 返回的项目编号 XML 看起来像这样
在多个线程中添加和删除时 List 中的 null 值

我知道 C System Collections Generic List 对象不是线程安全的但我想知道为什么这段代码会生成空值 Task Run gt for var i 0 i lt 10 i var str Test i list
WiX 安装程序在 vs 2012 上不起作用

我想为我的应用程序创建一个安装程序我已经下载了 WiX 3 6 并将其安装在 vs 2012 上创建简单的winform应用程序将 WiX 安装项目添加到我的解决方案中右键单击参考并将我的 winform 应用程序添加到安装程序的参
如何根据条件退出 PostSharp 方面的 OnEntry 方法中的方法

我希望方面根据如下条件退出方法调用 AttributeUsage AttributeTargets Method public class IgnoreIfInactiveAttribute OnMethodBoundaryAspect p
boost::bind 会导致开销吗？

我目前正在从事网络软件方面的工作它有一个主要类 server这显然代表一个服务器实例 A server实例可以发送请求并通过回调通知用户响应代码如下 class server public typedef boost function
基于 C++ 组件的类

Hi 我正在使用容器编写一个基于组件的类但是在考虑了许多不同的方法之后我找不到真正符合我想要的方法这是总体思路的一个例子我已经写的代码 Abstract class Component class Component public
访问控制器类中的 appsettings.json 值

无法弄清楚如何读取startup cs之外的appsettings json值例如我想做的是在 Layout cshtml 中从配置中添加站点名称例如 ViewData SiteName Configuration GetValue
是否可以使用 struct stat 描述符获取和设置文件名？

是否可以在获取或设置重命名文件名时给出文件的绝对路径并将 struct stat 实例作为 lstat 函数的参数正如我在文档结构中发现的那样 struct stat dev t st dev ID of device contai
Web API 2 c# 中的 Google reCaptcha

我有一个 ASP NET Web API 2 项目我正在尝试从表单中读取 Google Captcha 我尝试了这段代码 public string Post FoundingRequest model var response Requ
实现多个接口的 Service Fabric Actor 接口

我正在构建一个应用程序其中有多个不同的参与者类型这些参与者类型对于某些不同的数据对象具有相同类型的行为 CRUD 为了更轻松地创建处理此问题的代码我尝试创建一个这些参与者可以实现的接口这意味着我有一个看起来像这样的参与者界面 pub
对数据绑定组合框进行排序的最佳方法是什么？

我对此做了一些研究似乎对数据绑定组合框进行排序的唯一方法是对数据源本身进行排序在本例中为数据集中的数据表如果是这种情况那么问题就变成对数据表进行排序的最佳方法是什么组合框绑定在设计器中设置初始化使用 myCombo DataSou
找出用户属于哪些组

我有一个刚刚创建的 Windows 用户帐户以 XYZ 为例此 XYZ 属于我在计算机管理 gt 本地用户和组中创建的用户组和自定义组因此在属性中我看到该用户属于 2 个组现在我想获取这些组并显示它们有什么建议么我已经这样做了
Windows 安装程序 (C#) 错误代码 2869

我在 VS 2005 中有一个项目其中有一个控制台应用程序和一个与安装该应用程序关联的安装项目我在控制台应用程序中还有一个安装程序类安装项目将使用它在安装前进行一些验证这些任务正在检查数据库连接字符串并检查某些目录位置以确保它们在安

随机推荐

输入类型 = AngularJS 中的数字验证

我正在尝试验证 lt input type number gt 通过使用输入数字 AngularJS 模块 ng 的指令当使用数字类型的输入时最大或最小属性设置为数字例如
Express Mongoose DB.once('open')无法执行回调函数

exports c 39 function req res var mongoose require mongoose mongoose createConnection mongodb localhost cj var db mongoo
编译错误：只有赋值、调用、递增、递减和新对象表达式可以用作语句[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 string cipherData byte cipherbytes byte plainbytes byte plainbyte
LightGBM：继续训练模型

我正在使用交叉验证来训练模型如下所示 classifier lgb Booster params params train set lgb train set result lgb cv init model classifier par
如何暂停或恢复 celery 任务？

我的项目中有一项要求客户可以暂停或恢复正在挂起的流程而不是流程流程我在用网络套接字显示芹菜任务结果但在暂停恢复时我不明白如何设计代码我想到的唯一方法就是revoke暂停请求中的任务同时保留数据撤销的过程在缓存中并稍后在res
高效秒表

您好我正在用 javascript 编写一个秒表实用程序我有一个关于效率和开销的问题我考虑过两种制作秒表的方法 1 存储开始日期并不断测量自该日期以来经过的毫秒数 2 创建一个整数并按设定的时间间隔递增其值我想知道哪个最有效另外
我如何在 viewDidLoad 中执行 UIView animateWithDuration ？ IOS 7

我在 viewDidAppear 中尝试这个但我有一秒钟的延迟我能做什么在 viewDidLoad 中工作 void viewDidAppear BOOL animated fullRotation CABasicAnimation
有没有办法避免自动更新 Rails 时间戳字段？

如果您有数据库列created at and updated at当您创建和更新模型对象时 Rails 将自动设置这些值有没有办法在不接触这些列的情况下保存模型我正在引入一些旧数据我想根据不同名称的旧数据字段中的相应值设置这些值
无法访问类型的封闭实例。 [复制]

这个问题在这里已经有答案了整个代码是 public class ThreadLocalTest ThreadLocal
带有 jQuery 日期选择器 OnTextChanged 的文本框未触发

我有一个带有 OnTextChanged 事件的 asp textbox 当从绑定到它的 jQuery 日期选择器中选择新日期时我想触发该事件但在选择日期时 OnTextChanged 永远不会触发如果我手动更改文本它会触发但
字符串模板：使所有变量声明全局

我正在尝试使用 ANTLR StringTemplate 实现翻译器我有一种类似于 java 的起始语言和多种目标语言我用了这个例子 http www antlr org wiki display ST Language Transla
如何设置 tmux 在启动时打开指定的窗口？

如何设置 tmux 使其在启动时打开指定的窗口您可以编写一个小 shell 脚本来启动 tmux 以及所需的程序我在一个名为 dev tmux 的 shell 脚本中包含以下内容开发环境 bin sh tmux new session
检测输入何时具有“只读”属性

我想在输入具有只读属性时发出警报我已经尝试过这个 if input attr readonly readonly alert foo 我认为如果甚至不是最好的方法最快的方法是使用 is jQuery 函数 if input is
使用 include 的 Javascript 过滤对象

我正在尝试使用 javascript 中的 filter 函数来过滤对象我想过滤这样的数组 1615 1616 它在代码中被引用为 value verdier 数据集是一个大型数组包含从 JSON 字符串解析的具有多个属性的对象数组中
将箱线图添加到Python中的其他图表中

这两个图的每个点的 x 轴值完全相同是否可以在第一个图的顶部显示盒须我试过这个 fig1 plt figure ax fig1 add subplot 211 ax set xscale log ax plot x7 y7 c ax p
正则表达式将从文本文件中提取句子

我需要一个正则表达式来从文本文件中提取句子示例文本以 2004 年底发生的亚洲海啸灾难为例对 Google 新闻 http news google com 的查询在一个月内 1 月 17 日返回了超过 80 000 篇有关该事件的在
如何发布数组多维角度js

我在 angularjs 中有一个数组示例如下 scope order qty 20 scope order adress Bekasi scope order city Bekasi 这个数组可以用这个代码发布 http method
x86 asm 的 NASM 语法中的括号是什么意思？

给出以下代码 L1 db word 0 mov al L1 mov eax L1 括号里是什么意思 L1 代表这个问题专门针对 NASM Intel 语法汇编的另一个主要风格是 MASM 风格当不涉及寄存器时括号的工作方式有所不同 S
artisan 明确编译返回错误代码 255

跑步时composer install在我的 laravel 项目中我收到错误脚本 php artisan 清晰编译处理返回的 post install cmd 事件错误代码为 255 关于可能出现的问题有什么建议吗请注意 comp
如何在不下载内容的情况下执行 GET 请求？

我正在开发一个链接检查器一般来说我可以执行HEAD请求但是有些网站似乎禁用了这个动词所以在失败时我还需要执行GET请求仔细检查链接是否确实已失效我使用以下代码作为我的链接测试器 public class ValidateResul

如何在不下载内容的情况下执行 GET 请求？

如何在不下载内容的情况下执行 GET 请求？ 的相关文章

随机推荐

热门标签

如何在不下载内容的情况下执行 GET 请求？的相关文章