我正在使用 WinINET 编写一个下载文件实用程序,并且注意到(特别是在大型下载时),WinINETInternetOpenUrl()
调用仅在整个 HTTP 响应下载完毕后返回。
我通过使用 Charles 代理工具以及 WireShark 确认了这一点,并注意到下载完全完成,然后 WinINET 才通知我的代码。
一些简化的(同步)代码:
hInt = InternetOpen(USER_AGENT_NAME, INTERNET_OPEN_TYPE_PRECONFIG,
NULL, NULL, 0);
DWORD dwRequestFlags = INTERNET_FLAG_NO_UI // no UI please
|INTERNET_FLAG_NO_AUTH // don't authenticate
|INTERNET_FLAG_PRAGMA_NOCACHE // do not try the cache or proxy
|INTERNET_FLAG_NO_CACHE_WRITE; // don't add this to the IE cache
hUrl = InternetOpenUrl(hInt, szURL, NULL, 0, dwRequestFlags, NULL);
if (hUrl)
{
// <only gets here after entire download is complete>
InternetCloseHandle(hUrl);
}
InternetCloseHandle(hInt);
文档suggests这会发送请求,并处理响应的标头(未完成下载),然后您预计会运行InternetReadFile()
循环直到返回TRUE
and dwNumberOfBytesRead
is 0.
来自MSDN
InternetOpenUrl 函数 http://msdn.microsoft.com/en-us/library/aa385098(v=VS.85).aspx:InternetOpenUrl 函数解析 URL 字符串,建立与服务器的连接,并prepares下载由 URL 标识的数据。然后应用程序可以使用 InternetReadFile [...] 来检索 URL 数据。
网络读取文件函数 http://msdn.microsoft.com/en-us/library/aa385103(v=VS.85).aspx:为了确保检索到所有数据,应用程序必须继续调用 InternetReadFile 函数,直到该函数返回 TRUE 并且 lpdwNumberOfBytesRead 参数等于 0。
我也尝试过使用异步方法,并注意到同样的事情。具体来说,INTERNET_STATUS_RESPONSE_RECEIVED
仅在下载完成后发送到注册的回调方法。这意味着我的客户端只能在下载完成后开始访问数据。
同样,我也实现了一个使用 WinHttp 库的版本,并注意到完全相同的结果。
当涉及到超时时,这会让事情变得棘手。如果下载超过超时(默认为 30 秒),InternetOpenUrl()
fails.
所以我有两个问题:
如果这是 WinInet 和 WinHttp 库的预期行为,为什么文档建议循环遍历InternetReadFile()
调用时,为什么不直接读取整个缓冲区(毕竟 WinINET 已经有了)?
我理解提供该功能,因为您并不总是希望分配 150MB 内存块,但提供的借口是您不知道有多少数据可用......但 WinINET 已经完成了下载。
为什么让它看起来非常像recv()
如果方法只是对临时文件或 IE 缓存中的文件(或更糟糕的是浪费的内存块)的抽象,那么方法就结束了?
我应该将超时长度设置为多少?如果我永远不知道超时之前数据有多大,那么我如何决定将超时值设置为多少?
这是预期的行为吗?如果是,是否有办法在数据流式传输时获取数据?
在连接速度较慢或文件较大的情况下,可以想象在整个下载完成之前可以对数据进行大量工作。在 HTTP 的经典 Berkley 套接字重新实现中,循环遍历recv()
调用将为我提供数据,这最终是我所需要的。
是的,我可以使用简单的套接字重写一个实现,但我不想浪费时间来支持整个 HTTP 规范和 SSL 加密,更不用说 WinINET 中的代理支持了。