从网站批量下载图像的最佳方法

2024-04-21

我将从网站下载大量图像（+20.000）到我的服务器，并且我正在尝试找出执行此操作的最佳方法，因为有太多图像需要下载。

目前我有下面的代码可用于测试。但是有更好的解决方案还是我应该使用一些软件来做到这一点？

foreach ($products as $product) {

$url = $product->img;
$imgName = $product->product_id
$path = "images/";

$img =  $path . $imgName . ".png";

file_put_contents($img, file_get_contents($url));

}

另外，当我一次下载这么多图像时，是否有可能会破坏某些东西或使网站崩溃？

首先，我同意@Rudy Palacois 的观点，wget 可能会更好。也就是说，如果你想在 PHP 中执行此操作，curl 会比 file_get_contents 快得多，原因有两个。

1：与file_get_contents不同，curl可以重用同一个连接来下载多个文件，而file_get_contents将为每个下载创建并关闭一个新连接，这需要时间，因此curl会更快（只要你不使用CURLOPT_FORBID_REUSE / CURLOPT_FRESH_CONNECT ，反正）

2：curl停止下载时Content-Lengthhttp 标头的字节已下载。但是 file_get_contents 完全忽略这个标头，并继续下载它可以下载的所有内容，直到连接关闭。这可能又比curl的方法慢得多，因为连接何时关闭取决于Web服务器，在某些服务器上，它比读取Content-Length字节慢很多。

（一般来说，curl 比 file_get_contents 更快，因为curl 支持压缩传输、gzip 和 deflate，而 file_get_contents 不支持压缩传输……但这通常不适用于图像，最常见的图像格式已经预先压缩。值得注意的例外包括.bmp不过是图像）

像这样：

$ch = curl_init ();
curl_setopt ( $ch, CURLOPT_ENCODING, '' ); // if you're downloading files that benefit from compression (like .bmp images), this line enables compressed transfers.
foreach ( $products as $product ) {

    $url = $product->img;
    $imgName = $product->product_id;
    $path = "images/";

    $img = $path . $imgName . ".png";
    $img=fopen($img,'wb');
    curl_setopt_array ( $ch, array (
            CURLOPT_URL => $url,
            CURLOPT_FILE => $img 
    ) );
    curl_exec ( $ch );
    fclose($img);
    // file_put_contents ( $img, file_get_contents ( $url ) );
}
curl_close ( $ch );

编辑：修复了一个破坏代码的拼写错误，它被称为CURLOPT_FILE, not CURLOPT_OUTFILE

编辑2：CURLOPT_FILE想要一个文件资源，而不是文件路径，也修复了这个问题x.x

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从网站批量下载图像的最佳方法的相关文章

值得学习的优秀 Zend Framework 示例应用程序 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
将纪元时间转换为日期 PHP

我现在正在使用一个 API 它提供了一个 epochTime 我已尝试一切方法将此纪元转换为日期但它似乎不起作用包括 epoch time 1000然后使用date 函数来转换它纪元时间看起来像这样 1353430853299 有办法
如何计算PHP中内置函数的总数？ [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 如何计算
从多行中选择数据并对其进行排序[重复]

这个问题在这里已经有答案了 id title content class 1 t1 p1 1 2 t2 p6 1 3 t3 p5 2 4 t4 p8 3 对于这个表我如何使用 1 个查询来SELECT所有课程DISTINCTLY变成这个
Web 本地应用程序 Apache：运行 shell 脚本

我开发了一个 shell 脚本我想用它创建一个 UI 我决定使用带有本地服务器的 Web 界面因为我对 HTML PHP 的了解很少比 QT 或 Java 的了解更多我只是希望我的 html 可以在我的计算机上运行 shell 脚本
是否可以仅在一张表上运行“symfonydoctrine build --all”任务？

如果我运行以下任务它会构建所有内容并清除数据库 php symfony doctrine build all 我希望此任务仅针对我放入 schema yml 的新表运行是否可以我认为你应该为此使用迁移首先您需要恢复初始状态当模式
php中UCS2/HexEncoded字符转UTF8

我之前问过一个问题从 UTF 8 获取 UCS 2 HexEncoded 字符串我在以下链接中得到了一些人的帮助 UCS2 HexEncoded 字符 https stackoverflow com questions 1872773
(PHP)：使用 Zend_Test_PHPUnit_DatabaseTestCase 测试模型

当我运行 PHP 单元测试时我得到 1 Test Model Mapper TestTest testTest Argument 1 passed to PHPUnit Extensions Database DataSet Defaul
Monolog Logger 在每个日志消息的末尾输出空数组

我的记录器对象在每行末尾输出空数组例如 2017 08 17 12 26 02 import log INFO checkForDuplicates is processing 2017 08 17 12 26 04 import log
如何使用xampp连接sql服务器和php？

我正在尝试使用 Xampp 将我的 SQL 服务器与 PHP 连接我已经在ext文件夹中上传了dll文件但无法连接它我的PHP版本是7 2 6 上传的dll文件是 php pdo sqlsrv 72 ts dll php sqlsrv
使用 SimpleXML 从 XML 获取多个项目

我正在尝试使用下面的代码循环 XML 中的多个项目 xml get data the url data simplexml load string xml foreach data gt item AS item foreach item
使用 PHP 简单 DOM 解析器的递归

由于某种原因我在使用简单 DOM 解析器库时遇到了递归我的 HTML 是这样的 div div class some div some text div div class field 1 misc1 a href Some text
PHP如何使用“ XML 中的实体与 DOMdocument

我正在修改由其他库生成的 XML 文件的内容我正在使用 PHP 5 3 10 进行一些 DOM 修改并重新插入替换节点我正在使用的 XML 数据有 quot 在进行操作之前的元素我想保留这些元素http www w3 org TR R
Unix cURL POST 使用文件中的内容到特定变量

我已经搜索过这个答案但没有找到任何有效或完全符合我的问题的答案使用 Unix cURL 我需要将键值对发布到服务器密钥将是 MACs 换行符分隔的 MAC 地址文件的内容将是此 POST 的 VALUE 我试过了 curl d fi
PHP 中字符串中的类常量

我的阅读手册 http www php net manual en language types string php language types string parsing 标题字符串访问和按字符修改之前的部分是您可以在字符串
获取数组的第一个元素

我有一个数组 array 4 gt apple 7 gt orange 13 gt plum 我想获取这个数组的第一个元素预期结果字符串apple 要求一它不能通过引用传递来完成 so array shift这不是一个好的解决方案我
如何通过 JQuery Post 传递 Javascript 数组，以便可以通过 PHP $_POST 数组访问其所有内容？

如何通过 JQuery Post 传递 Javascript 数组以便可以通过 PHP POST 数组访问其所有内容请展示一个可以实现此目的的代码示例 Thanks 如果你想传递一个 JavaScript 对象哈希即 PHP 中的关
使用 PHP 的 HTML 中的选项字段

我想根据从下拉列表中选择的区域名称搜索员工列表我可以将数据库中的区域名称检索到 PHP HTML 的下拉列表中但现在我很困惑如何将下拉列表中的选定选项传递给 PHP 中的 SQL 查询我还想要索引号选定的选项我的代码如下
php 中是否可以使用正则表达式替换短语后面的单词？

输入文本工程学院医学院所需产出教育学院教育学院规则 school of 后面的任何单词都需要替换为 education inputext school of engineering school of medicine rule
PHP 错误：php_network_getaddresses：getaddrinfo 失败：（从其他站点获取信息时。）

尝试从外部源获取信息时我收到以下错误 Warning php network getaddresses getaddrinfo 失败第行名称解析暂时失败昨天一切都很好那么这个脚本发生了什么它不起作用并给我上面的错误有什么解决方

随机推荐

node.js 与 Apache PHP 一起运行？

我正在尝试了解 Node js 我对我的 LAMP 设置非常满意因为它目前满足我的要求虽然我想在我的 PHP 应用程序中添加一些实时功能例如显示当前登录我的网站的所有用户以及可能的聊天功能我不想更换我的 PHP 后端但我确实想要可
ASP.NET 通用提供程序可以实现哪些默认 sql 提供程序无法实现的功能？

ASP NET 通用提供程序的自述文件内部NuGet包 http nuget org List Packages System Web Providers是这个报价吗 ASP NET 版本 4 中附带的 SqlMembershipProvi
SecurityException：无法找到 dex.jar android 的字段

昨天晚上我升级到ADT 21并重新启动 Eclipse 然后eclipse说需要将android tool更新到21版本我下载了window installer21并将其安装在我之前安装 window installer 的同一位置所以
独立应用程序中的 JNDI 对象创建

可以创建 JNDI llookup 并在独立应用程序中引用它无需任何应用程序服务器 java comp env jdbc Regards Chaitu JNDI是Java平台提供的一项服务参考下面的链接 http www javawor
将 byte[] 或对象转换为 GUID

我为对象数据类型分配了一些值例如 object objData dc GetDirectoryEntry Properties objectGUID Value 该对象返回如下值 byte 16 0 145 1 104 2 117 3 1
从非常大的未排序列表中获取最大 X 数字的最快方法？

我试图从我的程序生成的分数列表中获取最高的分数例如 100 分不幸的是该列表很大大约数百万到数十亿因此排序是程序中一个耗时的部分排序以获得前 100 名分数的最佳方法是什么到目前为止我能想到的唯一两种方法是要么首先将所有分数生
NoSQL：如何根据经纬度检索“房子”？

我有一个用于存储房地产的 NoSQL 系统我在每栋房子的键值存储中拥有的一条信息是longitude and latitude 如果我想检索地理纬度经度框中的所有房屋如下面的 SQL SELECT from houses WHERE
比较两个map::iterators：为什么它需要std::pair的复制构造函数？

下面非常简单的代码在 C 98 中编译和链接时不会发出警告但在 C 11 模式中会出现难以理解的编译错误 include
刷新 div，但前提是 php 文件中有新内容

背景信息我现在正在摆弄一些 PHP 和 AJAX 尝试让代码用于包含注释的自动刷新 div 每 10 秒这是我用来刷新 div 的 javascript 代码将填充名为 content ma
Python 包不是源自文件系统

在蟒蛇中文档 https docs python org 3 reference import html描述导入系统有以下内容重点是我做的您可以将包视为文件系统上的目录将模块视为目录中的文件但不要过于字面地理解这个类比因为包和模
如何将我的操作重定向到网站的根目录？

我的控制器中有以下代码用于在用户注销后重定向用户 public ActionResult Logout FormsAuthentication SignOut return new RedirectToRouteResult new Ro
FontLoader 和 TextGeometry 未在 Threejs 中正确导入

我正在尝试在 BoxGeometry 侧面的前右左和顶部添加 3D 文本我实现了这个代码如下 loadFont gt const loader new THREE FontLoader loader load https threej
随机数据生成器在Python中对正则表达式进行数学运算

在 python 中我正在寻找 python 代码我可以使用它来创建与任何正则表达式匹配的随机数据例如如果正则表达式是 d 1 100 我想要一个随机数列表随机长度在 1 到 100 之间均匀分布有一些正则表达式逆变器可用
如何在用户打开活动时在地图上添加标记，并在用户移动时更新每个标记的实时位置？

我的应用程序中有一个活动Map当用户从他们的设备打开此活动时会添加一个标记来显示他们当前的位置然后添加一个内部标记Service更新实时位置的代码所在的类这是我的代码 mDatabase child rID addChildEvent
我应该创建自己的对象模型来处理复杂的 Sharepoint 对象吗？

我正在尝试做一些相当简单的事情但使用 SharePoint API 似乎是一项几乎不可能完成的任务我的 SharePoint 数据结构如下 Folder 子文件夹项目A B项 C项 D项由于某些奇怪的原因您无法以您期望的分层方式访
Rails：预编译资产缺少节点模块

我在rails 5 1应用程序中使用yarn 不是webpacker 只是默认的资源管道在开发环境中运行本地服务器我的资产没有遇到任何问题但是一旦我预编译我的资产环境并不重要或让 Heroku 打包我的资产我从我的内部导入的所有
在 np.array 上应用 cv2.boundingRect

如何申请cv2 boundingRect to a np array点以下代码会产生错误 points np array 1 2 3 4 dtype np float32 import cv2 cv2 boundingRect point
捆绑安装未从我的更新后挂钩运行

我已经为我的项目设置了更新后挂钩我有一个我推送到的裸存储库 var git myproject 以及一个运行我的应用程序的实时存储库 var www myproject 我还包括bundle install and bundle exec
如何在 Ubuntu 的 headless chrome 中启用 WebGL？

如何在 Ubuntu 14 的 headless chrome 中启用 webgl 或安装 webgl 我尝试安装 libosmesa6 但这没有帮助有人可以指出我正确的方向吗我想使用 webgl 来处理无头 chrome 和 sele
从网站批量下载图像的最佳方法

我将从网站下载大量图像 20 000 到我的服务器并且我正在尝试找出执行此操作的最佳方法因为有太多图像需要下载目前我有下面的代码可用于测试但是有更好的解决方案还是我应该使用一些软件来做到这一点 foreach products as

从网站批量下载图像的最佳方法

从网站批量下载图像的最佳方法 的相关文章

随机推荐

热门标签

从网站批量下载图像的最佳方法的相关文章