c# 在html中查找图像并下载它们

2023-12-29

我想下载存储在 html（网页）中的所有图像，我不知道将下载多少图像，并且我不想使用“HTML AGILITY PACK”

我在谷歌中搜索，但所有网站都让我更加困惑，

我尝试了正则表达式，但只有一个结果......，

人们给了你正确的答案——你也不能挑剔和懒惰。 ;-)

如果您使用不成熟的解决方案，您将处理很多边缘情况。这是一个工作示例，它使用以下命令获取 HTML 文档中的所有链接HTML 敏捷包 http://htmlagilitypack.codeplex.com/SourceControl/changeset/view/33420#52167（它包含在 HTML Agility Pack 下载中）。

这是一篇博客文章，展示了如何使用 HTML Agility Pack 和 LINQ 抓取 HTML 文档中的所有图像 http://matthew-marksbury.blogspot.com/2009/07/screen-scraping-with-htmlagilitypack.html

    // Bing Image Result for Cat, First Page
    string url = "http://www.bing.com/images/search?q=cat&go=&form=QB&qs=n";

    // For speed of dev, I use a WebClient
    WebClient client = new WebClient();
    string html = client.DownloadString(url);

    // Load the Html into the agility pack
    HtmlDocument doc = new HtmlDocument();
    doc.LoadHtml(html);

    // Now, using LINQ to get all Images
    List<HtmlNode> imageNodes = null;
    imageNodes = (from HtmlNode node in doc.DocumentNode.SelectNodes("//img")
                  where node.Name == "img"
                  && node.Attributes["class"] != null
                  && node.Attributes["class"].Value.StartsWith("img_")
                  select node).ToList();

    foreach(HtmlNode node in imageNodes)
    {
        Console.WriteLine(node.Attributes["src"].Value);
    }

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

c# 在html中查找图像并下载它们的相关文章

多个源的 makefile

在学习 make 文件时我试图为多个源目录编写一个 make 文件似乎我在某个地方错了这是我的代码结构 directory common fun2 c inc fun h src fun1 c main c 这是我的生成文件 CC c
在 Java 中创建 T 的新实例

在C 中我们可以定义一个泛型class A
在现代 C++ 中，临时生命周期延长何时有用？

在 C 中您可以将函数的返回值返回值而不是引用绑定到 const 引用并且代码仍然有效因为该临时对象的生命周期将延长到作用域末尾例如 std string get string return abc void f const
解析 JWT 令牌以仅获取有效负载内容，无需 C# 或 Blazor 中的外部库

我正在使用 Blazor 编写可以访问 JWT 的客户端应用程序我想知道一种简单的方法来读取令牌有效负载内容而不添加额外的依赖项因为我不需要其他信息也不需要验证令牌我认为解析有效负载内容应该足够简单只需将其写入方法即可 JwtTo
如何使用 SOAP 且不使用 WSE 在 .NET 中签署 Amazon Web 服务请求

亚马逊产品广告 API 以前称为 Amazon Associates Web Service 或 Amazon AWS 实施了一项新规则即自 2009 年 8 月 15 日起向其发送的所有 Web 服务请求都必须经过签名他们在其网站上
从模板切换传递的类型

在 C 中是否可以检查传递给模板函数的类型例如 template
检测到堆栈崩溃

我正在执行我的 a out 文件执行后程序运行一段时间然后退出并显示消息 stack smashing detected a out terminated Backtrace lib tls i686 cmov libc so 6 f
C# 5 async/await 线程机制感觉不对？

为什么让调用线程进入异步方法直到内部等待一旦调用异步方法就生成一个线程这不是更干净吗这样您就可以确定异步方法会立即返回您不必担心在异步方法的早期阶段没有做任何昂贵的事情我倾向于知道某个方法是否要在我的线程上执行代码不管是堵
一元 +/- 运算符如何可能导致“-a”或“+a”中的整数提升，“a”是算术数据类型常量/变量？

这句看似微不足道的台词摘自我的迈克巴纳汉和布雷迪的 C 书第 2 8 8 2 节 http publications gbdirect co uk c book chapter2 expressions and arithmetic h
在 omp 并行 for 循环中使用 unique_ptr 会导致 SEG.FAULT

采取以下代码 include
C# 开源 NMEA 解析器 [已关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找 C 开源 NMEA 解析器嗯我自己也不熟悉但是一些快速搜索显示了一个代码项目 htt
C# 编译器不会优化不必要的强制转换

前几天在写答案的时候这个问题 https stackoverflow com questions 2208315 why is any slower than contains在这里关于溢出我对 C 编译器感到有点惊讶它没有按照我的
根据对象变量搜索对象列表

我有一个对象列表这些对象具有三个变量 ID 名称和值这个列表中可能有很多对象我需要根据ID或Name找到一个对象并更改值例子 class objec public string Name public int UID public
引用/指针失效到底是什么？

我找不到任何定义指针引用无效在标准中我问这个问题是因为我刚刚发现 C 11 禁止字符串的写时复制 COW 据我了解如果应用了 COW 那么p仍然是一个有效的指针并且r以下命令后的有效参考 std string s abc std st
Linux mremap 不释放旧映射？

我需要一种方法将页面从一个虚拟地址范围复制到另一个虚拟地址范围而无需实际复制数据范围很大延迟很重要 mremap 可以做到这一点但问题是它也会删除旧的映射由于我需要在多线程环境中执行此操作因此我需要旧映射能够同时使用因此稍后当
在 OpenGL 中渲染纹理 1 到 1

所以我想做的是使用 OpenGL 和 C 将纹理渲染到平面上作为显示图像的一种方式但是我需要确保在渲染纹理时没有对纹理进行任何处理抗锯齿插值平滑模糊等这是 OpenGL 处理渲染纹理的默认方式吗或者是否需要设置一些标志才能禁
ASP.NET MVC 路由：如何从 URL 中省略“索引”

我有一个名为 StuffController 的控制器具有无参数索引操作我希望从表单中的 URL 调用此操作mysite com stuff 我的控制器定义为 public class StuffController BaseContr
需要提取字符串中点后的最后一个数字，如“7.8.9.1.5.1.100”

我需要提取 C 字符串中最后一个点后面的最后一个数字例如 7 8 9 1 5 1 100 并将其存储在整数中 Added 该字符串也可以是 7 8 9 1 5 1 1 或 7 8 9 1 5 1 0 我还想验证它在最后一个点之前恰好是 7
INotifyPropertyChanged 和 propertyName

我一直不确定它的含义propertyName实施时INotifyPropertyChanged 所以一般来说你实现INotifyPropertyChanged as public class Data INotifyPropertyChan
DataContractSerializer 事件/委托字段问题

在我的 WPF 应用程序中我正在使用DataContractSerializer序列化对象我发现它无法序列化具有事件或委托声明的类型考虑以下失败的代码 Serializable public abstract class BaseCl

随机推荐

使用 UIWebView 进行手势识别

我在我正在构建的应用程序中设置了一些手势识别功能其中一种手势是单指单击它会隐藏屏幕顶部的工具栏效果很好除了一件事点击链接也会导致工具栏消失是否可以检测到不是链接点击的点击我可以通过查看点击发生的位置来做到这一点并且仅在 ht
如何正确使用insertRowsAtIndexPaths？

我浏览了在线的所有示例但无法弄清楚如何正确地将单元格添加到带有动画的表格视图中假设我有一个包含一个单元格的部分当用户单击第一个单元格的附件时我想添加另一个单元格我的添加方法执行以下操作 IBAction toggleEnabl
Qt状态栏颜色

我将 Qt 与 Python 结合使用并且有一个底部带有状态栏的主窗口我可以使用 QLabel 在栏中显示一条消息并使用类似的方法设置该消息的颜色 font color In progress font 对于 QLabel 文本我还
GO - 本地导入不起作用

我是 golang 新手我想构建我的第一个简单的 Web 应用程序每次我想构建源代码时都会收到错误locale import controllers in non local package 这是我的文件夹结构 goTest Dock
在arm64上安装构建工具不起作用

我一直在尝试安装sdkmanager build tools 30 0 2 在arm64处理器安培CPU 上但每次我得到这个 Warning Dependant package with key emulator not found W
如何通过 apache 渲染 .phtml 文件

我想通过 Apache 渲染 phtml 文件但是当我尝试时它会将页面渲染为文本而不是 html 在我的虚拟主机配置中如果我尝试渲染index php 它会正确执行但是当我将 DirectoryIndex 更改为 index ph
如何通过asp.net mvc中的api调用将文件上传到服务器上

public ActionResult Index PublishPost post HttpPostedFileBase file var apiURL http test sa com rest social update 1161 u
内核清零内存？

我正在使用 Debian squeeze 并注意到内存总是归零这是 Linux 发行版中的新功能吗前段时间我相信我可以使用 put 并且会输出垃圾我多次运行这个测试程序但注释的结果总是相同的我在 sysctl conf 中有 r
如何根据谷歌地图中标记的相对位置制作多边形？

我有一个标记列表我想在其周围创建一个多边形显示标记周围的区域而不是标记本身因此我希望多边形包裹在标记周围以显示它们周围的相对区域而不是让多边形点成为标记的直接纬度经度关于我如何完成这样的事情有什么想法吗这被称为凸包有
需要对开发者控制台上的 beta/alpha 测试进行一些说明

背景 Android 开发者控制台有 3 个选项卡用于发布应用程序的 apk 文件 alpha beta 和 production 如下所示我记得在一次 Google IO 讲座中在进行 100 规模发布之前检查应用程序的好坏的一个很酷
单击网格中的 LinkButton 时避免页面刷新

我有一个GridView控件并且在该控件内部我使用定义了一个链接按钮GridView ItemTemplate 我用它来点击打开一个新窗口但是当我单击链接按钮时页面会在打开新窗口之前刷新单击链接按钮后如何阻止页面刷新当我将更新面
D3 网格中的力模拟

我想知道如何修改Mike Bostock 的多力布局示例 https bl ocks org mbostock 1021841为了尝试获得强制布局以对网格中的节点进行分组让我们假设我们有以下 csv Name Category1 Cate
从字符串创建可变长度数组

字符串 string a b c d 应该创建一个像这样的数组 array a gt array b gt array 我想出了这个 function create array arr string data parts explode s
Webpack 警告：您可能需要适当的加载器来处理此文件类型 (date-nfs)

我的应用程序有问题我有一个网站我使用 date fns 根据用户语言显示格式化日期它工作得很好但我更新了 date fns 从那以后我收到了一个警告在我的 JavaScript 代码中我使用 const locale requir
尝试/捕获或验证速度？

我正在使用 Python 每当我必须验证函数输入时我都会假设输入有效然后捕获错误就我而言我有一个通用的Vector 我用它来做一些不同的事情其中之一就是加法它的功能既是Color 类并作为Vector 所以当我向Color 它
如何在 Android 中从全名中拆分名字和姓氏字符串

我有一张带有全名的表格EditText字段我想将字符串分解为名字和姓氏字符串谁可以帮我这个事我可以知道实现我的目标的正确方法是什么吗如果用户输入他她的名字例如A B C 名字将是A 姓氏遗嘱BC 我正在尝试这个 EditText
在 google chrome 版本 54 中，禁用字段是不可选择的

似乎在上次 google chrome 版本 54 更新后我无法通过鼠标文本从我的网站中的禁用字段中进行选择 Text inside this input not selectable by mouse but before it was
cuda & rdc & 推入多个共享对象会在 registerEntryFunction 中产生 SIGSEV

我正在尝试在两个共享库中运行可重定位设备代码两者都使用 cuda thrust 如果我停止在 kernel cu 中使用推力一切都会正常运行这不是一个选项编辑如果 rdc 被禁用该程序也可以工作对我来说也不是一个选择它编译得
如何在 HTML 工具提示中使用回车符？

我目前正在向我们的网站添加详细的工具提示并且我希望无需求助于出色的 jQuery 插件我知道有很多使用回车符来格式化工具提示要添加提示我正在使用title属性我浏览了常用网站并使用了以下基本模板 a title link wi
c# 在html中查找图像并下载它们

我想下载存储在 html 网页中的所有图像我不知道将下载多少图像并且我不想使用 HTML AGILITY PACK 我在谷歌中搜索但所有网站都让我更加困惑我尝试了正则表达式但只有一个结果人们给了你正确的答案你也不能挑剔和懒惰

c# 在html中查找图像并下载它们

c# 在html中查找图像并下载它们 的相关文章

随机推荐

热门标签

c# 在html中查找图像并下载它们的相关文章