PHP:从网站提取 HTML 数据[关闭]

2024-03-27

我想从网站中提取姓名、地址和电子邮件

http://agentquery.com/agent.aspx?agentid=13

如何在 PHP 中使用 file_get_contents() 来做到这一点

For e.g

$abc = file_get_content("http://agentquery.com/agent.aspx?agentid=13");

现在我怎样才能从中提取姓名、电子邮件和地址呢?


这可以通过以下方式完成file_get_contents()和一些正则表达式处理。您必须确保您有fopen URL 包装器 http://php.net/manual/en/filesystem.configuration.php在 PHP.ini 中启用

您需要抓取页面,然后找到要解析的唯一字符串。这是为了获取名称:

<?php

$page = file_get_contents('http://agentquery.com/agent.aspx?agentid=13');

// name will be inside a span ctl00_Agent1_lblName, store it in $agent_name
preg_match("/<span id=\"ctl00_Agent1_lblName\".*span>/", $page, $agent_name);

// display agent name matches
print_r($agent_name);
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PHP:从网站提取 HTML 数据[关闭] 的相关文章

  • PHP日期时间“下周星期三”给我星期一

    我正在尝试使用以下方法获取下周星期三的日期new DateTime next week wednesday 然而 它返回2016 12 19 00 00 00 000000今天是星期一 为什么会这样呢 如何得到正确的结果 我尝试在在线 PH
  • PHP - 从图像创建一张图像

    我有 n 张图像 想用 php 代码创建一张 我使用 imagecopymerge 但无法成功 请举一些例子 Code numberOfImages 3 x 940 y 420 background imagecreatetruecolor
  • 使用 href 和 php 从 sql 数据库对 html 表进行排序

    我有一个 html 表 其中包含来自 php 吐出的 sql 表的产品数据 我想通过单击表列的标题对数据进行排序 我像这样输出我的表 php product list sql mysql query SELECT FROM products
  • PHP7 返回类型为 JSON

    PHP 7 有一个新功能 即返回类型声明 我们可以返回一个 字符串 类型 例如 function myFunction a string 我们还可以返回一个 数组 类型 例如 function myFunction a array 但是我们
  • PayPal Rest API for Payments 在沙箱中返回 NULL

    我有一个 PayPal 沙盒帐户 我可以在 PHP 上使用curl 通过 api 检索令牌 但是处理测试卡只会返回 null 有人看到代码有问题吗 这是 PayPal 沙盒的已知问题吗 下面代码片段中的客户端是伪造的 但是 如前所述 使用我
  • Magento 1.8 - 高级搜索不起作用

    我在最新版本的 magento 中发现了一个奇怪的错误 高级搜索工具无法正常工作 我做了什么 安装 magento 的新副本 在管理页面添加了一个名为 测试 1 的产品 重新索引全部 清除所有缓存 At the frontend page
  • PHP:__toString() 和 json_encode() 不能很好地协同工作

    我遇到了一个奇怪的问题 我不知道如何解决它 我有几个类 它们都是 JSON 对象的 PHP 实现 这是问题的说明 class A protected a public function construct this gt a array n
  • PDO 如何在执行 rollBack() 函数之前回滚查询?

    这是我的脚本 try dbh con gt beginTransaction stmt1 dbh conn gt prepare UPDATE activate account num SET num num 1 stmt1 gt exec
  • 准备好的声明不返回任何内容

    我知道这个特定的查询是有效的 因为我用未经准备的过程方法测试了它 这里是 name introduction mysqli new mysqli localhost user pass db or die There was a probl
  • PHP DOM 获取节点值 html? (不剥离标签)

    我正在尝试使用nodeValue获取文件中div标签的innerhtml 但是此代码仅输出纯文本 并且似乎从div内部删除了所有html标签 我如何更改此代码以输出 div 的 HTML 内容而不是纯文本 并且还输出包装其子元素的主 div
  • 在php中的字符串数组中查找字符串的开头[重复]

    这个问题在这里已经有答案了 我知道我们有 php in array 函数 但我正在寻找一种方法来查找以特定字符串开头的字符串数组中的值 例如找到 search string div 1 div 在这样的数组中 array sample gt
  • 网页抓取(R 语言?)

    我想获取中间栏中的公司名称this http www consumercomplaints in bysubcategory mobile service providers page 1 html页面 以蓝色粗体书写 以及登记投诉者的位置
  • PHPstorm - 无法在blade.php 文件中设置断点

    我正在开发 Laravel 应用程序 可以很好地调试我的控制器 php 文件 但我还想调试blade php 文件 在我当前的设置中 我遵循了所有 jetbrains 为 Laravel 推荐的设置 https confluence jet
  • Laravel 雄辩的 withCount() 应该比 with() 慢

    所以我问这个的原因是在我当前的应用程序中withCount 与仅通过以下方式获取关系的所有数据相比 响应时间几乎增加了三倍with 并只是从前端获取长度 javascript 我认为使用的要点withCount 是为了加快查询速度 但也许我
  • 如何在 MySQL 中使用 INET_ATON 进行通配符搜索 IP 地址?

    我发现这个方法可以使用 INET ATON 将 IP 地址作为整数存储在 MySQL 数据库中 https stackoverflow com a 5133610 4491952 https stackoverflow com a 5133
  • mysqli_connect(): (HY000/2002): 无法建立连接,因为目标机器主动拒绝

    我知道有很多这样的问题 但我没有找到任何解决方案 我尝试过的事情 检查防火墙 重新启动我的电脑和 Apache 服务器 重新启动MYSQL 检查了我的代码 尝试了我所知道的和在互联网上找到的一切 这是我的代码
  • PHP 中 while (true){ 是什么意思?

    我看过这段代码 但不知道这意味着什么 while true echo Hello world 我知道什么是 while 循环 但是 while true 是什么意思 会执行多少次 这不是无限循环吗 虽然是无限循环 但您可以使用以下命令退出它
  • 日期函数的奇怪行为

    我今天在 StackOverflow 上遇到了这个问题 但没有得到答案 我的问题是 echo date Y m d strtotime 2012 september 09 output 2012 09 01 echo date Y m d
  • 在 Laravel 视图中使用 CSS?

    我刚刚开始学习 Laravel 并且可以掌握控制器和路由的基础知识 我的操作系统是 Mac OS X Lion 它位于 MAMP 服务器上 我的routes php代码 Route get function return View make
  • 使用 php 变量更改 css 类

    这里需要您的帮助 正如标题所示 我正在尝试使用 PHP 变量更改 css 类 所以基本上我想创建一个回显某些代码的循环 但我希望第一个循环中的 div 类有所不同 它应该被隐藏 这是我为使问题变得清晰而编写的简化代码 我不知道错误在哪里 请

随机推荐

  • 单击链接/按钮时更改 div 的内容

    基本上我有一个网页 有一个 div id content 和一个 div id sidebar 我想做的是在侧边栏中单击链接 按钮时更改内容 div 中的内容 而不需要为每篇文章提供单独的页面 原因是 我正在为一些多个乐队做一个 BIO 页
  • Xamarin.UITests - 在真实设备上测试 - iOS - 应用程序权限弹出问题

    我的 iOS 应用程序需要一些权限 GPS 推送通知 当应用程序第一次启动时 iOS 会询问用户是否同意向应用程序授予这些权限 我已经编写了一些 UITest 并希望在本地连接的 iPhone 上自动运行它们 问题是我无法覆盖权限问题并且我
  • python int() 函数

    如果是小数 下面的代码会显示错误 例如49 9 被发送到next多变的 你能告诉我为什么吗 为什么int 将其转换为整数 next raw input gt how much int next if how much lt 50 print
  • 复制可见单元格以将 listobject 过滤后的数据提取到新工作簿

    我正在尝试将 listobject 过滤数据提取到新工作簿中 但是 会提取所有数据 而不仅仅是过滤后的数据 Set loop obj wsCopy ListObjects 1 loop obj AutoFilter ShowAllData
  • 熊猫从长到宽

    使用 pandas 我想将长数据帧转换为宽数据帧 但通常pivot方法没有我需要的那么灵活 这是长数据 raw sample 1 1 1 1 2 2 3 3 3 3 gene G1 G2 G3 G3 G1 G2 G2 G2 G3 G3 ty
  • 是否有必要在递归调用的计时器内清除Timeout?

    是否需要打电话clearTimeout 在 Coffeescript 中的递归调用函数中 我关心的是是否不打电话clearTimeout 如果此函数每秒运行很多次 随着时间的推移 可能会导致某种内存泄漏 我的想法是 JS 垃圾收集器处理这个
  • 当JVM执行Java应用程序时,操作系统的作用是什么?为什么我们需要操作系统?

    我在网上读过一些资料 有人说Java应用程序是由java虚拟机 JVM 执行的 执行 这个词让我有点困惑 据我所知 非Java应用程序 即 用C C 编写 可以由操作系统执行 在较低级别 这意味着操作系统将二进制程序加载到内存中 然后指示C
  • Ant 相当于 cut |排序|独特的

    在 Ant 任务中 我设置了一个文件列表属性 例如 web src main test com whatever Ralph business src main test com whatever Alice web src main te
  • 用于可视化类似流程图的 Java 图形库

    我正在制作一个用于绘制流程图 本质上是电路图 的界面 其中包含如下所示的节点 in1 gt gt out1 in2 gt in3 gt gt out2 即每个框都有多个输入边和多个输出边 为了视觉清晰度 如果所有输入边缘都分组在一侧 所有输
  • 使用应用程序包时,<1% 的用户遇到 UnsatisfiedLinkError

    我正在尝试使用新的 Android 应用程序包 我在我的设备上本地运行一些测试 一切正常 然而 一旦部署到生产中 我开始看到一些如下错误 java lang UnsatisfiedLinkError dalvik system PathCl
  • CommandLink 无法在延迟加载的 Primefaces Datascroller 上工作

    我遇到延迟加载问题Primefaces 数据卷轴 http www primefaces org showcase ui data datascroller loader xhtml成分 我有一个 jsf 页面 应该在页面加载时显示 10
  • 修复损坏的编码(使用 Python)

    我有一堆文本文件包含编码错误的韩语字符 具体来说 字符似乎是用 EUC KR 编码的 但文件本身是用 UTF8 BOM 保存的 到目前为止 我成功修复了一个文件 内容如下 使用 EditPlus 打开文件 它显示文件的编码是UTF8 BOM
  • 如何比较 BigDecimals 以使我的测试通过? [复制]

    这个问题在这里已经有答案了 我有以下同样奇怪的情况JUnit test 所以我有这个测试方法 Test public void getNavInfoTest throws ParseException TirAliquotaRamoI ex
  • 使用 HTTP 客户端的 Kerberos 连接

    我正在使用 Kerberos 身份验证编写 HTTP 连接 我有 HTTP 1 1 401 未经授权 您能建议我应该检查什么吗 我认为有一些诡计 但我没有看到 也许我应该将标头 WWW Authenticate 设置为 Negotiate
  • 在netsuite中添加新的事务状态

    我正在开发 netsuite 并希望为客户账单创建新状态 我想要的新状态是 注销 注销后状态显示 已全额付款 我希望它显示 注销 我找到了很多帮助将当前状态更改为另一个现有的默认状态 例如 让我们举个例子 以下是尝试查找待履行销售订单时要应
  • VSCode 自定义宏

    我目前正在尝试使用 VSCode 但我不知道如何正确定义宏并将它们绑定到特定的按键绑定 我习惯使用 Sublime text 并且我定义了一些宏 可以帮助我更快地打字并减少错误 我想要获得的宏如下 alt shift q 哪些类型 并将光标
  • 设置普通石墨烯嵌套查询

    我已经成功创建了一个响应的全石墨烯查询 query person id Mary id name 我现在想扩展它 以便能够循环遍历所有人并为每个人返回类似的数据 query people count allPersons name 我如何获
  • 文件 -----stdarg.h 和 float.h 没有这样的文件或目录吗?

    我正在 xcode 项目中使用 mm 扩展名上的一些文件来编译这些文件 在添加此编译器后 我们在构建设置中添加了 LLVM GCC 4 2 这显示了错误 Developer Platforms iPhoneSimulator platfor
  • 插入等值元素

    我目前正在研究二叉搜索树 我想知道如果您尝试插入与根具有相同值的元素 您会怎么做 它去哪里 BST的定义是它是有序集 因此不允许插入重复项 这通常是由于在 BST 之上构建了更复杂的结构 根据所需的行为 您可能希望在插入重复项时引发异常 错
  • PHP:从网站提取 HTML 数据[关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi