使用 XMLReader 解析媒体 RSS

2024-03-25

<rss version="2.0"
    xmlns:media="http://search.yahoo.com/mrss/">
    <channel> 
        <title>Title of RSS feed</title> 
        <link>http://www.google.com</link> 
        <description>Details about the feed</description> 
        <pubDate>Mon, 24 Nov 08 21:44:21 -0500</pubDate> 
        <language>en</language> 
        <item> 
            <title>Article 1</title> 
            <description><![CDATA[How to use StackOverflow.com]]></description>
            <link>http://youtube.com/?v=y6_-cLWwEU0</link>
            <media:player url="http://youtube.com/?v=y6_-cLWwEU0"    /> 
            <media:thumbnail url="http://img.youtube.com/vi/y6_-cLWwEU0/default.jpg"
                width="120" height="90" /> 
            <media:title>Jared on StackOverflow</media:title> 
            <media:category label="Tags">tag1,tag2</media:category> 
            <media:credit>Jared</media:credit> 
            <enclosure url="http://youtube.com/v/y6_-cLWwEU0.swf"
                length="233"
                type="application/x-shockwave-flash"/>
        </item>
    </channel>
</rss>

我决定使用 XMLReader 解析我的大型 xml 文件。我无法获取每个项目中的数据，尤其是缩略图

这是我的代码

//////////////////////////////

$itemList = array();
$i=0;
$xmlReader = new XMLReader();
$xmlReader->open('XMLFILE');
while($xmlReader->read()) {
    if($xmlReader->nodeType == XMLReader::ELEMENT) {
            if($xmlReader->localName == 'title') {
                    $xmlReader->read(); 
            $itemList[$i]['title'] = $xmlReader->value;
        }
        if($xmlReader->localName == 'description') {
            // move to its textnode / child
            $xmlReader->read(); 
            $itemList[$i]['description'] = $xmlReader->value; 

        } 
            if($xmlReader->localName == 'media:thumbnail') {
            // move to its textnode / child
            $xmlReader->read(); 
            $itemList[$i]['media:thumbnail'] = $xmlReader->value; 
                    $i++;
        }       
    }
}
////////////////

由于我正在解析巨大的 XML 文件，因此建议使用 DOMXpath 吗？我非常感谢你的建议。

xtian,

如果内存使用是您关心的问题，我建议您远离 DOM/XPath，因为它要求首先将整个文件读入内存。 XMLReader 一次只能读取一个块（可能是 8K，因为这似乎是标准的 PHP 块大小）。

我重写了您最初发布的内容，它捕获了包含在<item>元素：

title
description
media:thumbnail
media:title

你必须记住的是XMLReader::localName将返回元素名称减去任何 XMLNS 声明（例如media:thumbnail's localName is thumbnail）。您需要小心这一点，因为media:title值可能会覆盖title value.

这是我重写的内容：

<?php
define ('XMLFILE', dirname(__FILE__) . '/Rss.xml');
echo "<pre>";

$items = array ();
$i = 0;

$xmlReader = new XMLReader();
$xmlReader->open (XMLFILE, null, LIBXML_NOBLANKS);

$isParserActive = false;
$simpleNodeTypes = array ("title", "description", "media:title");

while ($xmlReader->read ())
{
    $nodeType = $xmlReader->nodeType;

    // Only deal with Beginning/Ending Tags
    if ($nodeType != XMLReader::ELEMENT && $nodeType != XMLReader::END_ELEMENT)
    {
        continue;
    }
    else if ($xmlReader->name == "item")
    {
        if (($nodeType == XMLReader::END_ELEMENT) && $isParserActive)
        {
            $i++;
        }
        $isParserActive = ($nodeType != XMLReader::END_ELEMENT);
    }

    if (!$isParserActive || $nodeType == XMLReader::END_ELEMENT)
    {
        continue;
    }

    $name = $xmlReader->name;

    if (in_array ($name, $simpleNodeTypes))
    {
        // Skip to the text node
        $xmlReader->read ();
        $items[$i][$name] = $xmlReader->value;
    }
    else if ($name == "media:thumbnail")
    {
        $items[$i]['media:thumbnail'] = array (
            "url" => $xmlReader->getAttribute("url"),
            "width" => $xmlReader->getAttribute("width"),
            "height" => $xmlReader->getAttribute("height")
        );
    }
}

var_dump ($items);

echo "</pre>";

?>

如果您对其工作原理有任何疑问，我将非常乐意为您解答。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

xml

使用 XMLReader 解析媒体 RSS 的相关文章

在Python中解析Google Earth KML文件（lxml，命名空间）

我正在尝试解析 kml https developers google com kml documentation 使用 xml 模块将文件导入到 Python 中在 BeautifulSoup 中未能实现此功能我将其用于 HTML 由
xml2 包 (R) 中的 xml_find_all 函数未找到相关节点

我使用 R 中的 xml2 包来访问 xml 数据发现它在不同的 xml documents 上表现不同在这个宠物的例子中 library xml2 doc lt read xml
如何使用 PHP 创建动态页面标题

大家好我想知道是否有人可以帮助解决这个 PHP 问题是否可以使用 H2 标记中的文本并使用它来动态填充页面标题我还希望能够使用相同的技术将 H2 文本添加到元描述中有人可以帮忙吗如果您的 h2 文本是动态创建的那么网页的其他部分
使用 PHP 将 mysql 值转储到 JSON 文件中

我正在尝试使用 PHP 从 mysql 数据库生成 JSON 文件到目前为止我有
在 WooCommerce 订单和电子邮件中添加并显示自定义购物车项目数据

我有一个名为彩票的自定义 woocommerce 产品类型我需要在其上添加一个自定义选择字段因为它不是可变产品所以我添加了一个一切工作正常我在购物车和结帐中也获得了价值但我无法在管理订单或订单邮件客户和管理员中获得价值这是
如何在 laravel/php 中访问该集合的内容

我是 Laravel 的新手正在做一个构建迷你社交网络应用程序的项目我有一个与用户模型有关系的帖子模型我有一个帖子页面其中仅显示经过身份验证的用户及其朋友的帖子在我的 PostController 中我像这样查询经过身份验证的用
Laravel 5 Eloquent 关系：无法修改/覆盖关系表属性

我正在使用 Laravel 5belongsToMany使用中间数据透视表定义相关表的方法我的应用程序正在使用雄辩的模型Tour and 旅游类别在游览模型中我有 namespace App use Illuminate Databas
PHP DOM 获取节点值 html？（不剥离标签）

我正在尝试使用nodeValue获取文件中div标签的innerhtml 但是此代码仅输出纯文本并且似乎从div内部删除了所有html标签我如何更改此代码以输出 div 的 HTML 内容而不是纯文本并且还输出包装其子元素的主 div
CodeIgniter Active Record - 组 OR 语句

这是我的问题 MySQL 或条件 https stackoverflow com questions 8604380 mysql or condition 解决方案是将 OR 语句分组但我正在使用 CodeIgniters Active
PHP: $arr['key'] 上的 is_array 不存在 'key'

我的一所大学似乎在我编写的代码中存在未定义索引错误我的这段代码如下所示 if is array arr key 我的目的是检查 arr 是否有一个名为 key 的键以及该键的值是否是数组本身我应该这样做吗 if isset arr
使用 getJSON 未显示 JSON 数据

document ready function getJSON news php parseInfo function parseInfo data alert data news undefined info html data news
在针对 XSD 进行验证时，使用 DOM、StAX、SAX 解析器中的任何一个来查找 XML 中确切缺失的元素

我有一个 XML 文件及其相应的 XSD 文件在使用 StAX 解析器进行验证时我附加了一个错误处理程序基本上我在格式良好的 XML 文件中遇到两种类型的错误 1 元素内的数据类型不正确例如元素内的字符串应该具有整数 2 缺少元素
即使 is_dir 是一个目录，它也会返回 false 吗？

为什么 is dir 即使是一个目录也会返回 false 没有返回错误 path mysql var lib mysql if is dir path mysql echo error 返回错误 path mysql var lib mys
如何从对应的数组值中获取数组键？

您可以轻松地通过其键获取数组值如下所示 value array key 但如果我有该值并且想要它的密钥怎么办获得它的最佳方式是什么你可以使用array search https www php net manual en functi
如何理顺 Laravel Blade @extends 的执行顺序？

In 我尝试找到一种通过引用刀片 include来传递变量的方法 https stackoverflow com questions 25437939 how to pass variables by reference to includ
Yii2 - 如何在用户身份中设置动态 authTimeout？

在这里我扩展了UserYii2 的身份这是我的配置 user gt identityClass gt app models UserMaster class enableAutoLogin gt false loginUrl gt au
PHP 中 while (true){ 是什么意思？

我看过这段代码但不知道这意味着什么 while true echo Hello world 我知道什么是 while 循环但是 while true 是什么意思会执行多少次这不是无限循环吗虽然是无限循环但您可以使用以下命令退出它
使用 PHP 将子项添加到 XML 文件

添加子项时抛出此错误无法添加孩子父级不是 XML 树的永久成员我无法解决这个问题这是我的代码 if visited FIRST xml new SimpleXMLElement
CKEditor TypeError：c[a] 在 CodeIgniter 中未定义

我正在尝试在基于 codeigniter 的网站中安装 CKEditor 并且我已按照本教程进行操作 Codeigniter 教程中的 CKEditor http nukium com developpement php framework
SQL查询：按字符长度排序？

是否可以按字符总数对sql数据行进行排序 e g SELECT FROM database ORDER BY data length 我想你想用这个 http dev mysql com doc refman 5 0 en string f

随机推荐

检测所有摄像头android

我有一个使用 Camera2 API 来获取相机预览的应用程序我想在手机的镜头之间进行选择在我的代码中我使用以下代码 CameraManager manager CameraManager activity getSystemServ
按数字顺序对目录中的文件进行排序和列出

这是我的文件夹结构 home files encounters 9 22 11 0 jpg home files encounters 9 22 11 n jpg puts Dir glob home files jpg 0 当我执行上面的
Money_format() 选项

我正在查看 php 中的 Money format 函数并对如何让它按照我想要的方式格式化感到困惑我不想在字符串前面有 USD 我想要每 3 位数字和 2 位小数点有一个逗号因此 12345 67 将被格式化为 12 345 67 T
如何创建接受可变数量参数的 Java 方法？

比如Java自己的String format 支持可变数量的参数 String format Hello s ABC d World 123 gt Hello World ABC 123 如何创建自己的函数来接受可变数量的参数后续问题我
如何将动态对象转换为 JSON 字符串 C#？

我有以下从第三方库获得的动态对象 IOrderStore os ss GetService
如何在 Node.js 中存储请求级变量？

对于只需要在单个请求期间可用的数据应该将其存储在哪里我正在 req 和 res 对象上创建新属性因此我不必将数据从一个函数传递到另一个函数 req myNewValue just for this request 进程对象是一个选项吗
在新的（GUI）窗口中打开 vim 选项卡？

我想将当前选项卡移动到 MacVim 中的新视觉真实窗口中这可能很困难因为 vim 帮助中没有任何内容只有很少的没有帮助在 google 上点击 MacVim 不支持它 link http code google com p
使用 PIL 为高维图像绘制矩形时，draw.rectangle([x1, y1, x2, y2], fill="Black") 中出现错误

当使用 PIL python 库为高维 png 文件 770x1024 绘制矩形时我在 draw rectangle x1 y1 x2 y2 fill Black 中遇到错误但它适用于中等尺寸的图像 img Image open Byt
使用 pandas python 将 NaN 值替换为另一个数据框

在从具有不同索引长度的另一个数据帧中替换一个数据帧中 NaN 值的一列到期日期时遇到了一些困难样本数据df1 SOH Price Value Expiry Comments 0 1P 10 49 10 49 NaN NaN 1 220 7
为什么 Array 的 == 函数对于 Array(1,2) == Array(1,2) 不返回 true？

In Scala 编程 http www artima com shop programming in scala 2ed作者写道 Scala 的函数比较值相等而不是引用相等这在列表上按预期工作 scala gt List 1 2 Li
在 Vue.js 中应用多个条件类

我在 Vue 中使用样式绑定是这样的 v bind style width width px left x px top y px 当我需要绑定多个条件类时我使用了以下语法但它不起作用 v bind class position pos
给定堆栈和寄存器的状态，我们能否预测 printf 未定义行为的结果

下面是一些用于课堂测验的简单 C 代码 include
com.google.gson.JsonSyntaxException：java.lang.IllegalStateException：需要一个字符串，但结果是 BEGIN_ARRAY

我正在尝试使用 Gson 将传入的 Json 如下所示解析为 Java 对象 Json 请求似乎是有效的但我在解析它时遇到以下异常 com google gson JsonSyntaxException java lang Illega
对象关系映射

我需要将复杂数据类型的实例存储到关系数据库中有没有一种方法可以在不首先建模数据库结构的情况下做到这一点就像在 ado net 中所做的那样数据库或表结构应从类结构创建该类具有一些属性例如整数字符串或布尔值但也可以具有更复杂
保持函数参数的保守性

我正在使用整洁的 fmt 库该库在其版本 8 中会在编译时检查其格式字符串如果编译器支持相关功能在某些时候我想编写以下代码 throw my exception error 123 可悲的是天真的实现 struct my exce
Spring Security删除用户-会话仍然活动

我得到了一个带有用户管理的简单的 Spring Security 应用程序管理员应该能够在数据库上创建更新删除用户通过 hibernate 如果更新了用户我将重新加载当前登录的用户的身份验证这是通过以下代码完成的根据this
如何在groovy SPOCK框架中测试静态java方法？

我正在尝试使用 Maven 在 SPOCK groovy 框架中测试静态 java 方法这是java类 public class DataController private DataInterface userService publi
放入drawables文件夹时图像被破坏

我打算在游戏中使用以下图像当我使用添加新图像资源并将该图像添加为操作栏和选项卡图标时图像的所有黑色部分都替换为白色因此在画布上绘制图像时图像看起来像这样为什么图像被破坏以及如何修复它我考虑过将图像作为启动器图标但这似
Java BCrypt 不支持较新的版本（种子前缀为 2b、2y 等）

我正在使用 jBCrypt Java 中它无法处理来自 PHP 或 Python 的较新版本的 BCrypt 例外是无效的盐版本因为它仅支持 2a 版本 BCrypt 是否有另一个更新的 Java 库谷歌代码 jbcrypt 工作组
使用 XMLReader 解析媒体 RSS

使用 XMLReader 解析媒体 RSS

使用 XMLReader 解析媒体 RSS 的相关文章

随机推荐

热门标签