在 iPhone 上解析 HTML [关闭]

2023-12-21

谁能推荐一个用于 HTML 解析的 C 或 Objective-C 库?它需要处理无法完全验证的混乱 HTML 代码。

这样的库是否存在,或者我最好尝试使用正则表达式?


我发现使用hpple http://github.com/topfunky/hpple对于解析凌乱的 HTML 非常有用。 Hpple 项目是 XPathQuery 库上的 Objective-C 包装器,用于解析 HTML。使用它您可以发送 XPath 查询并接收结果。

要求:

- 将 libxml2 添加到您的项目中

  1. 菜单项目->编辑项目设置
  2. 搜索设置“标题搜索路径”
  3. 添加新的搜索路径“${SDKROOT}/usr/include/libxml2”
  4. 启用递归选项

- 将 libxml2 库添加到您的项目中

  1. 菜单项目->编辑项目设置
  2. 搜索设置“其他链接器标志”
  3. 添加新的搜索标志“-lxml2”

-From hpple http://github.com/topfunky/hpple获取以下源代码文件并将它们添加到您的项目中:

  1. TFpple.h
  2. TFpple.m
  3. TFppleElement.h
  4. TFppleElement.m
  5. XPathQuery.h
  6. XPathQuery.m

- 散步w3school XPath 教程 http://www.w3schools.com/XPath/default.asp熟悉 XPath 语言。

代码示例

#import "TFHpple.h"

NSData *data = [[NSData alloc] initWithContentsOfFile:@"example.html"];

// Create parser
xpathParser = [[TFHpple alloc] initWithHTMLData:data];

//Get all the cells of the 2nd row of the 3rd table 
NSArray *elements  = [xpathParser searchWithXPathQuery:@"//table[3]/tr[2]/td"];

// Access the first cell
TFHppleElement *element = [elements objectAtIndex:0];

// Get the text within the cell tag
NSString *content = [element content];  

[xpathParser release];
[data release];

已知的问题

由于 hpple 是 XPathQuery 的包装器,而 XPathQuery 是另一个包装器,因此此选项可能不是最有效的。如果性能是您的项目中的一个问题,我建议您基于 hpple 和 xpathquery 库代码编写自己的轻量级解决方案。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 iPhone 上解析 HTML [关闭] 的相关文章

  • 如何在CSS中嵌套多个计数器?

    我想用 CSS 嵌套两个不同的编号 以获得如下所示的自动编号 1 第 1 节 1 1 小节1 1 2 小节1 2 第 2 节 2 1 小节2 2 2 小节2 这是我实现这一目标的尝试
  • 如何在标签中制作文字自动换行

    我想在其中添加文字 a 标签适合固定的 div 但它会破坏 div 并且显示得很丑 CSS3 有一个属性 word wrap break word 看看MDN 自动换行文档 https developer mozilla org en CS
  • Javascript显示/隐藏div onclick

    我有一个页面 其中包含三个 div 每个 div 是一个段落 我想使用 javascript 在用户从导航栏中按下每个 div 时仅在页面中显示这是导航栏 https i stack imgur com 1LnsS png WebDev 只
  • 更新 Parse.com 中的一行

    我所拥有的是 当单击编辑按钮时 两个输入字段中的值将创建一个新行 并删除旧行 下面是我使用的代码 但我想要的是更新原始行而不是删除原始行 实例 http jsbin com uyonek 2使用下面的代码是如何工作的 editBtn onc
  • 如何使用 Angular 2 实现拖放(v2.0.0-beta.15)

    我想以角度实现一个简单的拖放列表 例如我可以更改其顺序的杂货列表 iv 在使用之前实现它https github com akserg ng2 dnd https github com akserg ng2 dnd但我的问题是我使用角度2
  • 我可以在一个变量中拥有多个值吗?

    正如标题 我可以在一个变量中拥有多个值吗 首先 我有这个表格
  • FPDF - 内嵌粗体文本

    我正在尝试从 PHP 创建 PDF 出于法律原因 我们需要将免责声明的一部分设为粗体 并且需要概述免责声明 我当前的代码使用 if isset POST optout POST optout yes pdf gt Ln 5 pdf gt S
  • 使用 jQuery 在元素末尾添加“更多”html?

    我一开始有一个空的 div div div 我知道如何使用 jQuery 第一次将 html 添加到我的空 div 中 mydiv html my html 但我的问题是我不知道如何在非空 div 末尾推送更多 html div my ht
  • 我可以使用 NSDateFormatter 将此日期字符串转换为 NSDate 吗?

    我有这个字符串 2010 08 24T16 00 00 05 00 我想从中提取时间部分 即 16 00 并将其转换为 12 小时等效值 即下午 04 00 我正在尝试使用 NSDateFormatter 来完成此任务 但它不起作用 NSD
  • 如何解决flash的zindex问题

    在网页中我需要显示div覆盖未使用的 Flash 横幅wmode transparent环境 怎么解决呢 根据我的记忆 你可以将 div 推入 也许使用Javascript 这样你就不会弄乱你的HTML iframe 是像 flash 一样
  • 如何使单词中的每个字母在悬停时发生变化

    假设我的网站上某个段落中有一个单词 IamGreat 我希望它在悬停时更改为 Good4you 但是 我不想更改整个单词 而是希望每个字母单独更改 因此 如果我将鼠标悬停在字母 I 上 它将变成字母 G 字母 r 将变成数字 4 等 这两个
  • 从提交的表单中转义字符串中的字符

    每次发布帖子时 我都会得到转义字符 gt gt gt 我有一个多步骤表单 它将数据从一种表单传输到另一种表单 我将这些值与准备好的语句一起保存在数据库中 数据库中的值当前看起来像Paul s House 用户应该可以在字符串中使用单引号和双
  • javascript获取网页中选定文本的段落

    突出显示文本后 我想获取所选文本所在的段落 var select window content document getSelection 请问有什么指点吗 这实际上很难做到 因为你必须考虑六种情况 所选内容不在一个段落内 简单 整个选择都
  • 无限 UIScrollView 在 iOS4.3 中出现奇怪的行为,而不是 iOS5

    我已经实现了一个包含 UIView 的无限 UIScrollView 在 iOS5 模拟器和 iPhone 中滚动时 效果非常好 但在 iOS 4 3 sim 和手机 中 情况有点疯狂 滚动条传递的视图比应有的多 大约比 iOS5 多 10
  • 下拉菜单导致滚动条

    我用过这个W3C 的示例 http www w3schools com bootstrap bootstrap dropdowns asp div class dropdown div
  • UICollectionviewcell 更改背景

    如果我知道部分编号和项目编号 如何更改单元格中的背景 下面的代码显示了我如何尝试做到这一点 UICollectionViewCell collectionView UICollectionView collectionView cellFo
  • Jquery 关注下一个带有类的元素

    我正在尝试创建一个函数 当按下 Enter 键时 会选择带有类的下一个输入 我已经设法 focus 同一行中的下一个元素 但是 如果我需要选择下一行的下一个输入 它将无法继续 下一行中的第一个 quantity 文本框需要获得焦点 控制台没
  • UITextInput setMarkedText:selectedRange 不起作用? (不可能!)

    我想以编程方式设置标记的文本 并且由于 iOS5 UITextView 和 UITextField 符合 UITextInput 这应该是可能的 但由于某种原因我总是得到markedText为零 我在这里缺少什么 这是我尝试过但没有成功的方
  • 更改选项卡栏应用程序中的 UITableViewController 样式

    我有一个带有 4 个选项卡的选项卡栏 iPhone 应用程序 在界面生成器中 我为每个选项卡设置视图控制器 我想将一个 UITableViewController 的样式从普通样式更改为分组样式 我用这样的方式替换 init 方法 id i
  • 使用带有箭头的 MaterializeCSS 轮播 - 如何使用普通 javascript 进行初始化

    我正在尝试使用 MaterializeCSS 创建带有箭头的轮播 我正在尝试使用这个代码笔 https codepen io Paco Cervantes pen ZLxKpj取得有限的成功 我想使用普通的 javascript 而不是 j

随机推荐

  • 字典迭代——对于 dict 与 dict.items()

    当我们迭代下面的字典时 每次迭代都会 正确地 返回一个键值对 for key value in dict items print s key has the value s key value some key 键有值 some value
  • SDL 中的 Blit 是什么?

    在 SDL wiki 中它说 使用此函数可以执行从源表面到目标表面的快速 blit 但这对我没有多大帮助 在这种情况下 术语 表面位块传输 是什么意思 基本上 这意味着将图像从一个表面复制到另一个表面 可能会被裁剪和移动
  • 二分查找和使用前缀树哪个查找更快?

    假设我有一个字符串列表和这些字符串的前缀树 并且我想在给定键的情况下定位一个字符串 哪个更快 二分查找还是前缀树查找 为什么以及时间复杂度是多少 Thanks 这两种技术都有其优点和缺点 后缀树 Advantages O N 构建复杂度 O
  • mac 上 python 子进程中的 pdflatex

    我正在尝试在 Python 2 4 4 的 tex 文件上运行 pdflatex 子进程 在 Mac 上 import subprocess subprocess Popen pdflatex fullpathtotexfile shell
  • Go 指针、引用、解除引用的规则:

    我是 GoLang 的新手 来自 Delphi C 世界 不可否认 我对这种语言感到非常兴奋 我认为它注定会成为 下一件大事 我试图了解 Go 解析器和编译器如何处理指针和引用 似乎找不到任何制定明确规则的地方 例如 在下面的代码示例中 返
  • 默认值 Specflow 步骤定义

    我刚开始接触 SpecFlow 的世界 并且遇到了第一个问题 在保持代码干燥方面 我想执行以下操作 有两种情况 Given I am on a product page And myfield equals todays date Then
  • 旋转 - 使用 LINQ C# 转置 List>

    我有一个List
  • LINQ查询任何属性包含字符串[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 如何查询类型 T 的集合 以返回 T 的所有项目 其中 T 的任何属性包含某个字符串 EDIT 假设我在检查是否包含之前将每个属性转换为字
  • 在 iPad 上捕获 DOM/HTML/BODY 上的 Click 事件

    我使用 jQuery 来检测 DOM 上的点击 或者让我们检测每次点击 document click function alert Click 除了 iPad iPhone 版 Safari 之外 该功能在所有浏览器中都表现良好 我还尝试在
  • 阅读 R 的电子邮件附件

    我正在使用 R 读取 Outlook 附件 我的参考资料在这里 使用 R 从 Outlook 电子邮件下载附件 https stackoverflow com questions 45577698 download attachment f
  • 以编程方式更改 WPF 中的按钮图标

    我目前有一个按钮 上面有一个图标 图像 我已经在 XAML 中配置了按钮和图像
  • 为什么静态构造函数没有任何参数?

    根据 MSDN 静态构造函数不采用访问修饰符或具有参数 在创建第一个实例或引用任何静态成员之前 会自动调用静态构造函数来初始化类 静态构造函数不能直接调用 谁能解释一下为什么静态构造函数不能有参数 正如 MSDN 所说 在创建第一个实例之前
  • 存储库模式与 DAL

    它们是一样的吗 刚刚看完罗布 康纳利的店面教程 https www asp net mvc videos mvc 1 aspnet mvc storefront aspnet mvc storefront part 1 architectu
  • 自定义集合在编辑时使 DataGrid 崩溃

    我目前正在尝试将 DataGrid ItemsSource 绑定到自定义 RowCollection 它实现 IList 和 INotifyCollectionChanged Public Class RowCollection of T
  • HTML 和 CSS:如何设置 HR 标签的样式以嵌入标题

    我正在尝试创建一个遵循以下模型的 HR
  • 如何在flutter应用程序中获取JSON数据?

    我从服务器获取了以下 JSON 数据 我需要在 pageviewbuilder 以及 flutter 应用程序中的 listview builder 中获取和配置这些数据 列表视图构建器 垂直滚动 嵌套在页面视图构建器 水平滚动 中 我已经
  • 为什么Cloneable没有clone()? [复制]

    这个问题在这里已经有答案了 我试图了解 Object clone 在 Java 中是如何工作的 我发现了以下事实 一个类实现了Cloneable接口 向 Object clone 方法指示该方法对该类的实例进行逐字段复制是合法的 调用Obj
  • 无法解析“ImmutableList”中的“of”方法[已关闭]

    Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案 调试详情 按照教程从 Android Billing 4 0 迁移到 5 0https developer androi
  • ASP.NET URL 重写

    如何在 ASP NET 中重写 URL 我希望用户能够访问 http www website com users smith 代替 http www website com user smith 尝试托管 Fusion URL 重写器和反向
  • 在 iPhone 上解析 HTML [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi