使用 SAX 解析器解析 html

2024-01-11

我正在尝试使用 SAX 解析器解析普通的 html 文件。

SAXBuilder builder2 = new SAXBuilder();
         try {
            Document sdoc = (Document)builder2.build(readFile);
            NodeList nl=sdoc.getElementsByTagName("body");
            System.out.println("nodelist>>>>>>>>>>>"+nl.getLength());

        } catch (JDOMException e1) {
            e1.printStackTrace();
        }

但我得到了例外

Open quote is expected for attribute "{1}" associated with an  element type  "class".

谁能告诉我为什么我会收到此异常，html 文档格式良好，并且正确地包含所有打开和关闭标记。

提前致谢。

正如 flash 所说，您需要一个 HTML 解析器，而不是 XML 解析器。 HTML 不是 XML。

我用过的好的解析器是Neko http://nekohtml.sourceforge.net/ and TagSoup http://vrici.lojban.org/~cowan/XML/tagsoup/。 Neko 是一个优秀的全能解析器； TagSoup 的具体目标是能够解析任何内容，无论格式多么不正确。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

html

Parsing

SAX

使用 SAX 解析器解析 html 的相关文章

java.io.IOException: %1 不是有效的 Win32 应用程序

我正在尝试对 XML 文档进行数字签名为此我有两个选择有一个由爱沙尼亚认证中心为程序员创建的库还有一个由银行制作的运行 Java 代码的脚本如果使用官方认证中心库那么一切都会像魅力一样进行一些调整但是当涉及到银行脚本时它会
在数据流模板中调用 waitUntilFinish() 后可以运行代码吗？

我有一个批处理 Apache Beam 作业它从 GCS 获取文件作为输入我的目标是根据执行后管道的状态将文件移动到两个 GCS 存储桶之一如果管道执行成功则将文件移动到存储桶 A 否则如果管道在执行过程中出现任何未处理的异常则
宽度：适合内容；在 Chrome 上工作，但在资源管理器上不工作

我构建了一个应用程序所有内容都在 Chrome 中完美显示但如果我在 Windows 资源管理器中打开该应用程序容器会比应有的小我在用着width fit content 这是只适用于 Chrome 的东西吗我怎样才能使其适用于所
可以使用带有 HTML5 播放器的 Amazon S3/CloudFront 流式传输视频吗？

我想使用 HTML5 视频播放器并流式传输视频 S3 CloudFront 可以实现这一点吗我了解 Amazon 使用 RTMP 流媒体协议和 HTML5video标签不支持 RTMP 有没有办法用 HTML5 播放器播放视频 Wayne
Microsoft Graph 身份验证 - 委派权限

我可以使用 Microsoft Graph 访问资源无需用户即可访问 https developer microsoft com en us graph docs concepts auth v2 service 但是此方法不允许我访问需
如何在 JFreeChart TimeSeries 图表上显示降雨指数和温度？

目前我的 TimeSeries 图表每 2 秒显示一个位置的温度现在如果我想每2秒显示一次降雨指数和温度我该如何实现呢这是我的代码 import testWeatherService TestWeatherTimeLapseSer
检查 protobuf 消息 - 如何按名称获取字段值？

我似乎无法找到一种方法来验证 protobuf 消息中字段的值而无需显式调用其 getter 我看到周围的例子使用Descriptors FieldDescriptor实例到达消息映射内部但它们要么基于迭代器要么由字段号驱动一旦我有
Java中未绑定通配符泛型的用途和要点是什么？

我不明白未绑定通配符泛型有什么用具有上限的绑定通配符泛型 stuff for Object item stuff System out println item Since PrintStream println 可以处理所有引用类型通
Windows 上的 Nifi 命令

在我当前的项目中我一直在Windows操作系统上使用apache nifi 我已经提取了nifi 0 7 0 bin zip文件输入C 现在当我跑步时 bin run nifi bat as 管理员我在命令行上看到以下消息但无法运行
运行 Jar 文件时出现问题

我已将 java 项目编译成 Jar 文件但运行它时遇到问题当我跑步时 java jar myJar jar 我收到以下错误 Could not find the main class myClass 类文件不在 jar 的根目录中因
Keycloak - 自定义 SPI 未出现在列表中

我为我的 keycloak 服务器制作了一个自定义 SPI 现在我必须在管理控制台上配置它我将 SPI 添加为模块并手动安装因此我将其放在 module package name main 中并包含 module xml 我还将其放
Android JNI C 简单追加函数

我想制作一个简单的函数返回两个字符串的值基本上 java public native String getAppendedString String name c jstring Java com example hellojni He
如何配置eclipse以保持这种代码格式？

以下代码来自 playframework 2 0 的示例 Display the dashboard public static Result index return ok dashboard render Project findInv
如何测试 spring-security-oauth2 资源服务器安全性？

随着 Spring Security 4 的发布改进了对测试的支持 http docs spring io spring security site docs 4 0 x reference htmlsingle test我想更新我当前的
将2-3-4树转换为红黑树

我正在尝试将 2 3 4 树转换为 java 中的红黑树但我无法弄清楚它我将这两个基本类编写如下以使问题简单明了但不知道从这里到哪里去 public class TwoThreeFour
如何修复“sessionFactory”或“hibernateTemplate”是必需的问题

我正在使用 Spring Boot JPA WEB 和 MYSQL 创建我的 Web 应用程序它总是说 sessionFactory or hibernateTemplate是必需的我该如何修复它我已经尝试过的东西删除了本地 Mav
如何：带有 onclick 的 div 位于另一个带有 onclick 的 div 中

只是一个简单的问题我遇到了 div 与 onclick javascript 之间的问题当我点击内部 div 时它应该只触发它的 onclick javascript 但外部 div 的 javascript 也会被触发用户如何点击
中断连接套接字

我有一个 GUI 其中包含要连接的服务器列表如果用户单击服务器则会连接到该服务器如果用户单击第二个服务器它将断开第一个服务器的连接并连接到第二个服务器每个新连接都在一个新线程中运行以便程序可以执行其他任务但是如果用户在第一个
灵气序列解析问题

我在使用 Spirit Qi 2 4 编写解析器时遇到一些问题我有一系列键值对以以下格式解析
Swagger/Openapi-Annotations：如何使用 $ref 生成 allOf？

我正在生成 Rest 端点包括添加OpenAPI Swagger对生成的代码进行注释虽然它对于基本类型运行得很好但我在自定义类方面遇到了一些问题现在我有很多自定义类的重复架构条目使用 Schema 实现 MyClass class

随机推荐

当生产者也是消费者时，如何在生产者/消费者模式中使用 BlockingCollection - 我该如何结束？

我有一个递归问题消费者在树的每个级别执行一些工作然后需要递归树并在下一个级别执行相同的工作我想用ConcurrentBag BlockingCollection等并行运行它在这种情况下队列的消费者也是队列的生产者我的问题是这样的
让 jQuery UI 的日期选择器始终以某个方向打开？

我正在使用 jQuery UI 的 datepicker 控件position fixed我的页面底部的工具栏有时在随机计算机上日期选择器会出现在工具栏下方这意味着它位于页面之外无法查看或与之交互有没有办法强制日期选择器控件的位
更新 UITabBar 视图？

我有一个应用程序我使用工具栏上的按钮来调用视图但我将其切换为使用选项卡栏使用按钮时我在 MainViewController m 中使用以下代码来更新页面上的值并且工作正常 IBAction loadSummaryView id
以最佳性能将数据插入 SQL Server

我有一个大量使用数据库 SQL Server 的应用程序因为它必须具有高性能所以我想知道从执行时间的角度将记录插入 DB Fastest 的最快方法我应该用什么据我所知最快的方法是创建存储过程并从代码 ADO NET 调用它请让
根据两个向量计算方向角？

假设我有两个 2D 向量一个用于对象的当前位置一个用于该对象的先前位置如何计算出行进的角度方向这张图片可能有助于理解我所追求的图片 http files me com james ingham crcvmy http files
计算 SQL Server 中表的哈希值或校验和

我正在尝试计算 SQL Server 2008 中整个表的校验和或哈希我遇到的问题是该表包含 XML 列数据类型校验和无法使用该数据类型必须将其转换为 nvarchar第一的所以我需要将其分解为两个问题计算一行的校验和模式在运行
使用 Eclipse 运行时 rJava 错误

我已经安装了 R 3 0 1 和 Eclipse Kepler 我已经安装了 StatE 来通过 Eclipse R 控制台运行 R 脚本没有任何问题但是我似乎无法运行 java 程序我发布我的问题是为了看看其他人是否遇到过这些问题
FindItems() 和 BindToItems() 为 EmailMessage.Sender.Address 提供不一致的结果

经过大量调试后我将复杂的托管 EWS 问题细化为以下两个简单的测试用例第一个有效第二个失败 var view new ItemView 100 PropertySet new PropertySet EmailMessageSchem
phpMyAdmin 在哪里存储 phpMyAdmin 用户密码？

在设置 phpMyAdmin 的过程中创建了一个 phpMyAdmin 用户当我查看 phpMyAdmin 数据库权限时我可以看到该用户哪个 PHP 文件存储该用户的密码保罗不存在 phpMyAdmin 用户这样的东西 phpM
Android 菜单上的复选框项目状态

如何设置菜单的复选框项目部分的初始值当我启动一个活动时我想设置一个保存在共享首选项中的布尔值 menu menu
使用 If、ElseIf、ElseIf 比使用 If、If、If 更好吗？

使用之间真的有什么区别吗 If this Else If that Else 或使用 If this If that Else 执行速度更快吗编译器或架构有什么区别吗两者的内容有很大的区别this 块和that 块可以both以第二种形
如何在 VB.NET 中将接口属性设置为只读？

这是我之前关于接口的问题的后续我收到了我喜欢的答案但我不确定如何在 VB NET 中实现它上一个问题该属性应该是我的对象接口的一部分吗 https stackoverflow com questions 239909 should
无法安装 Elasticsearch-5.x 的 Search Guard 插件

由于限制我不被允许从互联网上安装任何软件包所以这个命令对我来说安装没有用搜查卫士 https github com floragunncom search guard bin elasticsearch plugin install
如果没有导航控制器，抽屉布局将无法工作

为什么我们无法在没有导航导航控制器的情况下在 Android 中设置抽屉布局每当我们想要设置抽屉时我们都需要一个导航控制器就像下面这样 private lateinit var drawerLayout DrawerLayout p
将 Sublime Text 3 设置为 git commit 文本编辑器

我在将 sublime 设置为 git 提交消息编辑器时遇到问题 Using git config global core editor subl 错误错误无法运行 subl 没有这样的文件或目录错误无法启动编辑器 subl 请使用
gatsby 和 graphql：过滤特定的单个图像

我不太了解 graphql 或 gatsby 但我相信通过将其放入 gatsby config js 中我的所有图像都会加载到 graphql 中 resolve gatsby source filesystem options name
我应该使用哪种 API 将用户权限提升为 Mac OS X 中的超级用户？

我想将我的应用程序的权限提升为超级用户安装程序应用程序通过显示来支持这一点这个对话框 http en wikipedia org wiki File Mac OS X Authenticate png 如何显示此对话框以提升权限附言我
如何在 Android N 中的时间选择器中获取 30 分钟间隔

我想要得到30 min interval from time picker dialog下面的代码可以正常工作Android N但不适用于最新设备下面是我的代码activity public class MainActivity exte
获取mysql资源字符串的第一行？

这是我的问题我需要数据库中的多行并且我需要第一行来执行某些任务然后再次遍历所有列表以创建记录集 query SELECT FROM mytable result mysql query query firstrow extract f
使用 SAX 解析器解析 html

我正在尝试使用 SAX 解析器解析普通的 html 文件 SAXBuilder builder2 new SAXBuilder try Document sdoc Document builder2 build readFile NodeL

使用 SAX 解析器解析 html

使用 SAX 解析器解析 html 的相关文章

随机推荐

热门标签