从 HTMLDocument 获取所有 html 作为字符串

2023-11-24

我用 Java 编码..

有谁知道我如何获取 javax.swing.text.html.HTMLDocument 的内容作为字符串？这就是我到目前为止所得到的......

URL url = new URL( "http://www.test.com" );

HTMLEditorKit kit = new HTMLEditorKit(); 
HTMLDocument doc = (HTMLDocument) kit.createDefaultDocument(); 
doc.putProperty("IgnoreCharsetDirective", Boolean.TRUE);
Reader HTMLReader = new InputStreamReader(url.openConnection().getInputStream()); 
kit.read(HTMLReader, doc, 0);

我需要 HTMLDocument 的内容作为字符串。

例子：

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">    <html><head><meta http-equiv="X-UA-Compatible" content="IE=Edge,chrome=1">

....... ETC。

任何帮助，将不胜感激。我需要使用 HTMLDocument 类才能正确处理 html:)

谢谢丹尼尔

StringWriter writer = new StringWriter();
kit.write(writer, doc, 0, doc.getLength());
String s = writer.toString();

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Document

从 HTMLDocument 获取所有 html 作为字符串的相关文章

从 java sdk 向对等方发送提案时出现访问被拒绝错误

我正在尝试使用以下代码查询区块链并收到访问被拒绝错误我也遇到同样的错误sendTransactionProposal方法也是如此 UserContext adminUserContext RegisterEnrollUser regist
如何将 javax.persistence.Column 定义为 Unsigned TINYINT？

我正在基于 MySQL 数据库中的现有表创建 Java 持久性实体 Bean 使用 NetBeans IDE 8 0 1 我在这个表中遇到了一个字段其类型为无符号 TINYINT 3 我发现可以执行以下操作将列的类型定义为 unsign
createImage(int width, int height) 的问题

我有以下代码作为游戏的一部分每 10 毫秒运行一次 private void gameRender if dbImage null createImage returns null if GraphicsEnvironment isHea
Java Runtime.getRuntime().freeMemory() 问题

我搜索并看到了一些线程但没有一个能够解决我遇到的具体问题我正在尝试使用以下方式监视我的内存使用情况Runtime getRuntime freeMemory Runtime getRuntime maxMemory and Runtim
Spring Security 自定义过滤器

我想自定义 Spring security 3 0 5 并将登录 URL 更改为 login 而不是 j spring security check 我需要做的是允许登录目录并保护 admin report html 页面首先我使用教
@RestController 没有 @ResponseBody 方法工作不正确

我有以下控制器 RestController RequestMapping value base url public class MyController RequestMapping value child url method Req
通过SOCKS代理连接Kafka

我有一个在 AWS 上运行的 Kafka 集群我想用标准连接到集群卡夫卡控制台消费者从我的应用程序服务器应用程序服务器可以通过 SOCKS 代理访问互联网无需身份验证如何告诉 Kafka 客户端通过代理进行连接我尝试了很多事情包
Spring Boot自动装配存储库始终为空[重复]

这个问题在这里已经有答案了每次我进入我的服务类时存储库似乎都没有自动连接因为它不断抛出 NullPointerException 谁能帮我检查一下我缺少什么吗这是我的代码演示应用程序 java package com exampl
如何在代理后面安装 Eclipse Neon

对于 Neon Eclipse 附带了一个安装程序我在安装程序中找不到任何配置菜单我的java版本是 java version java version 1 8 0 72 Java TM SE Runtime Environment b
来自十六进制代码的 Apache POI XSSFColor

我想将单元格的前景色设置为十六进制代码中的给定颜色例如当我尝试将其设置为红色时 style setFillForegroundColor new XSSFColor Color decode FF0000 getIndexed 无论我在
ConcurrentHashMap 内部是如何工作的？

我正在阅读有关 Java 并发性的 Oracle 官方文档我想知道Collection由返回 public static
如何检测 Java 字符串中的 unicode 字符？

假设我有一个包含的字符串我如何找到所有这些 un icode 字符我应该测试他们的代码吗我该怎么做呢例如给定字符串 A X 我想将其转换为 AYXY 我想对其他 unicode 字符做同样的事情并且我不想将它们存储在某种翻译映
使用 Guice 优化注册表

你好今天思考了一种优化有一些疑问语境我正在使用 Guice 2 进行 Java 开发在我的网络应用程序中我有一个转换器注册表可以即时转换为某种类型转换器描述如下 public class StringToBoolean im
在另一个模块中使用自定义 gradle 插件模块

我正在开发一个自定义插件我希望能够在稍后阶段将其部署到存储库因此我为其创建了一个独立的模块在对其进行任何正式的 TDD 之前我想手动进行某些探索性测试因此我创建了一个使用给定插件的演示模块到目前为止我发现执行此操作的唯一方法
GWT 2.3 开发模式 - 托管模式 JSP 编译似乎不使用 java 1.5 兼容性

无法编译 JSP 类生成的 servlet 错误 DefaultMessage 上次更新 0 日期中 0 时间 HH mm ss z 语法错误注释仅在源级别为 1 5 时可用在尝试以开发模式在 Web 浏览器中打开我的 gwt 模
Freemarker 和 Struts 2，有时它计算为序列+扩展哈希

首先我要说的是使用 Struts2 Freemarker 真是太棒了然而有些事情让我发疯因为我不明白为什么会发生这种情况我在这里问是因为也许其他人有一个想法可以分享我有一个动作有一个属性说 private String myT
在 SWT/JFace RCP 应用程序中填充巨大的表

您将如何在 SWT 表中显示大量行巨大是指超过 20K 行 20 列的东西不要问我为什么需要展示那么多数据这不是重点关键是如何让它尽可能快地工作这样最终用户就不会厌倦等待每行显示某个对象的实例列是其属性一些我想使用 JFa
java库维护数据库结构

我的应用程序一直在开发所以偶尔当版本升级时需要创建更改删除一些表修改一些数据等通常需要执行一些sql代码是否有一个 Java 库可用于使我的数据库结构保持最新通过分析类似 db structure version 信息并执
OpenCSV：将嵌套 Bean 映射到 CSV 文件

我正在尝试将 bean 映射到 CSV 文件但问题是我的 bean 具有其他嵌套 bean 作为属性所发生的情况是 OpenCSV 遍历属性找到一个 bean 然后进入其中并映射该 bean 内的所有数据如果找到另一个 bean 它就
洪水填充优化：尝试使用队列

我正在尝试创建一种填充方法该方法采用用户指定的初始坐标检查字符然后根据需要更改它这样做之后它会检查相邻的方块并重复该过程经过一番研究我遇到了洪水填充算法并尝试了该算法它可以工作但无法满足我对 250 x 250 个字符的数

随机推荐

jQuery 1.10.1 在选择上设置不存在的值

有人可以解释一下这种行为
Java内存模型中的Happens-Before关系

关于 JLS ch17线程和锁它表示如果一个操作发生在另一个操作之前则第一个操作对第二个操作可见并且在第二个操作之前排序我想知道 1 之前订购到底是什么意思因为即使action a发生在action b之前在某些实现中acti
Bootstrap 3+Rails 4 - 某些 Glyphicons 不工作

我正在尝试在我的 Rails 4 应用程序中使用 Bootstrap 3 已关注this使用 bootstrap saas 设置 bootstrap 3 的教程thisgithub 页面 Bootstrap 工作正常但字形图标未按预期工作
C# 如何正确地对遵循装饰器模式的类进行单元测试？

我对单元测试相当陌生我们说话时我实际上正在研究它我的目标当然是能够在下面的类中测试该方法该类只是检查输入是否已经在缓存中如果输入不在缓存中它将返回输入的反转形式虽然实现不在这里但假设它存在因为目的只是为了测试基本上目标是
获取与 int 值关联的枚举

以前我将 LegNo 枚举简单定义为 NO LEG LEG ONE LEG TWO 并通过调用return LegNo values i 我能够获得与每个枚举相关的值但现在我决定我想要LegNo enum NO LEG为 int 1 而
如何传递列表元素作为引用？

我将列表的单个元素传递给函数我想修改该元素从而修改列表本身 def ModList element element TWO l list l append one l append two l append three print l
在 iOS/Swift 中创建并导出为 Base64 的 RSA 公钥在 Java 中无法识别

TL DR 在 iOS 中生成并存储在钥匙串中导出为 base64 并发送到 java 后端的 RSA 公钥无法识别我正在 iOS 应用程序中实现聊天加密功能并使用对称非对称密钥来处理它无需过多讨论细节在后端我使用用户的公钥来
将.net core 5.0发布到单个exe文件中

有谁能够帮助我我正在尝试将我的 net core 控制台应用程序发布到单个文件中我正在使用这个命令 dotnet publish r win x64 c Release p PublishSingleFile true p Publis
如何在不登录 Xcode 8 的情况下构建 IPA

我已经在SO和其他地方进行了搜索我只发现这个答案的旧版本似乎不再起作用还有大量其他内容甚至与最新版本不相关长话短说我们有一位开发人员向我们提供了 IPA 但他不想加入我们的开发人员小组我告诉他给我们发送一个未签名的 IPA 但我们
如何访问 Windows 中的特殊目录？

在 Windows 上检索用户桌面文档文件夹和其他系统文件夹的 C 语法是什么您可以使用环境 GetFolderPath与环境特殊文件夹枚举例如 string desktopPath Environment GetFolderPat
WPF MVVM KeyBinding 无法立即识别并且并不总是有效

无论出于何种原因当我的 WPF 应用程序加载时我的 UserControl 的 KeyBindings 就无法工作它们在我按下表单上的按钮后起作用但当我通过单击或 alt tab 键或移动或类似方式将焦点设置到表单时则不起作用当它
Angular7 - 无法绑定到“dataSource”，因为它不是“mat-table”的已知属性

我正在使用 Angular 7 0 2 在尝试使用以下命令创建表时遇到此错误角材料无法绑定到 dataSource 因为它不是 mat table 的已知属性应用程序路由 module ts import NgModule from a
全新安装 Rails 并收到 OpenSSL 错误：“已经初始化常量 OpenSSL”

我在尝试使用 RoR 时遇到了困难我参加了 Ruby Installfest 但遇到了一个问题我认为是 openssl bundle 我正在使用 RVM 并运行 Rails 5 0 1 和 Ruby 2 4 0 我尝试使用完全删除重新
如何在 Ruby on Rails 上制作“数据透视表”？

首先我想提一下我对 Ruby 和 Rails 完全陌生我才刚开始学习所以如果我的问题看起来有点不清楚或太宽泛我深表歉意我正在尝试做一些简单的事情我认为即旋转表格我有一个看起来像这样的表 Name Product ID Am
使用颜色图作为第四维（x、y、z 的函数）绘制 3D 表面

我正在尝试绘制一个 3d 表面其中三个维度中的每一个都位于单独的值数组中并且每个坐标处的表面颜色是 x y z 的函数一种 numpy pcolormesh 但是 4D 而不是 3D 3D 图由下式给出 from mpl toolki
在 Delphi 中查找未使用的（又名“死的”）代码

是否有任何工具可以确定是否使用了函数过程方法整个类我见过一些工具可以帮助知识渊博的开发人员追踪未使用的代码片段大多数适用于 Delphi 以外的语言但大多数都有一个陡峭的学习曲线和或需要大量的挖掘来确定是否使用了代码片段据称
使用 pandas read_html 提取 href

作为我工作的一部分我需要检查这个page定期获取特定文件我发现我可以使用 pandas 的方法read html成功地将表读入数据帧这很方便因为我可以轻松地通过关键字查询特定文档我现在遇到的问题是此方法无法解析我需要的链接而是
Windbg 首先连接，然后卡在“调试对象未连接”上。内核调试期间的消息

我正在尝试进行 Windows 内核调试因此我为此目的设置了两台机器 HOST DEBUGGER 运行windbg调试器的计算机 TARGET DEBUGEE 正在调试的计算机 HOST 和 TARGET 都运行 Windows 7 32
按钮背景选择器

如果按下按钮我尝试切换按钮的背景我构建了一个选择器就像这里建议的答案一样具有不同颜色的标准 Android 按钮最后我想放GradientDrawables在里面但出于调试目的我只是设置了一种颜色以检查它是否有效这是我的选
从 HTMLDocument 获取所有 html 作为字符串

我用 Java 编码有谁知道我如何获取 javax swing text html HTMLDocument 的内容作为字符串这就是我到目前为止所得到的 URL url new URL http www test com HTMLEdi

从 HTMLDocument 获取所有 html 作为字符串

从 HTMLDocument 获取所有 html 作为字符串 的相关文章

随机推荐

热门标签

从 HTMLDocument 获取所有 html 作为字符串的相关文章