Node.getTextContent() 有没有办法获取当前节点的文本内容，而不是后代的文本

2023-12-23

Node.getTextContent() 返回当前节点及其后代的文本内容。

有没有办法获取当前节点的文本内容，而不是后代的文本。

Example

<paragraph>
    <link>XML</link>
    is a 
    <strong>browser based XML editor</strong>
    editor allows users to edit XML data in an intuitive word processor.
</paragraph>

预期产出

paragraph = is a editor allows users to edit XML data in an intuitive word processor.
link = XML
strong = browser based XML editor

我尝试了下面的代码

String str =            "<paragraph>"+
                            "<link>XML</link>"+
                            " is a "+ 
                            "<strong>browser based XML editor</strong>"+
                            "editor allows users to edit XML data in an intuitive word processor."+
                        "</paragraph>";

        org.w3c.dom.Document domDoc = null;
        DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
        DocumentBuilder docBuilder;

        try {
            docBuilder = docFactory.newDocumentBuilder();
            ByteArrayInputStream bis = new ByteArrayInputStream(str.getBytes());
            domDoc = docBuilder.parse(bis);         
        } catch (ParserConfigurationException e1) {         
            e1.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }       

        DocumentTraversal traversal = (DocumentTraversal) domDoc;
        NodeIterator iterator = traversal.createNodeIterator(
                domDoc.getDocumentElement(), NodeFilter.SHOW_ELEMENT, null, true);

        for (Node n = iterator.nextNode(); n != null; n = iterator.nextNode()) {           
            String tagname = ((Element) n).getTagName();
            System.out.println(tagname + "=" + ((Element)n).getTextContent());
        }

但它给出这样的输出

paragraph=XML is a browser based XML editoreditor allows users to edit XML data in an intuitive word processor.
link=XML
strong=browser based XML editor

请注意段落元素包含的文本link and strong标签，我不想要。请提出一些想法？

您想要的是过滤节点的子节点<paragraph>只保留具有节点类型的Node.TEXT_NODE.

这是一个方法示例，它将返回您所需的内容

public static String getFirstLevelTextContent(Node node) {
    NodeList list = node.getChildNodes();
    StringBuilder textContent = new StringBuilder();
    for (int i = 0; i < list.getLength(); ++i) {
        Node child = list.item(i);
        if (child.getNodeType() == Node.TEXT_NODE)
            textContent.append(child.getTextContent());
    }
    return textContent.toString();
}

在您的示例中，这意味着：

String str = "<paragraph>" + //
        "<link>XML</link>" + //
        " is a " + //
        "<strong>browser based XML editor</strong>" + //
        "editor allows users to edit XML data in an intuitive word processor." + //
        "</paragraph>";
Document domDoc = null;
try {
    DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
    DocumentBuilder docBuilder = docFactory.newDocumentBuilder();
    ByteArrayInputStream bis = new ByteArrayInputStream(str.getBytes());
    domDoc = docBuilder.parse(bis);
} catch (Exception e) {
    e.printStackTrace();
}
DocumentTraversal traversal = (DocumentTraversal) domDoc;
NodeIterator iterator = traversal.createNodeIterator(domDoc.getDocumentElement(), NodeFilter.SHOW_ELEMENT, null, true);
for (Node n = iterator.nextNode(); n != null; n = iterator.nextNode()) {
    String tagname = ((Element) n).getTagName();
    System.out.println(tagname + "=" + getFirstLevelTextContent(n));
}

Output:

paragraph= is a editor allows users to edit XML data in an intuitive word processor.
link=XML
strong=browser based XML editor

它的作用是迭代节点的所有子节点，仅保留文本（从而排除注释、节点等）并累积它们各自的文本内容。

没有直接的方法Node or Element仅获取第一级的文本内容。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

xml

DOM

Node.getTextContent() 有没有办法获取当前节点的文本内容，而不是后代的文本的相关文章

通过 html tidy 提供渲染 jsp 页面

我有一个在 Glassfish 上运行的 Java 项目它会呈现一些难看的 HTML 这是使用各种内部和外部 JSP 库的副作用我想设置某种渲染后过滤器通过 HTMLTidy 提供最终的 HTML 这样源代码就很好且整洁有助于调试
使用正则表达式验证输入字符串是否为 0-255 之间的数字

我在将输入字符串与正则表达式匹配时遇到问题我想验证输入数字在 0 255 之间并且长度最多应为 3 个字符代码工作正常但当我输入 000000 至任意长度时显示 true 而不是 false 这是我的代码 String IP 000
Java 流 - 按嵌套列表分组（按第二顺序列出）

我有以下数据结构每个学生都有一个州列表每个州都有一个城市列表 public class Student private int id private String name private List
ResultSet：通过索引检索列值与通过标签检索

使用 JDBC 时我经常遇到这样的结构 ResultSet rs ps executeQuery while rs next int id rs getInt 1 Some other actions 我问自己以及代码作者为什么不使用
Active MQ - HelloWorld 示例异常

我正在尝试运行 hello world 示例在这里找到 http activemq apache org hello world html I added activemq all 5 5 1 jar已经到图书馆了它构建成功但出现以下警
MediaPlayer.create() 始终返回 null

我以前用过媒体播放器从来没有遇到过这个问题每当我尝试使用 MediaPlayer create 时该方法都会给我 null 并且我无法播放声音我有什么遗漏的吗 public class Game extends Activity p
如何在 Java 中使用 StringUtils？

我是 Java 初学者我想用StringUtils replace但 Eclipse 输出 StringUtils cannot be resolved I tried import java lang 但它不起作用 java lang不
按文件名过滤 eclipse 中的警告

我们使用 Eclipse 进行 Java 开发并使用 Maven 将 JSP 编译成 servlet 以便在嵌入式 Jetty 实例中使用这意味着要从 Eclipse 运行该项目我必须包含 target jsp source 作为源文
spring mvc 跟踪引用页面

在基于注释的弹簧控制器中如果用户正在url com first page并点击一个链接或提交一份表格指出url com second page 如何制作second page知道url of first page所以这样second pa
为什么我要使用责任链而不是 switch 语句

考虑一下您已经获得了多次验证仅当要检查的对象属于某种类型时这些验证才应生效为什么我要使用责任链而不是 switch 语句责任链示例 public class Executor Inject private ValidatorFact
使用 DOM 获取 div 的内容（包括子标签）

我正在使用 DOM 来获取 div 标签的内容但内部 html 部分未显示功能是 dom new DOMDocument libxml use internal errors true dom gt loadHTMLFile url l
vm 参数中的 -D 是什么，它表示为什么我们必须在 vm 参数中始终指定 -D

vm 参数中的 D 是什么它表示为什么我们必须在 vm 参数中始终指定 D 有什么标准吗如果是那是什么以及指定的位置 D 设置当前运行的 java 程序可以访问的属性值它允许程序员设置程序运行所需的值但程序不知道这些值是什么因此
selenium webdriver 中的多个程序执行不起作用

Selenium WebDriver 中的多个程序执行不起作用我编写了 1 个 testNG xml 文件和 2 个 java 类我尝试从 xml 文件运行这两个 java 类但这不起作用 XML代码
春季MVC。方法参数字段的默认值

我有一个带有方法测试的简单控制器 RequestMapping produces application json ResponseBody public HttpEntity
如何列出Resources文件夹中的所有文件（java/scala）

我正在编写一个函数需要访问资源中的文件夹并循环遍历所有文件名如果这些文件符合条件则加载这些文件 new File getClass getResource images sprites getPath listFiles 返回空指针
使用正则表达式匹配阿拉伯文文本

我试图使用正则表达式仅匹配阿拉伯语文本但出现异常这是我的代码 txt matches P Arabic 这是例外情况线程 main 中的异常 java util regex PatternSyntaxException 索引 9 附近
Retrofit 2.0：预期为 BEGIN_OBJECT，但在第 1 行第 1 列路径 $ [重复] 处为 STRING

这个问题在这里已经有答案了我在邮递员上传递了更新用户请求并获得了成功的响应参见图片现在当我尝试使用 Retrofit 2 在我的应用程序中执行相同操作时出现错误 com google gson JsonSyntaxException
在没有EOF的情况下停止读取java中的输入

In 问题如何停止读取输入我的程序继续运行要求更多输入 public static void main String args throws Exception BufferedReader br new BufferedReader
获取Java中ResultSet返回的行数

我用过一个ResultSet返回一定数量的行我的代码是这样的 ResultSet res getData if res next System out println No Data Found while res next code t
Java 可变 BigInteger 类

我正在使用 BigIntegers 进行计算该计算使用一个调用 multiply 大约 1000 亿次的循环并且从 BigInteger 创建新对象使其非常慢我希望有人编写或找到了 MutableBigInteger 类我在 jav

随机推荐

使用表单发布验证 OAuth 不记名令牌

我使用 Web API 2 创建了一个基于 OData 的 Web 后端在控制器上使用 AuthorizeAttribute 效果非常好我希望能够通过标准 html 表单和提交上传文件我们传递 OAuth 令牌该令牌通常作为隐藏输入
flutter 中的嵌套路由浏览器 url

我已经关注了这个tutorial https docs flutter dev cookbook effects nested nav 到目前为止嵌套路由可以正常工作但当我导航到嵌套路由时浏览器的 URL 不会更新我知道浏览器 ur
如何使用 QPainter 类在圆圈周围书写文字？

问题很简单我想要这样的东西要么使用QPainter类或使用Qt 图形框架有几种方法可以使用QPainterPath指定的here http qt project org faq answer how do i make text fo
如何使用 SourceTree 更新我的分叉存储库？

我正在使用 SourceTree 与 BitBucket 来管理我的代码我已经分叉了一个存储库并且父存储库已更新如何使用 SourceTree 将上游代码合并到我的分叉存储库中首先设置父存储库在 SourceTree 中打开您的
如何以十进制值而不是 null 获取此值

我试图在此查询中获取十进制值但无法获取我得到 NULL 值 SELECT CAST CAST CAST SUM CAST 0 AS INT AS DECIMAL 10 2 100 CAST NULLIF SUM CAST 0 AS INT
如何在 Flutter 的 Stack Widget 中添加多个浮动按钮

在颤振中使用一个视图覆盖另一个视图堆栈小部件 https docs flutter io flutter widgets Stack class html 做工很好啊现在我需要在屏幕底部的左侧和右侧添加两个浮动按钮我在右侧添加了一个按钮
创建已完成的任务

我想创建一个完整的Task not Task
如何关闭二进制文件（.doc、.pdf 等）的 git 1.7.8 开销

我使用 git 1 7 4 来处理大型 svn 存储库没问题我更新到 git 1 7 8 现在当我执行 git svn dcommit 时 git 做了一些多余的工作在任务管理器中我看到它执行了大约 1M 的写入操作我使用的是
从逻辑应用中的服务总线获取内容

I am new to Azure logic apps I have a service bus and pass a json object message to that service bus then I set up an ac
Android：将此对象设为可打包

我有一个对象需要在 2 个对象之间传递Activity 该对象有 HashTable String 等无法弄清楚如何使其成为 Parcalebale 以便我可以填充该对象的数组并将单个 obj 或数组传递给其他 Activity 我的班级
机器学习中回归和分类之间的区别？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是机器学习的新手谁能告诉我机器学习中分类和回归之间的主要区别回归旨在预测连续的输出值例如假设您试图根据许多输入参数来预测某个
如何消除渲染后“闪烁”？

我尽力成为 Javascript Ajax 技术使用的纯粹主义者确保所有 Ajax y 行为都是基本功能的增强同时在禁用 Javascript 时该网站也能正常运行然而这会导致一些问题在某些情况下 DOM 节点仅在浏览器中启用 J
ggplot将颜色渐变缩放到数据范围之外的范围

我正在寻找一种方法来拉伸两个值之间的颜色渐变并标记图例而不管数据集中的数据值范围如何本质上是否存在等价于的功能ylim 对于颜色渐变给定绘制通常在 1 和 1 之间的 z 值的代码如果中断在数据范围内我可以绘制并标记梯度 lib
手动为 gdb 创建调试符号

Intro 对于我的编译器课程我必须将一些语言翻译为汇编语言现在我的代码出现了段错误我很难对其进行调试具有监视变量的能力会大大简化过程但最终的 asm 代码只有寄存器及其导数 Question 如何手动为 gdb 创建调试符号我
文件存在冲突，尽管 gitignore 应该忽略它们

尽管我有一些文件存在冲突 gitignore应该忽略他们如果我尝试更新我得到的解决方案Unmerged path git status带来以下内容 On branch master Your branch is up to date wi
在 Java 中读取文本文件直至 EOL

我正在尝试读取一个文本文件其中包含 hello James How are you today 我想读取字符串中的每个字符直到找到 EOL 字符因为我使用的是 Windows 其中 n r 代表 EOL 字符我如何编写一个条件来遍历
应用程序生成的应用程序请求在 Silverlight 中失败

我正在尝试在两个用户之间发送应用程序生成的请求而不通过 JavaScript UI FacebookClient client new FacebookClient SessionSecret Dictionary
实体框架和 LINQ To SQL - 利益冲突？

过去一周我一直在博客圈上读到 Linq to SQL 已死而 EF 和 Linq to Entities 万岁但当我阅读 MSDN 上的概述时我发现 Linq to Entities 生成 eSQL 的方式与 Linq to SQL
为什么 justify-content space- Between 没有做任何事情？

我正在尝试获取top nav and bot nav通过使用垂直分隔的部门justify content space between 然而它什么也没做有人可以指出我做错了什么吗 import url https fonts google
Node.getTextContent() 有没有办法获取当前节点的文本内容，而不是后代的文本

Node getTextContent 返回当前节点及其后代的文本内容有没有办法获取当前节点的文本内容而不是后代的文本 Example

Node.getTextContent() 有没有办法获取当前节点的文本内容，而不是后代的文本

Node.getTextContent() 有没有办法获取当前节点的文本内容，而不是后代的文本 的相关文章

随机推荐

热门标签

Node.getTextContent() 有没有办法获取当前节点的文本内容，而不是后代的文本的相关文章