只获取当前节点的文本

2024-01-09

在 Cheerio 中,如何仅获取当前节点的文本?

var cheerio = require('cheerio')

const htmlString = '<div>hello<span>world</span></div>'

$ = cheerio.load(htmlString, { ignoreWhitespace: true })

console.log($('div').text())  //helloworld
console.log($('span').text())  //world

你怎样才能得到公正hello?


你可以这样做:

console.log($('div').contents().first().text()) # hello
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

只获取当前节点的文本 的相关文章

  • 用nodejs库cheerio抓取网页内容与图片

    之前都是PHP phpQuery 抓取 xff0c 但jQuery更强大 xff0c 于是用nodejs 只是node jquery的依赖太多 xff0c 只好用cheerio 下面是一个抓取脚本 xff1a var http 61 req
  • 使用 Node.js 从网页中抓取 URL

    我正在尝试从网站上抓取所有 URL 并将它们放入一个数组中 我有一个关于数组索引的问题 如果我将像 2 这样的索引号添加到 array 2 中 命令行会回复 未定义 如果我删除索引并打印整个数组 它会逐行打印所有 URL 我希望每个 URL
  • 如何使用node.js获取cheerio中的元素名称

    如何在cheerio 中获取元素的名称 等效的 jQuery 是 attr name 但这会返回undefined在欢呼 我想只有一种情况 someElement attr name 回报undefined 如果没有属性 name在那个元素
  • 使用 console.print Cheerio + Nodejs 时出现奇怪的字符

    我是 Node js 新手 正在编写第一个脚本来抓取一些数据 有谁知道为什么我在使用此代码时看到其中带有问号的奇怪字符 var express require express var fs require fs var request re
  • Cheerio 不会等待正文加载

    我制作了一个非常简单的脚本 它抓取了一个食谱网站以获取标题 准备时间和成分 除了脚本无法抓取数组的每一页之外 一切工作正常 有时我得到 4 个 有时 2 个 有时甚至 0 个 看来脚本不会等待主体完全加载 我完全知道 Cheerio 不理解
  • 使用cheerio从ul中提取2个元素

    我想从每个元素中提取 2 个元素li在这个无序列表中 ul class cookieAlertList padTop10 li img src images cookieradar iconHot gif div class cookieA
  • 在nodejs中保存从url保存的图像时出现问题

    我试图scrape网站数据同时scraping从我的服务器目录打开图像时 我收到类似文件 加载图像时发生错误 的错误 图像以扩展名存储 但图像无法正确打开 var request require request var cheerio re
  • Node.js Cheerio 解析器破坏了 UTF-8 编码

    我用 Cheerio 解析我的请求 如下所示 var url http shop nag ru catalog 16939 IP videonablyudenie OMNY 16944 IP kamery OMNY c vario obek
  • 将 Cheerio.js 添加到 Angular 6 项目?

    我创建了一个全新的 Angular 6 项目并安装了 Cheerio js npm install cheerio 安装 Cheerio js 后 我想将其添加到我的项目中所需要做的就是导入它并将其添加到 NgModule 导入中 impo
  • 导入酶后加载模块 DomUtils 时出现 Webpack 错误

    我有一个使用 TypeScript 和 React 0 14 的项目 我用 karma mocha chai 设置了测试环境 以及它的工作 但是当我导入并使用酶中的函数时 我在浏览器中收到错误 来自 Chrome 的人类可读错误 Uncau
  • 只获取当前节点的文本

    在 Cheerio 中 如何仅获取当前节点的文本 var cheerio require cheerio const htmlString div hello span world span div cheerio load htmlStr
  • 为什么我的 readFileSync 函数没有执行? [复制]

    这个问题在这里已经有答案了 我正在尝试从 Node js 中的文件中读取数据 这是我的代码 const cheerio require cheerio var fs require fs var path process argv 2 va
  • 如果我想要抓取的图像受 cloudflare 保护并给出 1020 错误,有没有办法使用 Cheerio 抓取网站?

    我正在尝试创建一个漫画抓取网站作为个人项目 就在我完成整个网站时 我知道图像无法被我的网站抓取或查看 当我尝试转到图像的链接时 我收到 1020 错误 指出访问被拒绝 有什么方法可以绕过该错误 而无需从网站所有者那里获取授权令牌 如果答案是
  • 如何在cheerio中获取div的childNodes?

    我想使用cheerio 获取div 的第一个childNode 我使用 javascript dom 操作来获取它 但无法在cheerio 上获取它 我已经在开发工具中尝试过并得到了预期的结果 但我想通过使用cheerio来实现 javas
  • 使用 Meteor.js 进行抓取

    我可以使用meteor js 进行抓取吗 刚刚发现cheerio结合起来效果很好request 我可以将它们与流星一起使用吗 或者有类似的东西吗 你有一个可行的例子吗 当然 很难想象还有什么是流星做不到的 首先 您需要一些东西来处理远程 h
  • Cheerio、axios、reactjs 从网页上抓取表格并返回空列表

    试图从这个网站上删除这张表 https www investing com commodities real time futures https www investing com commodities real time future
  • 从 Facebook 页面提取公共帖子,无需 API/APP 密钥/令牌/秘密

    提前澄清一下 我没有 Facebook 帐户 也无意创建一个帐户 另外 我想要实现的目标在我的国家和美国是完全合法的 我不想使用 Facebook API 来获取 Facebook 页面的最新时间线帖子 而是直接向页面 URL 发送获取请求
  • 使用 jQuery/cheerio 访问脚本标签中的变量

    我使用 Node js Cheerio 进行网页抓取 请求该网站后 我得到了这样的信息 如何通过 Cheerio jQuery 访问变量值 你可以获得
  • 有没有办法选择 Cheerio 中的每个元素?

    有没有一种方法可以获取包含 html 页面中的每个元素 包括子元素 的 Cheerio 对象 然后对其进行迭代 我尝试过使用该对象 body 但它只给出 HTML 正文的直接子级 而不是所有后续子级 我可以做些什么来选择所有 HTML 元素
  • 使用node.js访问DOM

    我想访问 html 文件并使用 node js 通过 id 获取元素 这是我的 html 文件

随机推荐