使用 sed 提取 HTML 标签数据

2024-07-04

我希望提取已知 HTML 标签之间的数据。例如:

Hello, <i>I<i> am <i>very</i> glad to meet you.

应该变成:

'I

very'

所以我找到了一些几乎可以做到这一点的东西。不幸的是,它只提取最后一个条目。

sed -n -e 's/.*<i>\(.*\)<\/i>.*/\1/p'

现在我可以附加任何结束标记</i>带有换行符,效果很好。但是有没有一种方法可以只用一个 sed 命令来做到这一点?


尝试一下:

sed -n 's|[^<]*<i>\([^<]*\)</i>[^<]*|\1\n|gp'

你的例子缺少一个“/”:

Hello, <i>I</i> am <i>very</i> glad to meet you.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 sed 提取 HTML 标签数据 的相关文章

  • 如何在使用 Javascript 在控制台中调用 start() 和 stop() 时启动和停止多步动画?

    我为多步动画编写了以下代码
  • 创建一个指向端口非80的IP的域名

    我想使用域名来指向本地服务器IP地址上的网页 然而 问题是该页面链接到端口 8088 而不是 80 上设置的 IP 地址 因为后者已被另一个网页使用 域名公司告诉我他们不能这样做 因为域名只能指向在端口 80 上设置的 IP 地址 所以现在
  • 我的元素没有填充页面的整个空间

    因此 使用下面的 CSS 代码 我想让我的页面完全充满我计算机上的图像 相反 结果是这样的 background background image url anFtp position fixed height 100 width 100
  • 如何使用 XSLT 输出 [重复]

    这个问题在这里已经有答案了 可能的重复 使用 XSLT 设置 HTML5 文档类型 https stackoverflow com questions 3387127 set html5 doctype with xslt 我是 xslt
  • 有没有基于 Maven 的 HTML 验证器

    我有一个包含许多 HTML 文件的项目 作为 Maven 构建过程的一部分 我想在这些文件上运行验证器以确保 这些文件在语法上是正确的 例如检查所有开始标签是否都有相应的结束标签 文件符合编码指南 有人可以推荐一个好的验证器来做到这一点吗
  • 导出/下载表 HTML-PHP 到 Excel 文件

    我有一个 HTML PHP 表格 可以从 mySQL 中提取数据 请看这里link https anakpanti com ab cargo controllers searchshipment 例如 请搜索此发货代码以获取表格内的结果 4
  • 在事件监听器函数中传递参数[重复]

    这个问题在这里已经有答案了 我想将参数传递给事件侦听器内部调用的函数 下面的代码显示了我想要做的事情 但它不允许我按照常规方式进行操作 有什么解决方法吗 HTML 代码
  • 粘性页眉和页脚可滚动内容

    我正在尝试创建一个包含三个 div 的页面 页眉 页脚和内容区域 这些应该占据 100 的屏幕 页眉和页脚很小并且不会改变 内容区域可以是任意大小 所以我添加了overflow auto当它变得太大时使其滚动 问题是 它溢出了屏幕的高度 我
  • 在提交之前合并 $_GET 变量[关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我不太确定这是否可能 但这是我无法弄
  • 当 flex-direction 为“column”时,CSS flex-basis 不起作用

    我的目标是使用 Flexbox 创建一个两列布局 其中第一列有两行 第二列有一行 如下所示 Setting flex basis 100 在第三个项目上给出了所需的效果 但仅当容器的flex direction is row 改变flex
  • 将第三方 JS 和 CSS 库与我的项目资产打包在一起有好处吗?

    我想开始使用缩小工具 例如Minify http code google com p minify Uglify https github com mishoo UglifyJS or Closure https developers go
  • 如何使用 TCPDF 将字体嵌入到 PDF 中?

    我尝试使用 TCPDF 其代码如下 require once SERVER DOCUMENT ROOT tcpdf tcpdf php pdf new TCPDF PDF PAGE ORIENTATION PDF UNIT PDF PAGE
  • 同一产品的多个图像,可访问性要求

    对于具有单个产品的多个图像的网页 例如具有不同角度的图像 是否有要求alt每个图像的标签 在亚马逊上查看示例 似乎他们只有一个alt第一张产品图片上有标签 但之后就没有了alt tag or aria相关标签 第一个例子在这里 https
  • Jquery 密码字段的默认值

    我在用这个 Jquery 插件 http mudge github com jquery example 用于使用单击时消失的文本填充输入 它对于密码字段来说并不理想 因为所有内容都显示为点 在开始输入之前使默认文本在密码字段中可见的好方法
  • 用随机图像填充表格

    首先 我的编码经验包括修改简单的脚本以在我的页面上工作 其次 我搜索并发现了几个类似的问题 但无法完全解决它们 我需要一些帮助来使用大约 40 张图像数组中的随机图像填充 3x3 表 我目前有一个使用 backgroundImage 属性的
  • HTML 文本和密码输入字段的大小不同 Internet Explorer

    我正在为我的登录表单使用此表单设置 tr td class label Username td td td tr
  • 错误:“访问受限 URI 被拒绝”

    访问受限 URI 被拒绝 代码 1012 中断此错误 xhttp send null function getXML xml file if window XMLHttpRequest var xhttp new XMLHttpReques
  • 垂直对齐到另一个 div 的动态高度?

    我正在尝试将一个 div 与高度动态的相邻 div 垂直对齐 我遇到的大多数方法都要求我知道父 div 的高度 但如果你看我的例子 就会发现是 右 div 驱动了整个部分的高度 我试图让 div 左 中的文本垂直居中显示在右侧的 div 上
  • 覆盖引导样式不起作用

    我有这种简单的情况 我有一种没有定义的风格display属性值 我最近在我的项目中添加了 bootstrap 没有出现重大问题 只有一个 In label bootstrap style is defined a display inlin
  • 如何在角度4中使用addHTML

    我试图在 Angular 中使用 jspdf 库的 addHTML 函数 并且已经安装了 html2Canvas 但出现错误 这是我的 demo component ts 文件 import Component OnInit ViewChi

随机推荐