如何删除两个单词之间的字符串

2024-03-03

我正在使用下面的代码行下载网页，

WebRequest request = WebRequest.Create(strURL);
WebResponse response = request.GetResponse();
Stream data = response.GetResponseStream();

string html = String.Empty;
using (StreamReader sr = new StreamReader(data))
{
  html = sr.ReadToEnd();
}

然后从这里我提取身体部分如下：

int nBodyStart = downloadString.IndexOf("<body");
int nBodyEnd = downloadString.LastIndexOf("</body>");
String strBody = downloadString.Substring(nBodyStart, (nBodyEnd - nBodyStart + 7));

现在我想删除正文部分中附加的任何 JavaScript，我该怎么做？

我的目标是获取网页的唯一内容。但由于每个页面可能有不同的方法，所以我尝试删除任何 js 标签，然后使用下面的正则表达式删除任何 HTML 标签

Regex.Replace(strBody, @"<[^>]+>|&nbsp;", "").Trim();

但我不知道如何删除脚本标记之间的js，因为脚本可能是多行或单行。

提前致谢。

要匹配脚本标签（包括对的内部），请使用以下命令：

<script[^>]*>(.*?)</script>

要匹配所有 HTML 标签（但不匹配对的内部），您可以使用：

</?[a-z][a-z0-9]*[^<>]*>

我刚刚意识到您可能也想删除样式标签：

<style[^>]*>(.*?)</style>

完整的正则表达式字符串在这里：

<script[^>]*>(.*?)</script>|<style[^>]*>(.*?)</style>|</?[a-z][a-z0-9]*[^<>]*>|<[^>]+>| 

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

javascript

html

regex

如何删除两个单词之间的字符串的相关文章

如何自定义 Google 测试失败消息？

我编写了一个如下所示的 Google 测试它将一些计算值与 CSV 文件中预期存储的值进行比较 class SampleTest public testing Test public void setupFile const std st
扩展html表格突出显示行和列并使当前单元格具有不同的颜色

我找到了用鼠标悬停时突出显示行和列的示例 https stackoverflow com a 28312853 139698 https stackoverflow com a 28312853 139698 如何使鼠标悬停的一个单元格变为
在c#中获取没有时间的日期

我的表上有一列缺勤日期时间日期当我想要获取包含日期的行时它返回 0 行这是我的 C 代码 DateTime ClassDate DateTime Parse lblDate Content ToString var Abs dbs
在Vue.js 3中添加全局变量

如何在 Vue js 3 中添加全局变量在 Vue js 2 中我们在main js file Vue prototype myGlobalVariable globalVariable 最直接的替换就是app config globa
单击保存文件

我希望能够通过单击下载 csv 文件而不是在浏览器中打开我把这段代码 a href file csv download file a 但单击它会在浏览器中打开 v 文件在本地主机中当我单击链接时它正在下载但在服务器上时它在浏览
延迟 HTML5：无效伪类直到第一个事件发生

我最近发现 invalid伪类适用于required页面加载后立即生成表单元素例如如果您有以下代码
如何让XmlReader读取C#中的属性？

我有一个 XML Stream 其中包含以下 XML 内容
我在使用 ado.net 时收到错误 Argument 2 may not be pass with ref keywords

int t 0 cmd Parameters AddWithValue Res ref t 我在第二行收到错误参数 2 不能与 ref 关键字一起传递您只能通过引用传递参数ref if the 范围 is a ref参数也是如此 Add
配置：错误：无法运行C编译的程序

我正在尝试使用 Debian Wheezy 操作系统在我的 Raspberry Pi 上安装不同的软件当我运行尝试配置软件时我尝试安装我得到此输出 checking for C compiler default output file
使用数据绑定，如何将包含表情符号的文本绑定到标签并使其正确显示？

我正在编写一个应用程序来连接 WordPress BuddyPress API 该应用程序将允许用户通过 API 相互发送消息当这些消息包含表情符号时我很难正确显示它们以下是 API 返回的消息文本的简短示例 Hi x1f642 ho
如何使用jquery点击眼睛图标时显示和隐藏密码

我需要在单击眼睛图标时显示和隐藏用户密码因此我为此编写了脚本当我单击眼睛图标时只有类正在更改但密码不可见再次单击斜线眼睛图标它应该隐藏这两个图标方法不起作用如何解决这个问题
C#：自定义转换为值类型

是否可以将自定义类转换为值类型这是一个例子 var x new Foo var y int x Does not compile 是否有可能实现上述情况我需要超载一些东西吗Foo 您将必须重载强制转换运算符 public class F
传递数组时在 C 中的函数参数中强制指定数组大小

Context 在 C 中我有一个以数组作为参数的函数该参数用作该函数的输出输出的大小始终相同我会让阅读代码的人清楚所需的大小不过它已经在函数注释中了理想情况下编译会输出警告或错误这样我就可以在编译时而不是运行时防止出现问
Gremlin.net 文本包含等效项

我正在使用 Gremlin net 库连接到 janus 图形服务器我使用 cassandra 和弹性搜索进行数据存储和索引在我使用的 gremlin 语言和 gremlin 控制台中文本包含在属性的文本中进行搜索我正在使用混合索引
选择合适的IDE

您会推荐使用以下哪种 IDE 语言来在 Windows 下开发涉及识别手势并与操作系统交互的项目我将使用 OpenCV 库来执行图像处理任务之后我将使用 win32 API 或 NET 框架与操作系统交互具体取决于您建议的工具性能
通过均匀分布值来有效合并两个数组

我见过许多问题答案主题是通过交替值合并两个数组他们是这样工作的 let array1 a b c d let array2 1 2 let outcome a 1 b 2 c d 但我希望输出更加高效并且根据数组大小均匀分配值 exp
React 嵌入脚本标签不可样式化

我打算将 SurveyMonkey 调查嵌入到我的网站中用 React 制作只是让它工作起来很麻烦但最终这段代码工作了 let script let extractScript
为什么在构造函数中设置字段是（或不是）线程安全的？

假设您有一个像这样的简单类 class MyClass private readonly int a private int b public MyClass int a int b this a a this b b public int
如何在输入时格式化 contenteditable div？

我正在尝试编写一个函数允许 contenteditable div 在用户输入 div 时执行一些自动格式化到目前为止我只能让它在 IE 中运行有人可以帮助我吗 function formatOnKeyUp if window get
如何使用 C# 为 azure devops 变量赋值

我有 selenium C 测试脚本可以从浏览器获取令牌我有两个 azure devops 任务一个用于执行 selenium 测试另一个用于执行 API 测试我想将 selenium 测试获取的令牌传递给 API 测试执行任务

随机推荐

Javascript 拼接在 jQuery .each() 上中断？

var results one two one hundred three var removal each results function i removal push i if results i indexOf one 1 cons
C++：与通用 const 指针作斗争

我在一些模板化代码中遇到了一些关于 const 正确性的恼人问题这些问题最终归结为以下观察结果由于某种原因给定一个类似 STL 的容器类型 T const typename T pointer实际上似乎并没有产生常量指针类型即使T
如何强制 FileSystemWatcher 等待文件下载？

我正在下载一个文件并且只想在下载完成后才执行安装我该如何实现这个目标似乎 FileSystemWatcher onCreate 事件会执行此操作但这发生在不同的线程中是否有一种简单的方法可以强制等待部分发生在同一线程中到目前为止
python中的Timeit模块无法正确运行

我正在尝试使用 python 的 timeit 模块似乎 timeit 源代码中存在错误尽管这似乎不正确这是正在运行的代码片段 def recordCuckoo amtElements loadFactor Determines th
IEEE 754：为什么谓词 == 和 != 没有发出信号？

注意了解IEEE 754 请耐心等待 IEEE 754 2008 表 5 2 列出了五个无序信号谓词及其否定当关系无序时它们会导致无效操作异常该无效操作异常可以防止使用以下代码编写的程序中出现意外的安静 NaN 标准谓词 gt 及其
MongoDB Atlas 和适用于 AWS 的 MongoDB Atlas 有什么区别

在调查物联网数据存储的兼容数据库期间我研究了 MongoDB 发现定价有点令人困惑只是想知道有什么区别MongoDB 阿特拉斯 https www mongodb com cloud atlas pricing and 适用于 AWS
提供大型 CSS 文件

我有一个大约 50k 的大型压缩 CSS 文件大约有 30 个页面引用了该文件将 CSS 分离到一个基本文件中每个页面都有单独的 CSS 文件会显着减少加载时间还是提供一个大文件实际上是相同的谢谢我不完全确定你的意思但是提供一
iOS 中的裁剪区域与选定区域不同？

这是github上的链接https github com spennyf cropVid tree master https github com spennyf cropVid tree master您自己尝试一下看看我在说什么测试需
连续改变 UISlider 拇指图像上 UILabel 的值

我有一个UISlider 最少 1 个最多 10 个我希望它的拇指有一个UILabel放置在它的顶部在移动时不断更新和更改其文本UISlider的拇指所以我从UISlider并添加了一个UILabel但一旦拇指移动标签似乎会覆盖
Cuda C++ 设备代码中没有元组吗？

global void addKernel int c const int a const int b int i threadIdx x auto lamb int x return x 1 Works auto t std make t
Keras 中 Conv1d 中的 input_shape 变量如何工作？

再见我正在 Keras 上使用 CNN 1d 但我在输入形状变量方面遇到了很多麻烦我有一个包含 100 个时间步长和 5 个带有布尔标签的特征的时间序列我想训练一个使用长度为 10 的滑动窗口的 CNN 1d 这是我编写的非常简单的代
如何将按组绘图元素叠加到 ggplot2 方面？

我的问题与分面有关在下面的示例代码中我查看了一些分面散点图然后尝试在每个方面覆盖信息在本例中为平均线 tl dr 版本是我的尝试失败了要么我添加的平均线计算所有数据不尊重方面变量要么我尝试编写一个公式但 R 抛出错误然后是
传递带有自定义数据属性的函数

是否可以传递具有自定义数据属性的函数这不起作用 div div function hello console log hello 当我获得该属性时它是一个值为 hello 的字符串而不是函数怎么解决这个问题呢你可以这样做 div d
是否可以在 git-extensions 中为特定文件扩展名设置 diff/merge-tool ？

我刚刚开始使用 LabView 进行开发这对我来说是全新的我想使用 git 扩展来处理我的版本控制由于源位于 vi格式我无法使用普通的 diff 工具源是二进制的幸运的是 LabView 附带了专用的差异和合并工具这似乎非常有
关于真实的表示可以假设什么？

该程序返回0在我的机器上 include
HTML 数据在 Android 中从 json webservice 获取的 Webview 中无法正确显示？

我正在使用 json webservice 从服务器获取 HTML 数据并在 webview 中显示在 iPhone 中可以完美显示屏幕尺寸但在 Android 中则不能完美显示这里我放下了webservice链接和代码以及andro
Gemfile.lock 应该包含在 .gitignore 中吗？

我对捆绑器及其生成的文件有点陌生我有一份来自 GitHub 的 git 存储库副本该存储库由很多人贡献因此我惊讶地发现捆绑程序创建了一个存储库中不存在且不在 gitignore list 因为我已经分叉了它所以我知道将它添加到存储库
Javascript 书签在 Firefox 41 中停止工作

在 Firefox 41 中小书签带有javascript 网址例如javascript alert it works 从点击或关键字运行停止工作有没有什么解决办法可以使用javascript Firefox 41 中的书签以前
OpenID Connect 使用 Office 365 和 spring security 登录

我需要配置OpenID 连接用一个春季安全过滤器以授权使用我的 Rest API Web 我找到了一个谷歌登录示例 http www baeldung com spring security openid connect 但就我而言我需要
如何删除两个单词之间的字符串

我正在使用下面的代码行下载网页 WebRequest request WebRequest Create strURL WebResponse response request GetResponse Stream data respons

如何删除两个单词之间的字符串

如何删除两个单词之间的字符串 的相关文章

随机推荐

热门标签

如何删除两个单词之间的字符串的相关文章