在 JavaScript 中查找文本字符串

2024-04-24

我有一个很大的有效 JavaScript 文件 (utf-8)，我需要从中自动提取所有文本字符串。

为简单起见，该文件不包含任何注释块，仅包含有效的 ES6 JavaScript 代码。

一旦我发现发生' or "或`，我应该扫描文本块的末尾，这是我陷入困境的地方，考虑到所有可能的变化，例如"'", '"', "\'", '\"','"、``\`` 等

是否有已知的和/或可重用的算法来检测有效 ES6 JavaScript 文本块的结尾？

更新1：我的 JavaScript 文件不仅很大，而且还必须将其作为流、分块处理，因此 Regex 绝对不可用。我不想使我的问题复杂化，提到联合代码块，如果我有一个可以适用于内存中的单段代码的算法，我会自己解决这个问题。

更新2：感谢这里给出的许多建议，我最初得到了这个工作，但后来由于正则表达式，我再次陷入困境。

破坏迄今为止建议的任何文本检测技术的正则表达式示例：

/'/
/"/
/\`/

仔细研究这个问题后，阅读以下内容：JavaScript 如何检测正则表达式？ https://stackoverflow.com/questions/8334168/how-does-javascript-detect-regular-expressions，恐怕在 JavaScript 中检测正则表达式是一个全新的球赛，值得一个单独的问题，否则它会变得太复杂。但如果有人能在这个问题上为我指出正确的方向，我非常感激......

更新3：经过大量研究后，我遗憾地发现我无法想出一种适用于我的情况的算法，因为正则表达式的存在使任务比最初想象的更加复杂。根据以下情况：解析 Javascript 时，什么决定了斜杠的含义？ https://stackoverflow.com/questions/5519596/when-parsing-javascript-what-determines-the-meaning-of-a-slash确定 JavaScript 中正则表达式的开头和结尾是最复杂、最复杂的任务之一。没有它我们就无法弄清楚符号何时'、 '"' 和 ` 正在打开文本块或者它们是否位于正则表达式内。

解析 JavaScript 的唯一方法是使用 JavaScript 解析器。即使您能够使用正则表达式，最终它们也不足以完成您在这里尝试做的事情。

您可以使用非常易于使用的几个现有解析器之一，也可以编写自己的解析器，进行简化以专注于字符串提取问题。我很难想象您想编写自己的解析器，即使是简化的解析器。您将花费比您想象的更多的时间来编写和维护它。

例如，现有的解析器将毫不费力地处理如下内容。

`foo${"bar"+`baz`}`

解析器使用的明显候选者是 esprima 和 babel。

顺便问一下，提取这些字符串后您打算如何处理它们？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 JavaScript 中查找文本字符串的相关文章

如何从图书馆创建承诺

我对此感到困惑因为到目前为止我发现的每个教程都假设我可以编辑库代码或者库只有回调或回调作为最后一个参数我正在使用的库的每个功能都设置为function successCallBack result FailCallBack error
使用Puppeteer拦截请求时如何获取原始编码响应大小？

我使用此代码来记录在 Chrome 中加载页面时编码的响应大小 const puppeteer require puppeteer async function const browser await puppeteer launch co
Nodejs中的模拟电子邮件功能

我已经构建了一个邮件程序功能并试图加强覆盖范围事实证明尝试测试它的某些部分很棘手特别是这个 mailer smtpTransport sendMail var nodemailer require nodemailer var ma
onClick 在 p 标签上无法正常工作

我想为每个绑定一个点击事件 p 但它似乎不能正常工作当我运行脚本时我立即收到三个警报我只想在单击三个中的任何一个时获得它们 p p s 谁能告诉我我做错了什么编辑抱歉这就是它的样子 HTML 应该是这样的 p p class s
锁定 contenteditable="true" div 中的元素

我有一个用于用户输入的 contenteditable div 当单击按钮时它会显示替换某些单词的选项首先它删除所有 html 并创建可以替换单词的 span 元素这些词的标记不同我面临一些问题当直接在跨度之前或之后单击并键入文
Google Cloud Platform：将上传的 MP4 文件转换为 HLS 文件

我正在构建一个平台允许用户将一些视频文件 20 40 秒从手机上传到服务器所有这些上传目前都运行良好文件通过nodejs云功能存储在谷歌存储桶中现在我想创建一个 gcp 转码器作业它将上传的 mp4 视频文件转换为 hls 视频
AngularJS ng-重复重新渲染

我正在使用 AngularJS 构建一个简单的应用程序应用程序向服务器发出异步 AJAX 调用服务器返回一个如下所示的数组 paragraphs content content one content cnt two content r
打开 Chrome 扩展程序时出现 Service Worker TypeError

当我打开 WAVE Web 可访问性评估工具扩展时我的服务工作人员在 Chrome 中抛出此错误未捕获承诺中类型错误请求方案 chrome extension 是不支持的在 sw js 52 匿名 sw js 52 Prom
如何最高效地更新MongoDB中的大量文档？

我想要最有效地更新大量 gt 100 000 文档我的第一个天真的方法是在 JS 级别上进行编写脚本首先获取 ids 然后循环 ids 并通过 id 调用更新完整文档或 set 补丁我遇到了内存问题还将数据分成了最大块 500
JavaScript：发送 POST，重定向到响应

我有一个带有 onclick 的图像当单击事件触发时我想发送 HTTP POST 并将 window location 重定向到 POST 的响应我怎样才能做到这一点只需将按钮绑定到表单元素的提交方法重定向就会自然发生
使用正则表达式在图像标签周围添加链接

我想使用 preg replace 在图像标签周围添加链接 Before img href src alt After a href img href src alt a 我将非常感谢任何帮助非常感谢这有帮助吗 str img href
Jade 模板引擎中的 IE 条件语句

如何将以下 IE 条件语句转换为 JADE 语言我已尝试以下操作但它不起作用 if IE 8 html lang en class ie8 if IE 9 html lang en class ie9 if IE html lang e
不能需要本地 CoffeeScript 模块

我正在运行 Node js 0 10 21 我尝试了 CoffeeScript 1 6 3 并掌握了有和没有的情况require coffee script extensions 当然将这两个文件编译为 JavaScript 并直接在 N
javascript 中的独立括号[重复]

这个问题在这里已经有答案了可能的重复 JavaScript 为什么使用匿名函数包装器 https stackoverflow com questions 1643321 javascript why the anonymous funct
JavaScript 使用多少位来表示数字？

JavaScript 使用多少位来表示数字一般JS实现使用64位双精度浮点数对 32 位整数执行按位运算
Object.assign 方法不绑定“this”

我正在尝试绑定this变量到一个新对象 function Parent sub component constructors this components node function this name jordan subcompone
Redux Spread 运算符与 Map

我有一个数组中的对象状态在我的 ReduxReducer 中 const initialState items id 1 dish General Chicken price 12 1 quantity 0 id 2 dish Chick
将 JS 文件导入 Typescript

我正在考虑转向 Typescript 目前正在考虑慢慢地如果可能的话逐个文件地执行此操作现在我目前拥有的系统是用 Webpack 构建的我想继续这个来构建我的整个包我有一个用于定义的 d ts 文件但我需要继续导入当前引发错误的
当存在多个字段分隔符时使用 AWK 忽略字段内的逗号

我想像下面这样解析 CSV 记录awk or gawk 这些字段以逗号分隔但最后一个字段 6 很特殊因为它确实由子字段组成这些子字段由作为字段分隔符或者准确地说分隔这本身不是问题我可以使用awk F 设置替代字段分隔符但
jQuery UI .buttonset() 太慢

我的 HTML 页面上有几千个按钮运行需要10多秒 buttonset buttonset 文件准备好有没有更快的方法来做到这一点或者是我以某种方式限制按钮数量的唯一解决方案创建buttonset在第一次显示之前按需进行我刚刚测试

随机推荐

在 Internet Explorer 中重定向时保留 URL 片段

我目前面临单页应用程序中 URL 片段的挑战登录时用户将通过 Struts 重定向到包含 URL 片段哈希锚点部分的 url
在不同长度的数组中查找相同的日期时间

考虑以下儒略日期数组 Jday1 datenum 2011 01 01 00 00 yyyy mm dd HH MM 60 60 24 datenum 2011 12 31 23 00 yyyy mm dd HH MM Jday2 date
如何平移 UIImageView 内的图像？

我有一个UIImageView显示比实际图像更宽和更高的图像UIImageView是我想使用动画在视图中平移图像以便平移漂亮且平滑在我看来我应该能够调整bounds origin of the UIImageView 并且图像应该移
如何在ubuntu 12.0中更新openerp 7中的新模块？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案完成在 ubuntu 12 0 中更新 openerp 7 中的新模块的所有可能方法还有其他方法可以更新 ubuntu 12 0 中
如何在flutter中解析json？

我想创建一个新闻应用程序并且我使用 newsapi org 作为来源我正在尝试获取来自 Http 库的 JSON 数据我在下面提供了完整的代码它没有给我任何错误但没有加载数据当我打印数据时它打印一切正常但我无法显示它我不知
如何在 QML 中使用 Font Awesome

有谁知道如何在 QML 中使用 Font Awesome 吗我找不到任何文档或任何信息如何在 QML 中使用 Font Awesome 我喜欢做的是使用fontello http fontello com 创建最小的图标集而不是从 Fo
在 UIWebView 中更改用户代理

我的业务需要能够为嵌入式 UIWebView 自定义 UserAgent 例如如果用户使用应用程序的一个版本与另一个版本我希望服务器做出不同的响应是否可以像 Windows 应用程序中的嵌入式 IE 浏览器那样在现有 UIWebVie
查找多模块 Maven Reactor 项目的根目录

有没有一种简单的方法可以找到多模块 Maven 项目的根例如 Gradle 的rootDir 背景我想使用 maven dependency plugin 将多模块项目的所有子模块中的工件复制到相对于整个项目的根目录的目录也就是说我
如何在 XAML 上设置 ResourceDictionary FontSize？

如果这会是一件混乱的事情我深表歉意我对 Xamarin 还很陌生目前我正在尝试将此资源字典代码转换为 XAML Current Resources new ResourceDictionary FontResources Defaul
设计 EAP-TLS 客户端问候消息

我正在尝试设计第一个启动 EAP TLS 握手的数据包这是我的数据包目前的样子我通过用相应的信息手动填充 C 中的缓冲区来设计 EAP 部分我使用 OpenSSL 导出的 TLS 部分如图所示在这个问题中 https stackove
如何在 MS Access 表单上动态保持控件居中（相对位置）？

我正在使用 Access 2013 并且有许多控件列表框按钮等当调整表单大小时我希望它们作为一个组在表单上保持居中锚定无法实现我正在寻找的目标因为我不想将控件锁定到顶部底部左侧右侧我希望他们留在中心只需使用这样的代码m
在 C++ 中清除控制台

我正在尝试清除 C 中的控制台我知道打印多个换行符是一种不好的做法因为它可能很慢并且完全清除控制台窗口并不总是可靠的但我研究了多种选项除了发现几乎没有其他解决方案system cls 这是一个更糟糕的选择本质上我用过这条线co
输入：页面加载时应用了无效的 css 规则

在 Firefox 或 Chrome 中查看这两个 fiddle 在this http jsfiddle net hezgkxoh 2 一我只有一个简单的表格required属性和一个submit按钮当框为空时按提交会导致其样式为i
参数化方法调用什么时候有用？

Java 方法调用可以像下面的代码一样进行参数化 class Test
典型的按键持续时间是多少

我正在固件项目中做一些关于按键处理的工作我一直在谷歌上搜索试图找出按键的典型持续时间是多少特别是快速打字员的最短持续时间令人惊讶的是我在任何地方都找不到任何相关数据最近有一些关于按键时序的研究已经发表这里有两个 http www
如何在 .NET 中可靠地获取图像尺寸而不加载图像？

我知道如何获取图像的大小 x y Image FromFile cat jpg Size 但这需要从内存中加载图像当我在 Windows 资源管理器中查看图像时它会显示尺寸我如何访问该大小它对所有图像都可靠吗 Windows 资源管
什么日历似乎是从 1800 年 12 月 28 日开始计算天数的？

我的任务是从一些奇怪的旧系统中读取一些数据该系统包含许多日期但它们的格式都很奇怪它们是整数范围约为55 000 to 80 000 我确定有两个日期 58 112 equals February 5 1960 originally
为什么我不能在 python 的 for 循环中重新分配变量？ [复制]

这个问题在这里已经有答案了今天我发现一个有趣的事实我无法在 for 循环中重新分配变量但为什么呢这是我的代码 gt gt gt my list 1 2 3 4 5 gt gt gt for i in my list gt gt g
WCF - 如何在 JSON 中序列化和反序列化？

我在 WCF 中编写了几个类数据契约和服务契约并且尝试在 JSON 中进行序列化和反序列化如果我需要以下 JSON 结构我将如何创建 DataContract s response locations location id 12
在 JavaScript 中查找文本字符串

我有一个很大的有效 JavaScript 文件 utf 8 我需要从中自动提取所有文本字符串为简单起见该文件不包含任何注释块仅包含有效的 ES6 JavaScript 代码一旦我发现发生 or 或我应该扫描文本块的末尾这是我陷入

在 JavaScript 中查找文本字符串

在 JavaScript 中查找文本字符串 的相关文章

随机推荐

热门标签

在 JavaScript 中查找文本字符串的相关文章