查找字符出现 N 次的行

2024-02-24

我有一个 txt 文件，我试图将其作为平面文件导入 SQL2008，如下所示：

“123456”,”some text”
“543210”,”some more text”
“111223”,”other text”
etc…

该文件有超过 300.000 行，文本很大（通常为 200-500 个字符），因此手动扫描文件非常耗时且容易出错。其他类似（甚至更复杂的文件）已成功导入。

这个问题的问题是，“某些行”在文本中包含引号...（这来自旧的 SuperBase DB 的导出，该数据库不允许您指定文本量词，除了清除它并尝试导入它）。

所以“有问题的”行看起来像这样：

“123456”,”this text “contains” a quote”
“543210”,”And the “above” text is bad”
etc…

你可以在这里看到问题。

现在，如果我可以使用可以使用正则表达式的文本编辑器执行搜索，300.000 并不算太多，我会手动删除每行中的引号。问题不在于违规行的数量，而在于无法通过简单的搜索找到它们。我确信少于 500 个，但是将它们分散在一个 300.000 行的 txt 文件中，你就知道我的意思了。

基于此，我可以用来识别这些行的最佳正则表达式是什么？

我的第一个想法是：告诉我哪个lines包含more than 4引号（”）。

但我想不出任何办法（除了基础知识之外，我不擅长正则表达式）。

这个图案^("[^"]+){4,}将匹配“包含超过 4 个引号的行"

你可以尝试替换4 with 5或更多，具体取决于您的数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

查找字符出现 N 次的行的相关文章

PHP 中的 Preg_replace

我想替换中包含的字符串中的内容content 它是多行等 preg replace 函数应该删除整个 com 没有垫子蒙特尝试这个 result preg replace s replacement content subject
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
ruby 正则表达式匹配模式的多次出现

我正在寻找构建一个 ruby 正则表达式来匹配模式的多次出现并将它们返回到数组中模式很简单即两个左括号一个或多个字符后跟两个右括号这就是我所做的 str Some random text lead first name and
Perl：HTTP::微小删除留下损坏的锚标记

我编写了一个脚本该脚本收集从数据库读取的缓冲区内的所有 URL 检查该页面是否仍然存在并使用 HTTP Tiny 从缓冲区中删除 URL 如果该 URL 无法访问或返回无效问题是 HTTP Tiny 删除左锚标记例如此处无效的文本
如何从字符串中删除所有数字？

我想删除字符串 0 9 中的所有数字我写了这段有效的代码 words preg replace 0 words remove numbers words preg replace 1 words remove numbers words
为什么这些非捕获正则表达式组不能正常工作？

所以我花了很多时间在另一个堆栈溢出问题上同样的问题又出现在上一个问题上非捕获组并没有像我期望的那样工作至少我是这么认为的这是一个愚蠢的例子类似于其他人的 CSS 测试字符串这是我的正则表达式 rgb S 这是测试字符串 1px
如何在 CakePHP 中“验证”人名？

我有一个 PHP 脚本应该检查有效的人名但最近破解了带有空格的名称因此我们向验证器添加了空格除了这样做之外有没有办法向 CakePHP 的验证器添加黑名单以阻止所有无效字符而不是允许有效字符注意我通常知道如何
MySQL正则表达式：如何将字符串中的数字与\d匹配？

我有一个专栏release date它以字符串格式存储日期不是 DATETIME 格式因为它们有时可以是任何其他字符串文字我想根据给定的月份和年份查找任意日期的所有记录尝试遵循但对我不起作用 gt Post find all con
从字体到跨度（大小和颜色）和背面的正则表达式（VB.NET）

我正在寻找一个正则表达式可以将我的字体标签仅具有大小和颜色属性转换为具有相关内联CSS的span标签如果有帮助的话这将在 VB NET 中完成我还需要一个正则表达式来实现相反的效果下面详细说明的是我正在寻找的转换示例 font
Python正则表达式非贪婪匹配

这个问题来自用Python自动化无聊的事情一书 atRegex1 re compile r w 1 2 at atRegex2 re compile r w 1 2 at atRegex1 findall The cat in the
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
Java正则表达式：为什么数字[0-9]、逗号等不是unicode？

class Test public static void main String args String regex p L System out println 0 matches regex 上面的代码打印 false 但我期待 tr
如何使用正则表达式将字符串分成相同字符的组？

我有一个这样的字符串 var string AAAAAAABBBCCCCCCDD 并喜欢将字符串分割成这种格式的数组 same characters gt same group 使用正则表达式 Array AAAAAAA BBB CCCCC
vim 中的正则表达式查找和替换：向数字添加 .0

我有一个如下所示的文件 1 1 0 1 6 1 0 2 8 1 0 3 10 1 0 4 12 1 0 6 如何为所有数字添加 0 后面的数字除外我认为用正则表达式来做到这一点应该不会太难但是我的正则表达式知识太生疏了使用 VIM s
使用FFMpeg确定视频类型，然后进行转换？

我正在尝试以编程方式确定文件的真实类型看来我必须使用 FFMPeg 来实现这一点我想确定上传的文件实际上是否是 MP4 或 FLV 对于 Flash 视频或 WebM 对于 HTML5 我知道 FFMPeg 中的 i 运算符但我不知
使用正则表达式查找并替换（批处理.BAT）

我想在多个文本文件中进行查找替换如何使用 BAT 实现自动化我还需要正则表达式示例查找
防止字符串中出现西里尔文/希腊文/中文 - C# 4.0

我们有一个支持希腊语西里尔语中文字符的系统使用 ASP NET C 4 0 但第三方系统似乎无法正常工作为了避免为此第三方系统输入数据时出现问题我想将文本字段限制为仅接受英语或重音字符但返回其他字符的验证错误我怎样才能做到这一
除括号之间的内容外，所有内容均小写

考虑以下字符串 LoReM FOO IPSUM dolor BAR Samet fooBar 我正在寻找一种方法来小写所有内容除了 brackets 之间的内容应该被忽略所以期望的输出是 lorem FOO ipsum dolor BA
Perl regex：如何知道匹配数

我循环遍历一系列正则表达式并将其与文件中的行进行匹配如下所示 for my regex regexs ref LINE for rawfile regex do do something here next LINE 有没有办法让我知道我
当找到匹配时使用 sed 替换行首

我有一个 Java 文件我想注释包含匹配的任何代码行 myvar 我认为 sed 应该在这里帮助我 sed s myVar not sure what to put here g MyFile java 我不知道要输入什么 not sur

随机推荐

使用未声明的标识符 self [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我创建了一个名为 Data pars
ASP.Net 1.1 视图状态安全

在 ASP Net 1 1 中最终用户是否可以在将视图数据发送回服务器之前更改视图数据例如使其看起来像是在不存在的下拉列表中选择了一个项目我尝试使用 firebug 操作下拉列表中的值但服务器似乎忽略了这一点我推测是因为视图状态表
BigQuery Python 客户端库中查询结果的差异

我想知道 query 的返回值和 query result 之间的区别在 BigQuery Python 客户端库中 bigquery client bigquery Client myQuery SELECT FROM mytable
将columnNames动态传递给cassandraTable().select()

我在运行时读取文件的查询并在 SPark Cassandra 环境中执行它我正在执行 sparkContext cassandraTable keyspaceName colFamilyName select col1 col2 col3
如何关闭 PDO 句柄

我正在使用 PDO 访问 PHP 中的两个 SQLite 3 数据库我想在查询期间通过重命名数据库文件来切换数据库文件但在文件打开时我无法执行此操作因为它会给出文件正在被另一个进程使用的错误我尝试关闭持久连接并将句柄设置为空但都不
从命令行模拟执行二进制文件？

有没有办法从命令行在 Simics 模拟下执行简单的 Linux 二进制文件就像是 simics some flags a out Simics 现在没有开箱即用的应用程序模式或系统调用模式根据需要可以将有效负载编译为 ELF 文件
在c#中的TREEVIEW中添加复选框

我想添加复选框到我的应用程序中树视图中某个父节点的子节点我应该如何添加它 TreeView拥有一个名为CheckBoxes 如果设置为true 它显示所有子节点的复选框
可变长度表中的内存分配

假设我在中定义了以下可变长度表WORKING STORAGE 01 SOAP RECORD 05 SOAP INPUT PIC X 8 VALUE SPACES 05 SOAP STATUS PIC 9 VALUE ZERO 05 SOAP
将 Spongycastle 与 Proguard 一起使用

我一直在努力使用 Proguard 来让 Spongycastle 正常工作大多数时候问题出现在我导出签名的 APK 时要么出现错误要么应用程序在启动前崩溃因此我设法收集信息以获得有效的混淆器配置 optimizationpas
如何通过 Emacs 23.1 内置集成设置 SVN 密码？

我正在 CentOS 6 2 上做一个项目使用发行版提供的 Emacs 23 1 1 和使用 svnserver 的 subversion 我无法在任何地方找到如何设置存储库访问密码关于此还有另一个问题 SVN for Emacs 如何
View 中对 ViewModel（即其 DataContext）的引用是否对 MVVM 模式有害？

让我们说一个ViewModel发布一个Event and a View它正在使用该虚拟机作为其DataContext订阅该Event通过强制转换来获取对 VM 的引用DataContext到虚拟机实例 vm DataContext as M
pandas 堆叠数据框

我有一个数据框看起来像 sensorId 1 2 3 9b f3 55 19 00 4b 12 00 1 7 8 bf f3 55 19 00 4b 12 00 6 5 9 da f3 55 19 00 4b 12 00 1 1 2 我想
Neo4j 数据库大小增长

我使用 neo4j 3 0 1 社区并且我有几 GB 的数据这些数据很快就会过时比如每天 2 3 次我必须先创建新数据然后删除旧数据因此在任何时间点都有一些数据可用问题是 Neo4j 不使用已删除节点关系中的空间我使用 M
matplotlib 中的十六进制 X 轴

是否可以以某种方式在 matplotlib 中以十六进制表示法打印 X 轴上的值在我的图中 X 轴代表内存地址您可以在轴上设置格式化程序例如FormatStrFormatter http matplotlib org api tick
指数超出范围。必须为非负数且小于集合的大小

我在跟踪我的数据密钥时收到此错误我不确定为什么我的数据密钥索引超出范围这是我的代码 protected void GridView1 RowDataBound object sender GridViewRowEventArgs e v
Bootstrap 轮播中的 Highcharts 内容不会根据轮播自动调整大小

我有一个高图表作为引导程序轮播中第二个项目的内容 div 内容如果它位于第一个轮播幻灯片项目上它的大小调整得很好但是如果高图表位于第二张幻灯片上则滑入时不会调整大小如果不是第一个可见的轮播幻灯片项目如何自动调整轮播内容的大
window.openDatabase() 和 window.sqlitePlugin.openDatabase() 函数之间的区别？

使用 Cordova 版本 3 x 和 Android 版本 2 x 至 4 x 我想知道我的理解是否正确所有 Android 设备默认都有一个用于创建 sqlite 数据库的 sqlite 程序接口上述两个数据库函数调用是否在设备
如何使用 Android Google 地图应用程序的双击标记打开新活动？

我正在尝试使用onMarkerClick 它允许用户在单击标记时查看新的活动窗口如果想要更改行为以便打开新活动但仅当我双击标记时我该怎么做这是我的代码 public class MapsActivity extends Fragm
WebDriverWait 中的逻辑运算符预期条件

我正在使用 Python Selenium 提交表单然后让 Web 驱动程序通过使用类 id 的预期条件等待下一页加载我的问题是有两个页面可以显示但它们不共享原始页面中不存在的唯一元素我可以找到一页有一个独特的类别是mobile
查找字符出现 N 次的行

我有一个 txt 文件我试图将其作为平面文件导入 SQL2008 如下所示 123456 some text 543210 some more text 111223 other text etc 该文件有超过 300 000 行文本很

查找字符出现 N 次的行

查找字符出现 N 次的行 的相关文章

随机推荐

热门标签

查找字符出现 N 次的行的相关文章