用于从列表中的根域中删除子域的正则表达式 - Notepad++ 或 Gvim

2024-02-14

我有一个存储在 .txt 文件中的 URL 列表（我使用的是 Windows 7）。

URL 的格式是这样的：

somesite1.com
somesite2.com
somesite3.com
sub1.somesite3.com
sub2.somesite3.com
sub3.somesite3.com
sub1.somesite3.net
sub1.somesite1.org

在notepad++中，有一个选项可以使用“用正则表达式查找替换”，并且我相当确定gvim允许用户使用正则表达式（尽管我不完全确定如何在Gvim中使用它们）。

无论如何，我不知道要在查找和替换框中放入什么，以便它可以遍历文件的内容并只留下根域。如果操作正确，上面的示例列表将变成这样：

somesite1.com
somesite2.com
somesite3.com
somesite3.com
somesite3.com
somesite3.com
somesite3.net
somesite1.org

有人可以帮我吗？

对于 Vim 来说有几种方法（尾部斜杠也是可选的）：

:%s/^.\+\.\ze[^.]\+\.[^.]\+$//
:%s/^.\+\.\([^.]\+\.[^.]\+\)$/\1/

也可以看看:help /\ze etc. \ze and \zs是 Vim 特定的并且非常有用。在 Vim 和 PCRE 中，还有有用的前向断言和后向断言。

我相信 Notepad++ 使用 PCRE；寻找^.+\.([^.]+\.[^.]+)$并将其替换为\1应该可以（但我不使用 Notepad++）。

请注意，这不适用于使用第三级注册的国家/地区代码顶级域名 -example.com.au会变成com.au。还有一些国家使用第二-or某些规则下的第三级注册...如果您关心这些情况，您将需要更多规则，并且完整的解析器将比正则表达式更简洁（尽管与往常一样，正则表达式是可能的）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

Vim

Notepad

用于从列表中的根域中删除子域的正则表达式 - Notepad++ 或 Gvim 的相关文章

选择前 n 个字符相等的行（MySQL）

我有一张带有玩家句柄的桌子如下所示 1 N Laka 2 N James 3 nor Brian 4 nor John 5 Player 2 6 Spectator 7 N Joe 从那里我想选择第一个 n 字符匹配的所有玩家但我不知道
Grep 和 Python

我需要一种通过 Unix 命令行中的正则表达式使用 grep 搜索文件的方法例如当我在命令行中输入 python pythonfile py RE file to be searched 我需要正则表达式 RE 在文件中搜索并打印出匹配
有没有办法匹配任意 Unicode 字母字符？

我有一些文档经过 OCR 从 PDF 转换为 HTML 因此他们最终会出现很多随机的 unicode 标点符号而转换器会搞砸即省略号等他们还正确地有一堆非英语但仍然是字母字符如和俄语字符等有没有办法制作一个匹配任何 unico
在 Javascript 中获取第一个数字出现后的子字符串

我正在尝试提取第一个数字之后并包括的字符 ABC 123SD gt 123SD 123 gt 123 123SD gt 123SD ABC gt 我当前的解决方案如下 var string1 ABC 123SD var firstDig
C# 开发人员有什么理由应该学习 Emacs/Vim 吗？

我在一家纯粹的 Microsoft 商店担任 C 开发人员最近我开始在工作之余的空闲时间使用 Gas 和 Linux 自学汇编我喜欢摆弄 Linux 尽管我对它还很陌生我一直听说我应该学习 VIM 或 Emacs 但事实是我绝对不
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
Pure Bash 替换捕获组

我有这个示例字符串 test string 13A6 该字符数字可以是从 0 到 9 以及从 A 到 F 我想要这个输出 1 3 A 6 我有这个工作 result echo test string sed s g 我想在没有 sed 的
正则表达式：无法找出与单个事件匹配的表达式，并且仅匹配包含特定单词的行

我正在尝试使用 Sublime Text 作为编辑器清理并合并一些旧的日历文件 x ics 打开文件会得到一个长文件如下所示我想删除即替换为任何内容文件中在摘要中提及生日的所有条目 VEVENT 并保留所有其他条目因此我使用正则表
删除字符串末尾的句点和数字

如何删除尾随句点后面紧跟一个数字长度为一位或两位数字例子 z lt c awe p 56 red 45 ted 5 you 88 tom 我只想删除 45和 5 你只需要一个简单的正则表达式 z new gsub 0 9 z 一些评论
Alt 键快捷键在使用 Vim 的 gnome 终端上不起作用

我在 gnome 终端上运行 Vim 但 alt 键映射不起作用例如 imap
PHP 正则表达式匹配字符串的最后一次出现

我的字符串是 text1 A373R12345 我想找到该字符串最后出现的非数字数字所以我使用这个正则表达式 0 9 然后我得到这个结果 1 A373 2 12345 但我的预期结果是 1 A373R 它有 R 2 12345 另一个例子
正则表达式，如果模式在引号中则忽略模式

编写一个非常简单的脚本解析器作为学校项目的一部分虽然这不是必需的但我很好奇是否可以仅使用正则表达式来完成语法类似于 ASP 其中脚本以结尾它只支持一个命令 pr 与echo或Response Write相同现在我正在使用这个正则
MySQL正则表达式：如何将字符串中的数字与\d匹配？

我有一个专栏release date它以字符串格式存储日期不是 DATETIME 格式因为它们有时可以是任何其他字符串文字我想根据给定的月份和年份查找任意日期的所有记录尝试遵循但对我不起作用 gt Post find all con
如何使用正则表达式在 Java 中检查确切的电话号码

你好我是正则表达式的新手我不知道我在做什么这就是我寻求帮助的原因我有以下电话号码 359878123456 我需要检查该电话号码是否符合条件 359 是准确的扩展名第二个 2 个数字是操作员号码和以下 3 个数字之一 87 88
使用基于 DFA（线性时间）正则表达式捕获组：可能吗？

是否可以使用基于 DFA 的正则表达式实现捕获组同时保持相对于输入长度的线性时间复杂度直觉上我认为不是因为子集构造过程不知道它可能落在哪个捕获组内但这是我第一次意识到这可能是一个潜在的问题所以我不知道是否可以使用基于 DFA 的
如何通过保持目录结构完整来同步路径中匹配模式的文件？

我想将所有文件从服务器 A 复制到服务器 B 这些文件在不同级别的文件系统层次结构中具有相同的父目录名称例如 var lib data sub1 sub2 commonname filetobecopied foo var lib dat
使用正则表达式模式查找 -name 并使用 cp 替换文件名

目前我正在使用该命令cron复制 data从源到目标路径 find source path name data exec cp target path 源码结构为 source path category1 001 data source
[A-z0-9]+ 正则表达式匹配方括号[重复]

这个问题在这里已经有答案了我正在努力解决以下正则表达式 A z0 9 如果针对此字符串进行测试 a919238 a asd 它返回a919238 包括方括号我尝试输入我在 regex101 上的测试用例 https www regex1
检测两个正则表达式是否可能匹配相同的字符串[重复]

这个问题在这里已经有答案了给定两个正则表达式是否可以检测是否存在与它们都匹配的可能字符串例如给定正则表达式A and 我可以看到那个字符串 A 匹配他们两个这是一个简单的案例我的问题是针对更广泛的情况给定任何两个有效的正则表达
如何通过php获取网页的Open Graph协议？

PHP 有一个简单的命令来获取网页的元标记 get meta tags 但这仅适用于具有名称属性的元标记然而开放图谱协议如今变得越来越流行从网页获取 opg 值的最简单方法是什么例如我看到的基本方法是通过 cURL 获取页面并使用

随机推荐

获取php中两个日期之间的周数

我想获取给定两个日期的周数即从 2012 01 01 到 2012 12 31 周数应该恰好落在上面指定的范围内您可以为此提供建议吗像这样的东西应该可以正常工作
如何使用 VisualSVN Server 将现有 Visual Studio 解决方案置于源代码管理之下？

我有一个现有的 Visual Studio 2013 解决方案我想使用 VisualSVN Server 将其置于源代码控制之下我安装了 VisualSVN Server 并创建了一个新的空白存储库他们的入门 https www vi
MuPdf 内存不足

您好我在项目中使用 MuPdf 库来查看文档问题是当您在平板电脑上的 11 英寸 Activity 中打开 3 7 个文档时我会出现内存溢出当您加载新文档时对先前文档的所有引用都会被销毁但内存中文档的图像不会被删除对象在 1
如何在软键盘顶部的建议中添加单词

有什么办法可以在软键盘的建议中添加单词吗对于特定的 Edittext 字段我想将名称列表添加到 android 2 0 中软键盘顶部弹出的建议中有谁知道这是否可能 Here http android git kernel org p
侧边栏增强插件已安装但不起作用

系统配置 Sublime Text3 内部版本 3065 Ubuntu 14 04 我想在浏览器中添加预览发现侧边栏增强功能 Be https github com titoBouzout SideBarEnhancements是最好的插
SQL Server DATE 作为字符串检索到 pandas 中

当我将日期变量从 SQL Server 拉入 Python Pandas 时它作为对象出现我已经安装并尝试了多个驱动程序代码中显示了尝试过的注释驱动程序每次都有相同的结果 import pandas as pd import
如何将位图纹理的每个像素渲染到 macOS 上屏幕的每个本机物理像素？

由于现代 macOS 设备默认选择使用缩放后的 HiDPI 分辨率位图图像在屏幕上会变得模糊有没有办法将位图逐像素渲染到显示屏的真实本机物理像素任何 CoreGraphics OpenGL 或 Metal API 都可以在不改变屏幕显
更改位图的色调，同时保留整体亮度

我正在尝试编写一个函数让我可以对位图进行红移或蓝移同时保留图像的整体亮度基本上完全红移的位图将具有与原始亮度相同的亮度但完全呈红色即所有像素的 G 和 B 值都相等蓝色着色相同但 R 和 G 相等频谱偏移的程度需要在 0
绝对定位和CSS粘性页脚

这是我的问题我使用的布局具有粘性页脚使用 cssstickyfooter com 方法在我的容器 div 中我有一个内容 div 其中包含其他四个 div 像这样 div class container div class cont
何时使用.NET BufferedStream 类？

The MSDN 网站 http msdn microsoft com en us library system io bufferedstream aspx states 缓冲区是内存中的一个字节块用于缓存数据从而减少拨打运营商电话
iBeacon 广告 ID 是否唯一？

我们正在讨论在跨国多个地点使用 iBeaons 进行大规模部署方案有人提出的问题是 iBeacons 宣传其存在的 ID 是否是唯一的因为我们的客户希望真正确保应用程序仅响应特定的 iBeacons 而不响应冒充相同 ID 的其他内容
反转字符串中每个单词中的字母

我有一个包含空格分隔单词的字符串我想颠倒每个单词中的字母而不颠倒单词的顺序我想my string成为ym gnirts 这应该有效 words explode string words array map strrev words ec
在大型数据集上改变窗口大小的滚动平均值

我想计算向量的滚动平均值其中窗口随着向量中的每个条目而增长基本上我想要所有元素的平均值i th i 1 th i 2 th 依此类推为了使它更清楚我将提供一个示例和一个适用于较小数据集但不能很好扩展的解决方案 library zo
来自 application.html.erb 的 Rails 渲染实例变量

我正在关注 Agile Web Development with Rails 4 这本书我对渲染的部分感到有点困惑问题的简单版本是在 application html erb 文件中它说 render cart 这很令人困惑因为我认
Redis 概念：在内存中还是在数据库中？

基于http redis io topics faq http redis io topics faq Redis 是一个内存中但持久在磁盘上的数据库那么我可以知道redis将键值保存在内存中还是磁盘中或两者 Redis写入值时同时
影子根 getElementsByClassName

我正在使用 LitElement 创建自定义 Web 组件我对此相当陌生决定尝试制作图像幻灯片我用了W3Schools 幻灯片作为参考 https www w3schools com howto howto js slideshow
拟合 Keras 顺序模型给出 ValueError: Failed to conversion a NumPy array to a Tensor (Unsupported object type numpy.ndarray)

我有以下列表数组每部电影的演员 partial x train actors array list b victor mclaglen b jon hall b frances farmer b olympe bradna b gene
从多个线程修改休眠实体

我在理解线程安全的细节时遇到问题Hibernate 我知道Hibernate Sessions它们本身并不是线程安全的因此我不会从多个线程访问它们但是我找不到任何有关 Hibernate 实体的线程安全性的信息我可以在多个线程中修改
使用@PreAuthorize的多个角色

检查多个角色是否具有方法级别访问权限我已经使用 PreAuthorize注释来检查角色 PreAuthorize hasRole AuthoritiesConstants USER 如何使用 PreAuthorize注解检查多个角色 Pr
用于从列表中的根域中删除子域的正则表达式 - Notepad++ 或 Gvim

我有一个存储在 txt 文件中的 URL 列表我使用的是 Windows 7 URL 的格式是这样的 somesite1 com somesite2 com somesite3 com sub1 somesite3 com sub2 so

用于从列表中的根域中删除子域的正则表达式 - Notepad++ 或 Gvim

用于从列表中的根域中删除子域的正则表达式 - Notepad++ 或 Gvim 的相关文章

随机推荐

热门标签