正则表达式：使用 re.sub 将连字符替换为破折号

2024-04-11

我正在使用一个小函数来循环文件，以便任何连字符-被破折号取代–（替代键+0150）。

我使用的函数为相关问题的解决方案添加了一些正则表达式风格（如何自动替换多个文件的文本内容中的字符？ https://stackoverflow.com/questions/44996829/how-to-replace-a-character-inside-the-text-content-of-many-files-automatically)

def mychanger(fileName):
  with open(fileName,'r') as file:
    str = file.read()
    str = str.decode("utf-8")
    str = re.sub(r"[^{]{1,4}(-)","–", str).encode("utf-8")
  with open(fileName,'wb') as file:
    file.write(str)

我使用了正则表达式[^{]{1,4}(-)因为搜索实际上是在乳胶回归表上执行的，我只想替换数字周围出现的连字符。

需要明确的是：我想替换所有连字符EXCEPT如果我们有真正的乳胶代码，例如\cmidrule(lr){2-4}.

在这种情况下有一个{接近（最多 3-4 个字符）hyphen和它的左边。当然，这个连字符不应该更改为破折号，否则乳胶代码将被破坏。
我认为排除的左侧部分条件对于在正则表达式中编写正确的异常很重要。事实上，在回归表中你可以有类似的东西-0.062\sym{***}（这是一个{在连字符的右边）并且在这种情况下我的确想要替换连字符。

我表中的典型行是

variable    &   -2.061\sym{***}&       4.032\sym{**}   &       1.236         \\
            &      (-2.32)         &   (-2.02)         &      (-0.14)

但是，我的正则表达式似乎不正确。例如，一个(-1.2)将被替换为–1.2，去掉括号。

这里有什么问题？谢谢！

我可以提供以下两步更换：

str = "-1 Hello \cmidrule(lr){2-4} range 1-5 other stuff a-5"
str = re.sub(r"((?:^|[^{])\d+)-(\d+[^}])","\\1$\\2", str).encode("utf-8")
str = re.sub(r"(^|[^0-9])-(\d+)","\\1$\\2", str).encode("utf-8")
print(str)

第一个替换目标是所有不属于 LaTex 形式的范围{1-9}即不包含在花括号内。第二个替换目标是所有前面带有非数字或字符串开头的数字。

Demo http://rextester.com/BQSZU45141

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

Unicode

正则表达式：使用 re.sub 将连字符替换为破折号的相关文章

使用 pandas.date_range() 生成多个日期时间，每周两个日期

我在用着pd date range start date end date freq W MON 每周一生成每周频率日期时间start date 2017 01 01 and end date 2017 12 31 这意味着每月大约生成 4
如何删除 PyCharm 中的项目？

如果我关闭一个项目然后删除该项目文件夹则在 PyCharm 重新启动后会再次创建一个空的项目文件夹只需按顺序执行以下步骤即可他们假设您当前在 PyCharm 窗口中打开了该项目单击文件 gt 关闭项目关闭项目在 PyCha
如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
PHP URL 验证

我知道有无数的线程问这个问题但我一直无法找到一个可以帮助我解决这个问题的线程我基本上试图解析大约 10 000 000 个 URL 的列表确保它们根据以下标准有效然后获取根域 URL 此列表包含您能想象到的几乎所有内容包括类似的内
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
数据框 - 平均列

我在 pandas 中有以下数据框 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我正在创建一个数据框其中包含第 1 列和第 2 列第 3 列和第 4 列等的平均值 ColumnA
如何使用 Python boto3 获取 redshift 中的列名称

我想使用 python boto3 获取 redshift 中的列名称创建Redshift集群将数据插入其中配置的机密管理器配置 SageMaker 笔记本打开Jupyter Notebook写入以下代码 import boto3
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
以类型化内存视图作为成员的结构定义

目前我正在尝试让一个具有类型化内存视图的结构能够工作例如 ctypedef struct node unsigned int inds 如果 inds 不是内存视图据我所知它可以完美地工作然而通过内存视图并使用类似的东西 def
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
在Python中读取tiff标签

我正在尝试用 Python 读取 tiff 文件的标签该文件是 RGB 的uint16每个通道的值我目前正在使用tifffile import tifffile img tifffile imread file tif 然而 img是一
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
如何在 Seaborn 中的热图轴上表达类

我使用 Seaborn 创建了一个非常简单的热图显示相似性方阵这是我使用的一行代码 sns heatmap sim mat linewidths 0 square True robust True sns plt show 这是我得到的
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
非法指令：MacOS High Sierra 上有 4 条指令

我正在尝试在 pygame 3 6 中制作一个看起来像聊天的窗口我刚刚将我的 MacBook 更新到版本 10 13 6 在我这样做之前它工作得很好但在我收到消息之后非法指令 4 Code import pygame from pyg
将时间添加到日期时间

我有一个像这样的日期字符串然后使用strptime 所以就像这样 my time datetime datetime strptime 07 05 15 m d Y 现在我想添加 23 小时 59 分钟my time 我努力了 timed
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged

随机推荐

Silex 安全提供商

我有课UserMapper
在 Angular 2 中使用 require 设置 templateUrl 时出现错误

在我的组件中我想使用 require 设置 templateUrl 如下所示 import Component from angular2 core Component selector header styleUrls app head
在Dir函数（VBA）中“ReadOnly”属性的作用是什么？似乎 vbNormal 也列出了“只读”文件

我想知道只读是做什么的 VbNormal 也返回所有 ReadOnly 文件因此 vbNormal vbReadOnly 组合似乎没有效果但我想它必须有一些功能非常感谢你的想法 Sub test x Dir C Folder vb
在pyspark中读取json文件

我是 PySpark 的新手下面是来自 kafka 的 JSON 文件格式 header platform atm version 2 0 details abc 3 def 4 abc 5 def 6 abc 7 def 8 我怎样才能
在 IntelliJ IDEA 10.5 的 Perforce 设置对话框的“客户端”字段中输入什么？

我正在尝试在 IntelliJ IDEA 10 5 2 中设置 Perforce 集成有一个名为 Client 的字段对我来说没有意义无论我在字段中输入什么内容我都会收到消息连接问题客户端未知我应该进入该领域什么您需要输入 P
添加新数据时如何保持轴不变？

我使用 matplotlib 来显示不断更新的数据每秒大约变化 10 次我正在使用 3D 散点图并且希望将轴固定在特定范围内因为数据相对于图边缘的位置很重要目前每当我添加新数据时轴都会重置为按数据缩放而不是我想要的大小当我
根据标准生成 HTML 输出

有一个很好的 HTML 输出示例标准 http hackage haskell org package criterion at http bos github com criterion http bos github com crite
JQuery datatable.net (datatable.js) - 动态更改设置

我正在使用 JQuery DataTable 我想动态更改设置理想情况下WITHOUT必须删除重新创建表有没有办法重新绑定表或者这是不可能的我提供了现场演示HERE http jsfiddle net Me7Zm 19 在我当前的示
捕获 iOS 模拟器视频以进行应用程序预览

好的我们现在可以在 App Store 上提交您的应用程序的视频预览根据 Apple 的说法我们应该使用 iOS 8 设备来实现这一点并且OSX 10 10 问题是您必须拥有所有不同的设备 4 英寸 4 7 英寸 5 5 英寸和 i
ASP.Net MVC 在编译初始加载后切换区域性

我有一个混合 ASP Net Web 表单 MVC 应用程序在其中一个 MVC 页面视图上我让它使用 ToShortDateString 和 ToLongDateString 渲染一堆日期这些在大多数情况下都可以正常工作但是在编译
清除 Spyder 中的控制台和变量的代码

尝试了很多建议清除控制台和变量在 Spyder 中使用代码而不是 CTRL L 但它们不起作用想知道任何有效的建议什么代码可用于清除 Spyder 控制台和变量 using get ipython magic reset sf 将使变量
后端和前端在不同端口上运行，后端重定向时出现 CORS 错误

我在不同的端口 8000 8001 上运行后端和前端我无法从 Express 服务器进行 res redirect 并且浏览器显示 CORS 错误访问 XMLHttpRequest at 这是MEVN Mongo Express Vue
读取所有目录中的所有文件[重复]

这个问题在这里已经有答案了我有代码可以读取单个文本文件的值但在读取所有目录中的所有文件并将所有内容放在一起时遇到困难这是我所拥有的 filename filesuffix location os path join Test file
如何使用命令行从 biml 生成 ssis 包并在服务器上部署 ssis

我致力于创建 biml 从中生成 ssis 包构建SSIS项目然后在服务器上部署ispac文件但这些所有手动步骤可以自动化吗我可以使用命令行从 biml 生成 ssis 吗除了 bidshelper 之外还有哪些命令以及在计算机
Firebase 多次更新期间出现权限被拒绝错误

我在 Firebase 上使用多个更新功能其中我创建了一个对象该对象一次更新数据库中的多个位置我已分别授予每个位置的写入权限以下是我尝试在 Firebase 上更新的内容的示例作为多次更新的一部分 alarms 298302f2
在一个窗口中绘制多个 csv 文件

我有一份 701 的清单csv文件每个列都有相同的列数 7 但行数不同 25000 到 28000 之间这是第一个文件的摘录 Date Week Week Day Hour Price Volume Sale Purchase 18 0
Flutter firestore - 检查文档 ID 是否已存在

如果文档 ID 尚不存在我想将数据添加到 firestore 数据库中到目前为止我尝试过的 varuId the ID that is set to the document when created var firestore Fir
jenkins 管道中的该模块需要 boto3 和 botocore

我正在尝试通过 jenkins groovy 脚本运行 ansible playbook 但不断收到错误 boto3 is required 我已经安装了 boto3 pip list boto grep boto boto3 1 20 3
Socket.Select 返回错误“尝试对非套接字的内容进行操作”

当使用经验证仅包含 Socket 对象的列表调用 Socket Select 时我有时会收到错误An operation was attempted on something that is not a socket 我找不到发生的模式
正则表达式：使用 re.sub 将连字符替换为破折号

我正在使用一个小函数来循环文件以便任何连字符被破折号取代替代键 0150 我使用的函数为相关问题的解决方案添加了一些正则表达式风格如何自动替换多个文件的文本内容中的字符 https stackoverflow com questio

正则表达式：使用 re.sub 将连字符替换为破折号

正则表达式：使用 re.sub 将连字符替换为破折号 的相关文章

随机推荐

热门标签

正则表达式：使用 re.sub 将连字符替换为破折号的相关文章