Python docx在保持样式的同时替换段落中的字符串

2024-04-18

我需要帮助替换 Word 文档中的字符串，同时保留整个文档的格式。

我正在使用 python-docx，在阅读文档后，它适用于整个段落，因此我松散了格式，例如粗体或斜体的单词。包括要替换的文本以粗体显示，我想保持这种状态。我正在使用这段代码：

from docx import Document
def replace_string2(filename):
    doc = Document(filename)
    for p in doc.paragraphs:
        if 'Text to find and replace' in p.text:
            print 'SEARCH FOUND!!'
            text = p.text.replace('Text to find and replace', 'new text')
            style = p.style
            p.text = text
            p.style = style
    # doc.save(filename)
    doc.save('test.docx')
    return 1

因此，如果我实现它并想要类似的内容（包含要替换的字符串的段落会丢失其格式）：

This is 第1段，这是一个文本bold.

This is 第2段，我将替换old text

目前的结果是：

This is 第1段，这是一个文本bold.

这是第 2 段，我将替换新的文字

我发布了这个问题（尽管我在这里看到了一些相同的问题），因为（据我所知）这些问题都没有解决这个问题。有一个使用 oodocx 库，我尝试过，但没有成功。所以我找到了一个解决方法。

代码非常相似，但逻辑是：当我找到包含我想要替换的字符串的段落时，使用以下命令添加另一个循环runs。（只有当我想要替换的字符串具有相同的格式时，这才有效）。

def replace_string(filename):
    doc = Document(filename)
    for p in doc.paragraphs:
        if 'old text' in p.text:
            inline = p.runs
            # Loop added to work with runs (strings with same style)
            for i in range(len(inline)):
                if 'old text' in inline[i].text:
                    text = inline[i].text.replace('old text', 'new text')
                    inline[i].text = text
            print p.text

    doc.save('dest1.docx')
    return 1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

pythondocx

Python docx在保持样式的同时替换段落中的字符串的相关文章

使用应用程序脚本将 MS Word 文件（保存在云端硬盘中）转换为 Google 文档

我被某些事情困住了找不到解决办法有没有办法使用文件 url 或 id 将存储在 Google Drive 中的 MS Word 文件转换为 Google 文档我目前有一个电子表格其中包含文件的网址或者也可以使用 python 脚
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
用于多个窗口的 Tkinter 示例代码，为什么按钮无法正确加载？

我正在编写一个程序应该按一下按钮即可打开一个窗口按另一个按钮关闭新打开的窗口我使用类以便稍后可以将代码插入到更大的程序中但是我无法正确加载按钮 import tkinter as tk class Demo1 tk Frame
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
在python中读取PASCAL VOC注释

我在 xml 文件中有注释例如这个它遵循 PASCAL VOC 约定
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
Java/Python 中的快速 IPC/Socket 通信

我的应用程序中需要两个进程 Java 和 Python 进行通信我注意到套接字通信占用了 93 的运行时间为什么通讯这么慢我应该寻找套接字通信的替代方案还是可以使其更快更新我发现了一个简单的修复方法由于某些未知原因缓冲输出流似
使用 SERVER_NAME 时出现 Flask 404

在我的 Flask 配置中我将 SERVER NAME 设置为 app example com 之类的域我这样做是因为我需要使用url for with external网址如果未设置 SERVER NAME Flask 会认为服务器

随机推荐

PHP 密码的正则表达式 [重复]

这个问题在这里已经有答案了我在网上找到了一个脚本它有一个 JavaScript 中的密码正则表达式我仍然想使用它但为了更安全我也想使用 PHP 来验证我的密码但我对正则表达式毫无用处要求必须至少 8 个字符必须包含至少 1
使用 sass 3 自定义 Bootstrap 5 颜色时出现无效 CSS 值错误

我想用 SASS 更改 bootstrap 默认主题颜色问题是当我更改颜色并编译时它会给我无效的 CSS 值错误我已阅读文档并在 YouTube 上看到了一些教程但我看不出问题出在哪里我正在使用 bootstrap 5 1 0 s
此应用程序是否使用广告标识符 (IDFA)？ - AdMob 6.8.0

我目前正在将我的应用程序上传到 App Store Apple 询问我此应用程序是否使用 IDFA 我正在使用最新的 Admob SDK 或 6 8 0 但我不知道它是否使用 IDFA 如果使用我应该点击哪些复选框 Image http
调用重写的虚函数而不是重载

假设我有这部分代码 include
从 python 3 脚本构建适用于 Windows 的 .exe

我想为 python 3 脚本构建一个可执行文件导入 pyqtgraph 使用 pyqt5 导入 theano 和 pymc3 还导入 numpy scipy sys os 打开一个用 qt 设计器制作并存储在 ui 文件中的简单 GUI
使用 Kotlin 创建新目录，Mkdir() 不起作用

var filename blesson txt var wallpaperDirectory File sdcard Wallpaper wallpaperDirectory mkdirs val outputFile File wall
在 D3.js 中绘制多条线

到目前为止我一直在使用循环将线条元素添加到 D3 可视化中但这似乎不符合 API 的精神假设我有一些数据 var data time 1 value 2 value2 5 value3 3 value4 2 time 2 value
如何从仅包含键和键值对列表的列表创建字典（Python）？

这是这个问题的延伸如何在 Python 中拆分列表中的字符串以创建键值对 https stackoverflow com questions 12739911 how to separate string and create a key
如何在 ASP.NET MVC Web 应用程序中使用 Ninject？

我创建了一个新的 MVC Web 应用程序并且引用了 Ninject dll Ninject Web Common dll 和 Ninject Web MVC dll Global asax cs public class MvcAppl
Application.Ontime 取消无法调用对象“Application”的“ONTIME”方法

I am 完全地失去了所以任何帮助将不胜感激我试图取消打开工作簿时触发的 2 个计划事件并使用 Application Ontime 方法重复我知道要终止 OnTime 计划循环您必须提供计划运行的确切时间并且拥有多个 Appli
在 doxygen 中使用 SVG

我正在尝试将 SVG 添加到我的 doxygen 文档中第一次尝试是使用 image blabla svg 这有点工作但是 SVG 包含另一个 png 参考并且内部 png 未显示这在 Chrome 上有效但即使在 Firefo
.NET 通过 TLS 1.2 删除客户端证书

您好似乎这个问题的某种形式已经被问过一百万种不同的方式但许多人没有答案或者答案不适用于我我们有一个微不足道的小型 NET 服务可以调用目前仅支持 TLS 1 2 的第 3 方 API var requestHandler new
Spring错误 - springframework.web.client.HttpClientErrorException：404 Not Found

我正在尝试使用将对象传递给另一个类Spring 我不确定我使用的术语是否正确我对Spring 这边走 TestServicesUtils getTemplate postForLocation http serverConfig port
PHP语句同步或异步

早上好我想知道 PHP 准备语句是同步还是异步例如 req1 UPDATE statement1 connection gt prepare req1 statement1 gt execute req2 SELECT statemen
锁定一个物体

我经常看到这样的代码此处显示 http msdn microsoft com en us library ak9w5846 aspx 即分配一个对象然后将其用作锁定对象在我看来您可以使用任何对象来实现此目的包括事件本身作为锁定对象
如何将变音符号更改为非变音符号[重复]

这个问题在这里已经有答案了我在 stackoverflow 上找到了如何删除变音符号的答案但是您能否告诉我是否可以将变音符号更改为非变音符号哦我想到了 NET 或者其他如果不可能的话由于没有人费心发布代码来执行此操作因此它是
Room IllegalArgumentException：int 无法转换为元素

我在尝试编译项目时遇到此错误错误任务 app compileDebugJavaWithJavac 执行失败 java lang IllegalArgumentException int无法转换为元素还有这个警告警告注释处理器 an
MariaDb 10 条件（其中 id = '1'）返回与 id ='1a' 相同的结果

我创建以 id 作为主键和 int 自动增量的表用这个脚本 CREATE TABLE devel pos menu id INT NOT NULL AUTO INCREMENT title VARCHAR 100 NULL DEFAULT
向后迭代字符串字符的好方法是什么？

向后迭代字符串中的字符的最 Swiftian 方法是什么即喜欢for ch in str 仅相反我想我一定错过了一些明显的东西因为我现在能想到的最好的办法是 for var index str endIndex index str s
Python docx在保持样式的同时替换段落中的字符串

我需要帮助替换 Word 文档中的字符串同时保留整个文档的格式我正在使用 python docx 在阅读文档后它适用于整个段落因此我松散了格式例如粗体或斜体的单词包括要替换的文本以粗体显示我想保持这种状态我正在使用这段代码

Python docx在保持样式的同时替换段落中的字符串

Python docx在保持样式的同时替换段落中的字符串 的相关文章

随机推荐

热门标签

Python docx在保持样式的同时替换段落中的字符串的相关文章