页码 python-docx

2024-01-01

我正在尝试用 python 创建一个程序，它可以在 .docx 文件中查找特定单词并返回它出现的页码。到目前为止，在浏览 python-docx 文档时，我无法找到如何访问页码，甚至无法找到页码所在的页脚。有没有办法使用 python-docx 甚至只是 python 来做到这一点？或者如果没有，最好的方法是什么？

简而言之，答案是否定的，因为分页符是由渲染引擎插入的，而不是由 .docx 文件本身决定的。

然而，某些客户放置<w:lastRenderedPageBreak>保存的 XML 中的元素，以指示上次呈现页面时中断页面的位置。

我不知道哪个可以做到这一点（尽管我希望 Word 本身可以做到这一点）以及它的可靠性如何，但如果您想使用 Python 工作，这是我推荐的方向。您可以使用 python-docx 来获取对所需 lxml 元素的引用（例如w:document/w:body），然后使用 XPath 命令或其他东西迭代到特定页面，但只要稍微思考一下，就需要进行一些详细的开发才能使其正常工作。

如果您使用本机 Windows MS Office API，您可能会得到更好的东西，因为它实际上运行 Word 应用程序。

如果您在 python-docx 中生成文档，则不会放置这些元素，因为它不会尝试呈现文档（也不太可能）。我们也不太可能很快添加对 w:lastRenderedPageBreak 的支持；我什至不太确定那会是什么样子。

如果您搜索“lastRenderedPageBreak”和/或“python-docx分页符”，您会在此处看到其他问题/答案，这些问题/答案可能会提供更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

页码 python-docx 的相关文章

Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符？

如果我尝试粘贴 unicode 字符例如中间的点在我的 python 解释器中它什么也不做我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时我没有遇到任何问题但在解释器中 python Pytho
Pandas 滚动窗口 Spearman 相关性

我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和或 Pearson 相关性我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸但我似乎无法定义该方法添加meth
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
乘以行并按单元格值附加到数据框

考虑以下数据框 df pd DataFrame X a b c d Y a b d e Z a b c d 1 2 1 3 df 我想在列中附加数字大于 1 的行并在该行中的数字减 1 df 最好应该然后看起来像这样或者它可能看起来
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
Python 类型安全吗？

根据维基百科 https en wikipedia org wiki Type system Type safety and memory safety 如果一种语言不允许违反类型系统规则的操作或转换计算机科学家就认为该语言是类型安全的
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
如何为所有用户安装 Anaconda python？

Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本默认情况下安装会将 python 定位到 anac

随机推荐

带有 Mvvmcross 的 Xamarin 表单选项卡式页面

我遇到一个奇怪的问题当我将内容页面设置为启动页面时 Xamarin Forms 应用程序工作正常如果我将 TabbedPage 设置为启动项并将相同的 ContentPage 设置为 TabbedPage 的子级则它不会显示数据绑定
结构变量成员后面的大括号是什么意思？

在一些维护 Valgrind ing 期间我遇到了这段代码 pragma pack push 1 struct somename uint16 t a uint16 t b uint32 t c pragma pack pop 我希望告
Kafka消费者动态拾取主题

我在 Spring Boot 中配置了一个 Kafka 消费者这是配置类 EnableKafka Configuration PropertySource classpath kafka properties public class K
如何在@Html.TextAreaFor()中使用@Html.Raw()

我正在使用 Summernote 添加图像视频文本另外我将图像或视频保存为 Html 代码该代码是字符串类型到数据库中当我从数据库中检索视频或图像以在 Summernote 上显示时需要将近 5 分钟我不知道为什么但是当
文档头中的脚本是否总是在 DOMContentLoaded 触发之前执行？

在下面的文档中 Where example js is document addEventListener DOMContentLoaded function console log hello log语句是否保证执行根据MDN http
在 PHP 中执行 MongoDB 查找查询

我面临的情况是我需要能够从 PHP 内部运行直接 mongodb 查询并且在使用 execute 函数时遇到问题以下代码将正确执行并从数据库返回结果 m new MongoClient db m gt
安装 PhoneGap，执行命令“ant”时出错

通过nodeJS安装PhoneGap时我在尝试运行我的应用程序时遇到错误安装phonegap并创建应用程序有效 C Users arko my app gt phonegap run android phonegap detecting
在 Ionic4/Angular 项目中安全存储 API 密钥的位置

我感觉我在这里问了错误类型的问题因为它在 30 秒内无法通过谷歌搜索到请告诉我无论如何我有我的environment ts and environment prod ts所有设置都使用后端和第三方服务的 URL 和 API 密钥但
如何在 Tomcat 7 中部署 war 文件

我已经复制了sample war文件到webappsTomcat的目录我可以访问localhost 8080 现在Tomcat将如何部署它我的意思是我需要在浏览器中打开它吗我如何访问该应用程序您可以通过以下方式访问您的申请 http
eBay XML API 返回“无效的作业上下文类型”错误

我正在开发 eBay 管理器现已接近完成一切都运行良好例如发布数据从 eBay 获取订单详细信息现在我需要更新 eBay 上的运输跟踪号码承运商的状态在这里我收到错误我无法弄清楚问题是什么在这方面的任何帮助将受到高度赞赏
Laravel安装sail问题（(23)失败的写体）

我尝试使用原始 laravel 文档安装 laravel 但什么也没发生我遇到了很多错误例如我尝试了这个command https laravel com docs 8 x installation getting started on
Rails 4：将变量传递给 JavaScript

我尝试了多种方法并遵循瑞安贝茨的 http railscasts com episodes 324 passing data to javascript指南但无论我做什么我仍然没有定义 application html erb ret
CustomEvent.detail“被污染”？

我正在开发一个 Chrome 扩展程序以增加网站的便利性我可以访问该页面的 DOM 但我还需要与该页面上的第一方 JS 进行交互而我无法从我的扩展中执行此操作我可以将任意标签注入到页面中最值得注意的是
java.lang.NoSuchMethodError: org.apache.commons.logging.LogFactory

当我为 android 启用 proguard 时 proguard 将混淆应用程序中包含的所有 jar 这些罐子包括库jars lib Analytics Android SDK 2 1 jar 库jars lib commons co
React中如何每分钟自动获取数据？

我想每分钟自动获取我的数据我正在获取的数据是坐标我想知道一个人的实时位置并打印坐标现在我有这个 import React Component from react class Test3 extends Component stat
最佳实践 android:onClick XML 属性或 setOnClickListener？ [复制]

这个问题在这里已经有答案了我正在关注 Google 的 Android 教程发现有两种方法可以根据标题获取小部件回调或仅 onClick 我不知道我是一名高级 Java Swing 开发人员所以内部类方法让我有宾至如归的感觉但我
SwaggerUI 不显示模型架构

我有一个带有 Swagger 和 Swashbuckle 的 C Web API 项目我有一个模型 public class TimeZoneName public string zoneName get 我有一个带有方法的控制器 pub
是否可以使用 selenium 更改 Firefox 中的浏览器语言？

我想在 selenium 自动化中以给定语言启动 Firefox 浏览器我可以这样做吗如果是这样请分享一些示例代码实现提前致谢在启动驱动程序之前在 Fire Fox 配置文件首选项中设置语言代码如下所示 FirefoxProf
内容脚本匹配顶级域，如所有谷歌。*

我希望我的内容脚本能够匹配所有谷歌域和特定页面我知道这是不可能的清单 json content scripts matches www google www youtube com readthedocs org 还有其他方法可以做到这
页码 python-docx

我正在尝试用 python 创建一个程序它可以在 docx 文件中查找特定单词并返回它出现的页码到目前为止在浏览 python docx 文档时我无法找到如何访问页码甚至无法找到页码所在的页脚有没有办法使用 python doc

页码 python-docx

页码 python-docx 的相关文章

随机推荐

热门标签