页码 python-docx

2024-01-01

我正在尝试用 python 创建一个程序,它可以在 .docx 文件中查找特定单词并返回它出现的页码。到目前为止,在浏览 python-docx 文档时,我无法找到如何访问页码,甚至无法找到页码所在的页脚。有没有办法使用 python-docx 甚至只是 python 来做到这一点?或者如果没有,最好的方法是什么?


简而言之,答案是否定的,因为分页符是由渲染引擎插入的,而不是由 .docx 文件本身决定的。

然而,某些客户放置<w:lastRenderedPageBreak>保存的 XML 中的元素,以指示上次呈现页面时中断页面的位置。

我不知道哪个可以做到这一点(尽管我希望 Word 本身可以做到这一点)以及它的可靠性如何,但如果您想使用 Python 工作,这是我推荐的方向。您可以使用 python-docx 来获取对所需 lxml 元素的引用(例如w:document/w:body),然后使用 XPath 命令或其他东西迭代到特定页面,但只要稍微思考一下,就需要进行一些详细的开发才能使其正常工作。

如果您使用本机 Windows MS Office API,您可能会得到更好的东西,因为它实际上运行 Word 应用程序。

如果您在 python-docx 中生成文档,则不会放置这些元素,因为它不会尝试呈现文档(也不太可能)。我们也不太可能很快添加对 w:lastRenderedPageBreak 的支持;我什至不太确定那会是什么样子。

如果您搜索“lastRenderedPageBreak”和/或“python-docx分页符”,您会在此处看到其他问题/答案,这些问题/答案可能会提供更多信息。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

页码 python-docx 的相关文章

  • Python从int到string的快速转换

    我正在用 python 求解大量阶乘 并发现当我完成计算阶乘时 需要相同的时间才能转换为字符串以保存到文件中 我试图找到一种将 int 转换为字符串的快速方法 我将举一个计算和 int 转换时间的例子 我正在使用通用的 a str a 但感
  • 为什么我的代码不能根据字典解码加密字符串?

    我有一本字典 其中包含代表字母的键和值 例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码 并将该字符串转换为一个列表 其中每个项目都是一个单词 我需要根据字典中的项目来解决它 代码示例是 wo
  • 更新 Sqlalchemy 中的多个列

    我有一个在 Flask 上运行的应用程序 并使用 sqlalchemy 与数据库交互 我想用用户指定的值更新表的列 我正在使用的查询是 def update table value1 value2 value3 query update T
  • 在 macOS 中通过 Python 访问进程的压缩 RAM(顶部的 CMPRS)的方法?

    我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量 我发现 psutil Process PID memory info rss 工作得很好 直到操作系统决定开始压缩某些进程的 RAM 然后 所有的 memory in
  • numpy 使用 datetime64 进行数字化

    我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
  • 为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符?

    如果我尝试粘贴 unicode 字符 例如中间的点 在我的 python 解释器中它什么也不做 我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时 我没有遇到任何问题 但在解释器中 python Pytho
  • Pandas 滚动窗口 Spearman 相关性

    我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和 或 Pearson 相关性 我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸 但我似乎无法定义该方法 添加meth
  • 动态 __init_subclass__ 方法的参数绑定

    我正在尝试让类装饰器工作 装饰器会添加一个 init subclass 方法到它所应用的类 但是 当该方法动态添加到类中时 第一个参数不会绑定到子类对象 为什么会发生这种情况 举个例子 这是可行的 下面的静态代码是我试图最终得到的示例 cl
  • Python多处理错误“ForkAwareLocal”对象没有属性“连接”

    下面是我的代码 我面临着多处理问题 我看到这个问题之前已经被问过 我已经尝试过这些解决方案 但它似乎不起作用 有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
  • django-admin.py makemessages 不起作用

    我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
  • 乘以行并按单元格值附加到数据框

    考虑以下数据框 df pd DataFrame X a b c d Y a b d e Z a b c d 1 2 1 3 df 我想在 列中附加数字大于 1 的行 并在该行中的数字减 1 df 最好应该 然后看起来像这样 或者它可能看起来
  • 如何使用 sys.path.append 在 Python 中导入文件?

    我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
  • PyTorch DataLoader 对并行运行的批次使用相同的随机种子

    有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中 当并行加载批次时Da
  • 将文本注释到轴并对齐为圆

    我正在尝试在轴上绘制文本并将该文本与圆对齐 更准确地说 有一些具有不同坐标 x y 的点位于该圆内 并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义 因此
  • Python 类型安全吗?

    根据维基百科 https en wikipedia org wiki Type system Type safety and memory safety 如果一种语言不允许违反类型系统规则的操作或转换 计算机科学家就认为该语言是 类型安全的
  • Python 声音(“铃声”)

    我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我 目前 我使用import os然后使用命令行语音程序说 进程完成 我更愿意它是一个简单的 铃 我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
  • 检测 IDLE 的存在/如何判断 __file__ 是否未设置

    我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个 有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
  • 如何在 robobrowser-python 中发出 POST 请求

    http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
  • Python:高精度time.sleep

    你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗 您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
  • 如何为所有用户安装 Anaconda python?

    Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本 默认情况下 安装会将 python 定位到 anac

随机推荐

  • 带有 Mvvmcross 的 Xamarin 表单选项卡式页面

    我遇到一个奇怪的问题 当我将内容页面设置为启动页面时 Xamarin Forms 应用程序工作正常 如果我将 TabbedPage 设置为启动项并将相同的 ContentPage 设置为 TabbedPage 的子级 则它不会显示 数据绑定
  • 结构变量成员后面的大括号是什么意思?

    在一些维护 Valgrind ing 期间 我遇到了这段代码 pragma pack push 1 struct somename uint16 t a uint16 t b uint32 t c pragma pack pop 我希望 告
  • Kafka消费者动态拾取主题

    我在 Spring Boot 中配置了一个 Kafka 消费者 这是配置类 EnableKafka Configuration PropertySource classpath kafka properties public class K
  • 如何在@Html.TextAreaFor()中使用@Html.Raw()

    我正在使用 Summernote 添加图像 视频 文本 另外 我将图像或视频保存为 Html 代码 该代码是字符串类型到数据库中 当我从数据库中检索视频或图像以在 Summernote 上显示时 需要将近 5 分钟 我不知道为什么 但是 当
  • 文档头中的脚本是否总是在 DOMContentLoaded 触发之前执行?

    在下面的文档中 Where example js is document addEventListener DOMContentLoaded function console log hello log语句是否保证执行 根据MDN http
  • 在 PHP 中执行 MongoDB 查找查询

    我面临的情况是 我需要能够从 PHP 内部运行直接 mongodb 查询 并且在使用 execute 函数时遇到问题 以下代码将正确执行并从数据库返回结果 m new MongoClient db m gt
  • 安装 PhoneGap,执行命令“ant”时出错

    通过nodeJS安装PhoneGap时 我在尝试运行我的应用程序时遇到错误 安装phonegap并创建应用程序有效 C Users arko my app gt phonegap run android phonegap detecting
  • 在 Ionic4/Angular 项目中安全存储 API 密钥的位置

    我感觉我在这里问了错误类型的问题 因为它在 30 秒内无法通过谷歌搜索到 请告诉我 无论如何 我有我的environment ts and environment prod ts所有设置都使用后端和第三方服务的 URL 和 API 密钥 但
  • 如何在 Tomcat 7 中部署 war 文件

    我已经复制了sample war文件到webappsTomcat的目录 我可以访问localhost 8080 现在Tomcat将如何部署它 我的意思是我需要在浏览器中打开它吗 我如何访问该应用程序 您可以通过以下方式访问您的申请 http
  • eBay XML API 返回“无效的作业上下文类型”错误

    我正在开发 eBay 管理器 现已接近完成 一切都运行良好 例如发布数据 从 eBay 获取订单详细信息 现在我需要更新 eBay 上的运输跟踪号码 承运商的状态 在这里我收到错误 我无法弄清楚问题是什么 在这方面的任何帮助将受到高度赞赏
  • Laravel安装sail问题((23)失败的写体)

    我尝试使用原始 laravel 文档安装 laravel 但什么也没发生 我遇到了很多错误 例如我尝试了这个command https laravel com docs 8 x installation getting started on
  • Rails 4:将变量传递给 JavaScript

    我尝试了多种方法并遵循瑞安 贝茨的 http railscasts com episodes 324 passing data to javascript指南 但无论我做什么 我仍然没有定义 application html erb ret
  • CustomEvent.detail“被污染”?

    我正在开发一个 Chrome 扩展程序 以增加网站的便利性 我可以访问该页面的 DOM 但我还需要与该页面上的 第一方 JS 进行交互 而我无法从我的扩展中执行此操作 我可以将任意标签注入到页面中 最值得注意的是
  • java.lang.NoSuchMethodError: org.apache.commons.logging.LogFactory

    当我为 android 启用 proguard 时 proguard 将混淆应用程序中包含的所有 jar 这些罐子包括 库jars lib Analytics Android SDK 2 1 jar 库jars lib commons co
  • React中如何每分钟自动获取数据?

    我想每分钟自动获取我的数据 我正在获取的数据是坐标 我想知道一个人的实时位置并打印坐标 现在 我有这个 import React Component from react class Test3 extends Component stat
  • 最佳实践 android:onClick XML 属性或 setOnClickListener? [复制]

    这个问题在这里已经有答案了 我正在关注 Google 的 Android 教程 发现有两种方法可以根据标题获取小部件回调 或仅 onClick 我不知道 我是一名高级 Java Swing 开发人员 所以内部类方法让我有宾至如归的感觉 但我
  • SwaggerUI 不显示模型架构

    我有一个带有 Swagger 和 Swashbuckle 的 C Web API 项目 我有一个模型 public class TimeZoneName public string zoneName get 我有一个带有方法的控制器 pub
  • 是否可以使用 selenium 更改 Firefox 中的浏览器语言?

    我想在 selenium 自动化中以给定语言启动 Firefox 浏览器 我可以这样做吗 如果是这样 请分享一些示例代码实现 提前致谢 在启动驱动程序之前 在 Fire Fox 配置文件首选项中设置语言代码 如下所示 FirefoxProf
  • 内容脚本匹配顶级域,如所有谷歌。*

    我希望我的内容脚本能够匹配所有谷歌域和特定页面 我知道这是不可能的 清单 json content scripts matches www google www youtube com readthedocs org 还有其他方法可以做到这
  • 页码 python-docx

    我正在尝试用 python 创建一个程序 它可以在 docx 文件中查找特定单词并返回它出现的页码 到目前为止 在浏览 python docx 文档时 我无法找到如何访问页码 甚至无法找到页码所在的页脚 有没有办法使用 python doc