如何使用python docx获取word文档中文本的实际样式

2023-12-05

我正在使用 python docx 库来阅读MS word文件(.docx)。当我阅读段落时,我使用字体函数来获取所有样式属性。但有时它会给None对于字体大小属性。有什么方法可以获取段落包含的实际字体大小。 下面给出了我用来解析段落的示例代码

from docx import Document
d = Document(document_path)
for paragraph in d.paragraphs:
    for run in paragraph.runs:
        print (run.font.size)

简短的回答是否定的。你要求的是有效的字体大小和python-docx只能看到明确设置的字体大小。什么时候font.size报告无,它是该段落的默认值,无论是什么,这取决于样式层次结构。

在许多情况下,它可能是适用的段落样式的字体大小,但唯一确定的方法是遍历该文本节点的样式层次结构到第一个显式定义。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用python docx获取word文档中文本的实际样式 的相关文章

  • 使用 Mac M1 在 Docker 容器内的 pip 安装中找不到 Tensorflow

    我正在尝试使用新的 Mac M1 运行一些项目 这些项目已经在英特尔处理器上运行 并被使用英特尔的其他开发人员使用 我无法构建这个简单的 Dockerfile FROM python 3 9 RUN python m pip install
  • 将 3d NumPy 数组重塑为 2d NumPy 数组时遇到问题

    我正在研究图像处理问题 我的数据以 3 维 NumPy 数组的形式呈现 其中 x y z 条目是图像 z 的 x y 像素 数值强度值 有 100000 张图像 每张图像为 25x25 因此 数据矩阵的大小为 25x25x10000 我试图
  • nginx/uwsgi 服务器的持久内存中 Python 对象

    我怀疑这是否可能 但这是问题和提出的解决方案 提出的解决方案的可行性是这个问题的对象 我有一些需要可用于所有请求的 全局数据 我将这些数据保存到 Riak 并使用 Redis 作为缓存层以提高访问速度 目前 数据被分为约 30 个逻辑块 每
  • 为什么any (True for ... if cond) 比any (cond for ...) 快得多?

    检查列表是否包含奇数的两种类似方法 any x 2 for x in a any True for x in a if x 2 计时结果与a 0 10000000 每次尝试五次 次数以秒为单位 0 60 0 60 0 60 0 61 0 6
  • 如何将多项式拟合到带有误差线的数据

    我目前正在使用 numpy polyfit x y deg 将多项式拟合到实验数据 然而 我想拟合一个基于点误差使用加权的多项式 我已经发现scipy curve fit http docs scipy org doc scipy refe
  • 如何更改 Python 函数的表示形式?

    gt gt gt def hehe return spam gt gt gt repr hehe
  • 当类的任何属性被修改时,类如何运行某些函数?

    是否有一些通用方法可以让类在以下情况下运行函数 any它的属性被修改了吗 我想知道是否可以运行某些子进程来监视类的更改 但也许有一种方法可以继承class并修改一些on change函数是 Python 类的一部分 有点像默认的 repr
  • 在 Tkinter 中调整另一个小部件内的一个小部件的大小

    我正在开发穆斯堡尔光谱 化学 的模拟软件 但在设计 UI 时 我在使用父窗口小部件调整子窗口小部件的大小时遇到 了问题 当窗口最大化时 父框架会填充额外的空间 但子窗口小部件不会更改其大小 from Tkinter import impor
  • argparse - 禁用相同参数的出现

    我正在尝试使用 argparse 禁用一个命令行中出现相同的参数 python3 argument1 something argument2 argument1 something else 这意味着这应该会引发错误 因为 argument
  • 无法解析 ReferenceProperty -- App Engine

    我遇到了一个错误 无法找出其根本原因 错误如下 ReferenceProperty 无法解析 u StatusLog STATUSLOGSID 此错误仅有时发生 大约一天一次或两次 生成此错误的脚本成功的次数多于失败的次数 该错误最奇怪的事
  • 将函数应用于 3D numpy 数组

    我有一个来自 Image PIL Pillow 对象的 numpy 3D 数组 178 214 235 180 215 236 180 215 235 146 173 194 145 172 193 146 173 194 126 171
  • argparse add_argument 别名

    有没有办法使用 argparse 创建别名 例如 我想做这样的事情 parser add argument foo parser add argument alias bar foo 也就是说 使用 bar应该相当于使用 foo 您可以简单
  • PyGTK TreeView 中的自动换行

    如何在 PyGTK TreeView 中自动换行文本 gtk TreeView 中的文本是使用 gtk CellRendererText 渲染的 文本换行归结为在单元格渲染器上设置正确的属性 为了让文本换行 您需要设置wrap width单
  • iter(fp.readline, '') 中的行而不是 fp 中的行:

    我读了内置函数iter的例子在内置函数 Python 3 7 0 文档 https docs python org 3 library functions html iter with open mydata txt as fp for l
  • ModuleNotFoundError:没有名为“googleapiclient”的模块

    如果这是一个愚蠢的问题 我深表歉意 我在 stackoverflow 上搜索过 但没有找到解决办法 我正在致力于从 Python 2 7 迁移到 Python 3 8 我收到一个程序的以下错误 请帮我 Traceback most rece
  • Python、Oracle DB、列中的 XML 数据,获取 cx_Oracle.Object

    我正在使用 python 从 Oracle DB 获取数据 所有行都有一个包含 XML 数据的列 当我使用 python 打印从 Oracle DB 获取的数据时 包含 XML 数据的列将打印为 0x7fffe373b960 处的 cx O
  • 在类方法 Python 中调用多处理

    最初 我有一个类来存储一些处理后的值 并通过其他方法重用这些值 问题是当我尝试将类方法划分为多个进程以加速时 python 生成了进程 但它似乎不起作用 正如我在任务管理器中看到的那样 只有 1 个进程在运行 并且结果从未传递 我做了几次搜
  • 深度学习——一些关于caffe的幼稚问题

    我试图了解 caffe 的基础知识 特别是与 python 一起使用 我的理解是模型定义 比如给定的神经网络架构 必须包含在 prototxt file 当您使用数据训练模型时 prototxt 您将权重 模型参数保存到 caffemode
  • 连接 Flask Socket.IO Server 和 Flutter

    基本上 我有一个套接字 io 烧瓶代码 import cv2 import numpy as np from flask import Flask render template from flask socketio import Soc
  • 使用自定义层运行 Keras 模型时出现问题

    我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这

随机推荐

  • 使用 Webdriver 的 Eclipse for Java 中的字符编码问题

    我目前正在使用 Eclipse 和 TestNG 通过 java 运行 selenium webdriver 我正在使用 Jexcelapi 从 OpenOffice 电子表格 导入数据 以将我正在测试的网站上的字符串与电子表格中的值进行比
  • 集群环境上的 Spring Batch - Websphere

    我确实设置了一个 Spring Batch 作业 它在单个 JVM 上运行良好 但我需要将其部署到集群环境中 我正在使用 Spring 任务调度程序来安排工作 有没有什么方法可以在集群环境中做到这一点 如果一个节点出现故障 另一个节点应该将
  • Facebook cURL 以我身份发帖?

    创建 Facebook 应用程序 使用 cURL 从应用程序发布消息 但它似乎是由我发布的 我怎样才能从应用程序发布 这是我的 cURL attachment array access token gt token message gt m
  • 由于循环导入而无法导入 opencv

    当尝试在 jupyter 实验室笔记本中导入 opencv 时 import cv2 我收到此错误 AttributeError 部分初始化的模块 cv2 没有属性 gapi wip gst GStreamerPipeline 很可能是由于
  • 如何在 Android 上创建 .csv

    我的目标是从表格创建 csv 文件 以打印报告 然后我可以将此 csv 文件存储到我的 SD 卡中 我已经提到了一些与此类似的问题 但他们要求提供一个 jar 文件 有没有其他方法可以不用jar文件来集成呢 在组件 au com bytec
  • MVVM - WPF DataGrid - AutoGenerateColumn 事件

    我目前正在仔细查看出色的Laurent 的工具包和我有以下问题 从 Blend 4 开始 我为 Loaded 事件添加了一个 EventTrigger 在我的 ViewModel 中我有以下内容 public RelayCommand rc
  • 内部录音程序[关闭]

    Closed 这个问题需要多问focused 目前不接受答案 注意 这不是需要使用麦克风的东西 我想在内部录制音频 我想用 C 或 Java 编写一个程序来记录发送到计算机扬声器的音频数据 最终产品将允许用户点击 录制 按钮 当前正在播放的
  • For 循环影响递归变量

    我正在尝试使用递归创建一个函数 该函数可以从帕斯卡三角形内的任何序列中获取任何项 基本上使用自然数作为第一个集合的加法序列 然后使用之前的每个集合作为加法序列 始终从 1 开始 单纯形数 我目前正在学习 JavaScript 并正在做我已经
  • 自定义hugo学术主题中的“关于”小部件

    我通过 RStudio blogdown 使用hugo academic 主题来构建我的网页 示例页面在这里 https themes gohugo io theme academic 我想添加第二份非学术清单兴趣低于学术的 这可能吗 在配
  • 将字符串中的整数提取到数组中

    我需要提取integers from a String到一个数组中 我已经得到了integers 但我无法将它们放入数组中 public static void main String args String line First numb
  • 如何根据条件和参数数量启用结构体?

    我想创建一个元函数 如果向其传递超过 1 个参数 则返回特定类型 如果仅向其传递一个参数 则返回基于条件的另一种类型 该条件是任意的 因此需要enable if或类似的东西 但对于这个例子 我只是将其作为类型比较 让我们将其简化为以下内容
  • 估计全局辐照度的漫射和直接分量

    我正在寻找分离全局辐照度的漫射和直接分量 并找到了 Erbs 模型来在 pvlib 中执行此操作 请参阅pvlib irradiance erbs 但是 我得到了非常奇怪的结果 我预计直接法向辐照度 DNI 会低于全局水平辐照度 GHI 或
  • 找不到-lpthread

    我正在尝试交叉编译 samba 服务器 config 工作得很好 但是当我想用 make 构建时 提示说 Linking shared library bin libsmbclient so 0 opt qnx630 host linux
  • Powershell Import-CSV 如何跳过直到基于字符串的特定行?

    你好 我的 CSV 文件是这样的 BEGINPROPERTIES total candidate create 2 duration 0 00 00 433 internal audit session id 1397055568 inte
  • 使用正则表达式的codingbat wordEnds

    我正在尝试解决wordEnds来自codingbat com使用正则表达式 给定一个字符串和一个非空单词字符串 返回由字符串中该单词每次出现之前和之后的每个字符组成的字符串 忽略单词前后没有字符的情况 如果字符位于两个单词之间 则可能会包含
  • 将文件上传到远程服务器

    我需要将文件从驻留在 Web 服务器中的 ASP NET C 页面上传到远程服务器 我设法使用以下代码从本地主机将文件上传到远程服务器 string serverPath xx xxx xx xx Folder FileUpload1 Fi
  • 使用索引或位图索引扫描对时间戳进行高效的 PostgreSQL 查询?

    在 PostgreSQL 中 我的日期字段上有一个索引tickets桌子 当我将领域与now 查询非常有效 explain analyze select count 1 as count from tickets where updated
  • 多个 Mobilefirst-Server 工件并发部署

    我使用批处理过程来部署 MFP v7 工件 wlapp 和适配器 该过程基于 worklight ant deployer jar 中定义的标准 ant 任务 MFP 环境在 WAS 单元上运行 并由管理多个 WLRuntime 的单个 A
  • xpath 表达式中的属性和 count()

    给定以下 XML 文件 a b b a
  • 如何使用python docx获取word文档中文本的实际样式

    我正在使用 python docx 库来阅读MS word文件 docx 当我阅读段落时 我使用字体函数来获取所有样式属性 但有时它会给None对于字体大小属性 有什么方法可以获取段落包含的实际字体大小 下面给出了我用来解析段落的示例代码