如何从段落 python docx 中获取图像（inlineshape）

2023-11-23

我想逐段阅读docx文档，如果有图片（InlineShape），则用它周围的文本处理它。函数 Document.inline_shapes 将给出文档中所有内联形状的列表。但我想得到一个，如果存在的话，恰好出现在当前段落中......

代码示例：

from docx import Document

doc = Document("test.docx")
blip = doc.inline_shapes[0]._inline.graphic.graphicData.pic.blipFill.blip
rID = blip.embed
document_part = doc.part
image_part = document_part.related_parts[rID]

fr = open("test.png", "wb")
fr.write(image_part._blob)
fr.close()

（这就是我想要保存这些图片的方式）

假设您的段落是标准的，您可以使用以下代码来查找图像

import xml.etree.ElementTree as ET
def hasImage(par):
    """get all of the images in a paragraph 
    :param par: a paragraph object from docx
    :return: a list of r:embed 
    """
    ids = []
    root = ET.fromstring(par._p.xml)
    namespace = {
             'a':"http://schemas.openxmlformats.org/drawingml/2006/main", \
             'r':"http://schemas.openxmlformats.org/officeDocument/2006/relationships", \
             'wp':"http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing"}

    inlines = root.findall('.//wp:inline',namespace)
    for inline in inlines:
        imgs = inline.findall('.//a:blip', namespace)
        for img in imgs:     
            id = img.attrib['{{{0}}}embed'.format(namespace['r'])]
        ids.append(id)

    return ids

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

image

docx

pythondocx

如何从段落 python docx 中获取图像（inlineshape）的相关文章

Python - 如何实现“可停止”线程？

已经发布解决方案了here https stackoverflow com questions 323972 is there any way to kill a thread in python创建一个可停止的线程但是我在理解如何实施
如何在 psycopg2 线程连接类中重新连接到 postgreSQL？ SSL SYSCALL 错误导致的失败：在 Azure 中检测到 EOF？

我们的应用程序运行良好直到我们将 PostgreSQL 移植到 Azure 中的 Microsoft 数据库然后我们的应用程序会定期无故失败并且到处都会出现 SSL SYSCALL 错误删除等我们已经尝试了互联网上描述的所有内容
在 pandas 中获取组名称的有效方法

我有一个包含大约 300 000 行的 csv 文件我将其设置为按特定列分组每个组大约有 140 名成员总共 2138 个组我正在尝试生成组名称的 numpy 数组到目前为止我已经使用 for 循环来生成名称但处理所有内容都需
使用 Javascript/jQuery 和 CSS 更改 PNG 颜色

我有一个黑色的心 PNG http 1 bp blogspot com yq ZSKg39Tk TOvzVx9sC5I AAAAAAAAAb0 GcN4O Ciq3s s1600 black heart png我想用不同的颜色显示如何使用
min() arg 是一个空序列

我试图找到矩阵行中的最小元素但有两个条件 1 它必须 gt 0 2 并且这个点一定不能被访问 is visited k is False 我下一步正在尝试做 min x for x in matr sum i if x gt 0 if i
如果每个区域内至少有 5 个连续行，如何在每个标题区域的末尾使用 Title[Name]2 发布新行？

我想在每个 Title 区域的末尾使用 Title Name 2 发布新行的最简单方法是通过一个计算连续行数的变量其中至少有 5 个连续行包含 1 1 1 1在每个标题区域内我不确定我对计数变量做错了什么也许确实必须在每个 Tit
让 Bazel 使用 Python3 运行（语法错误）

我正在尝试使用 Bazel 运行此代码 https github com google in silico labeling https github com google in silico labeling 这是关联的 Bazel BU
在 Linux 服务器上创建和编辑 MS-Word 文档？

希望开发处理文档的服务器端应用程序源文档大多是MS Word 2003 2007 即MS版本的Docx 希望服务器应用程序能够在linux或windows上运行想知道在linux下读写MS Word文件最好的工具或库是什么兼容性是最重
在 python 2 或 python 3 中编写 csv 文件的便携式方法

在我的 Windows 机器上我通常在 python 2 中这样做来编写 csv 文件 import csv f open out csv wb cr csv writer f delimiter cr writerow a b c f
如何创建始终有效的导入？

我正在努力在我的一个项目中建立一个工作结构问题是我有一个像这样的结构的主包和子包我遗漏了所有不必要的文件 code py mypackage init py mypackage work py mypackage utils py u
使用 selenium 进行身份验证 (Python)

我有指向我网站管理区域的链接是否可以使用 selenium 在给定的浏览器中启动这些 URI 链接而无需事先进行身份验证如果没有那么我如何使用 selenium 处理身份验证不确定您的意思但您可以仅使用选择器并在身份验证字段中
在Python 3中将二进制字符串转换为字节数组

尽管有很多相关的问题但我找不到任何符合我的问题的问题我想更改二进制字符串例如 0110100001101001 转换成字节数组同一个例子 b hi 我试过这个 bytes int i for i in 011010000110100
调整离子卡中的图像大小

我想显示一组图像并在下面说明我选择使用 Ionic 卡我得到这个结果第一张图片虽然我想保留现在的相同布局并添加描述这是我的代码
为什么实现 __iter__ 的对象不被识别为可迭代的？

假设您使用包装对象 class IterOrNotIter def init self self f open tmp toto txt def getattr self item try return self getattribute
找不到仅适用于数字的 Tesseract 4.0 tessdata

正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
Kotlin：使用 Picasso 从 flickr 加载图像时出现错误 503

我的应用程序使用 Android 的 Picasso 库从 flickr 加载图像奇怪的是不久前将我的应用程序迁移到 Kotlin 后它工作得很好但现在我开始出现随机 503 错误我已经在 flickr 控制面板中为每个图像设置
python 3.4 计算 .txt 文件中的出现次数

我正在为我正在上课的课程编写一个简单的小程序这应该询问我要搜索哪个团队然后返回它出现在 txt 文件列表中的次数它像它应该的那样请求输入并且看起来运行得很好它现在已经运行了一个小时我完全没有收到任何错误它似乎陷入了循环预
命令行批量图像裁剪工具

有没有可以处理多种格式的轻量级命令行批量图像裁剪工具 Linux或Windows 在 Linux 中你可以使用 mogrify crop Width x Height X Y repage image png 用于 CLI 图像处理
如何在 Windows 上使用 Python 3.6 来安装 Python 2.7

我想问一下如何使用pip install对于 Python 2 7 当我之前安装并使用 Python 3 6 时我现在必须使用 Windows 上的 Python 版本 pip install 继续安装 Python 3 6 我需要使用以
使用 python 将文本发送到带有逗号分隔符的列

如何使用分隔符在 Excel 中将一列分成两列并使用 python 命名标题这是我的代码 import openpyxl w openpyxl load workbook DDdata xlsx active w active a a

随机推荐

将 pandas 数据帧转换为 utf8

如何将 pandas 数据帧转换为 unicode messages pandas read csv data SMSSpamCollection sep t quoting csv QUOTE NONE names label messa
JS/HTML5 WebSocket：无需 HTTP 调用即可连接

好吧我刚刚尝试了 HTML 5 中的新 WebSocket 类并且对它们的存在感到非常兴奋然而我看不出它们比 AJAX 更有价值因为它们仍然发起 HTTP 调用并且not就像传统的插座一样这就是我在这里问的原因有没有办法使用
Android Room + 窗口功能

我尝试在房间查询中使用窗口函数解析器抱怨我的查询我只是尝试在 select 语句中添加 ROW NUMBER OVER ORDER BY column 表达式如果没有此表达式查询将正确运行解析器错误 extraneous inpu
我可以检测浏览器中可用的 async/await 吗？ [复制]

这个问题在这里已经有答案了如标题如何检测浏览器中的 async await es7 支持那可能吗与任何其他语法特征一样应该对其进行评估才能被检测到自从eval可以被限制当启用 CSP 时这可能是不可能的 let isAsync
如何有条件地导入 xslt 中的样式表？

有没有办法在检查某些条件后导入样式表例如如果变量 a 的值 1 则导入 1 xsl 否则导入 2 xsl 大家好请问有什么办法可以导入吗检查一些样式表后状况就像如果变量 a 的值 1 然后导入 1 xsl 或者导入 2 xsl
node_modules 未被识别为内部或外部命令

我正在尝试使用 appium jasmine 和 Perfecto mobile 编写测试自动化脚本我正在使用从以下 URL 克隆的项目和我自己的配置Appium JavaScript 示例问题是当我执行npm test命令我收到以下错
从单独的路由文件内部访问快速“应用程序”对象的最佳方法是什么？

在 Express 4 中默认情况下路由是从单独的文件加载的 app use routes 将加载routes index js 我有一个附加到的第三方库app本身是否有首选的访问方式app从内部routes index js 我考虑
关闭呈现的视图控制器

我有一个理论问题现在我正在阅读苹果的视图控制器 guide 他们写当需要关闭呈现的视图控制器时首选方法是让呈现视图控制器关闭它换句话说只要有可能同一个视图控制器提出视图控制器还应该负责驳回它尽管有多种方法可以通知呈现视
glibc 的 fprintf() 实现是线程安全的吗？

fprintf 是线程安全的吗 glibc 手册似乎是这样但我的应用程序使用对 fprintf 的单个调用写入文件似乎混合了来自不同进程的部分写入编辑澄清一下有问题的程序是lighttpd插件并且服务器正在运行多个工作线程查看该
Symfony 手动连接参数 - 'arguments' 与 'bind'

我尝试找出如何手动注入参数DefaultController 没有自动装配我发现有两种方法可以实现这一目标我可以用arguments services defaults autowire false autoconfigure true
使用 LIKE 搜索 GROUP_CONCAT

我有一个 SQL 查询它使用 GROUP CONCAT 让所有人附加到某个订单有没有办法可以在 GROUP CONCAT 字段内进行搜索 SELECT orders orderID GROUP CONCAT contacts first
结构解引用运算符（运算符->）

我正在为迭代器编写一个薄模板包装器在通过结构取消引用运算符时遇到了绊脚石主要是因为指针没有 include
填充可用空间的 CSS 布局

我正在尝试做一个看似简单的网页布局但我遇到了困难 I d like做一切事纯粹用CSS 没有桌子把事情搞砸并且没有 JavaScript动态调整事物的大小我想要具有固定高度的标题固定高度的页脚具有固定宽度的左侧边栏具有固定宽度
UICollectionViewLayoutlayoutAttributesForElementsInRect和layoutAttributesForItemAtIndexPath

我正在实现自定义流程布局它有两种主要方法来覆盖以确定单元格的位置 layoutAttributesForElementsInRect and layoutAttributesForItemAtIndexPath 在我的代码中 layout
如何将单行与sql中列中的数字相乘

就我而言有订单和订单头寸每个订单位置都有一个数量例如但现在我需要每个位置元素一行这是我想要的输出我的想法是使用rank over 获得增量数但我不知道如何使用该数量作为乘数是否有一个聪明的解决方案来使用单列作为行乘法器
删除变量上的重复项而不进行排序

我有一个变量其中包含以下空格分隔的条目 variable apple lemon papaya avocado lemon grapes papaya apple avocado mango banana 如何在不排序的情况下删除重复项
Python 行尾正则表达式

我正在尝试编写一个正则表达式在点之前和之后添加一个空格但是我只希望在点后有空格或行尾时出现此情况但是对于行尾情况我无法这样做 Eg I want a hotel gt gt I want a hotel my email is
如何在iPhone上播放MIDI？

据我所知没有本地或第三方库可用于在 iPhone 上播放 MIDI 但似乎有不少应用程序可以做到这一点他们用什么有什么线索吗供那些走这条路的人参考 AVMIDIPlayer 是在 iOS 8 中引入的似乎在设备上运行良好但 si
C++ JSON 序列化

我想要一种尽可能自动地将对象序列化和反序列化为 JSON 的方法连载对我来说理想的方法是如果我调用实例 JSONSerialize 它会返回一个带有 JSON 对象的字符串该对象具有该对象的所有公共属性 name of prope
如何从段落 python docx 中获取图像（inlineshape）

我想逐段阅读docx文档如果有图片 InlineShape 则用它周围的文本处理它函数 Document inline shapes 将给出文档中所有内联形状的列表但我想得到一个如果存在的话恰好出现在当前段落中代码示例 from

如何从段落 python docx 中获取图像（inlineshape）

如何从段落 python docx 中获取图像（inlineshape） 的相关文章

随机推荐

热门标签

如何从段落 python docx 中获取图像（inlineshape）的相关文章