Python3：将PDF下载到内存并将第一页转换为图像

2024-04-12

我尝试执行以下操作：

将 PDF 文件下载到内存
将第一页转换为图像
将该图像与 tweepy 一起使用

我尝试了以下代码，但遇到了错误。

from PIL import Image
from pdf2image import convert_from_path
from urllib.request import urlopen
from io import StringIO, BytesIO

url = 'http://somedomain.com/assets/applets/internet.pdf'
scrape = urlopen(url) # for external files
pdfFile = BytesIO(scrape.read())
pdfFile.seek(0)
pages = convert_from_path(pdfFile,last_page=1, dpi=100)

for page in pages:
    page.save('/home/out.jpg', 'JPEG')

这是错误：

TypeError: Can't convert '_io.BytesIO' object to str implicitly

生成的图像稍后应用于通过 tweepy 将其上传到 Twitter。我不需要将其存储到磁盘，这就是为什么我尝试在内存中完成所有操作。有谁可以帮助我吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

image

pdf

Download

Python3：将PDF下载到内存并将第一页转换为图像的相关文章

Python：返回 // 正则表达式之间的字符串[重复]

这个问题在这里已经有答案了我仍然不明白正则表达式我阅读了文档但是在我想出了正则表达式字符之后那么如何使用它们呢例如我只想返回前两个斜杠之间的任何内容 en lemon peel n ca llimona n is 的输出应该是
pygame.error：文件不是 Windows BMP 文件（问题的延续）

我最近开始使用 Mac 进行编码因此我必须从以前的计算机 Windows 中移走所有文件长话短说在发生此错误之前一切都很好 pygame error File is not a Windows BMP file 我检查了 Stack
是否可以根据节点大小更改字体大小？

根据NetworkX https networkx github io documentation networkx 1 10 reference generated networkx drawing nx pylab draw netwo
Windows 如何批量打印 PDF 文档？

在我的机器上当在 Windows 资源管理器中选择多个 PDF 文档时右键单击并选择Print Adobe Acrobat Reader 将最小化打开所有文档都会静默发送到打印机我想做Windows一样的事情但是怎么做呢我在用P
如何在Windows中的Python 3.9下pip安装pickle？

我需要pickle https docs python org 3 9 library pickle html module pickle包安装在我的下面Python 3 9在 Windows 10 下我尝试过的当尝试与pip inst
导入 pandas 显示 ImportError: 无法导入名称哈希表

我已经在 python 3 3 上安装了 pandas 代码如下 import csv import pandas from pandas import DataFrame csvdata pandas read csv datafile
使用 ImageMagick 和 PHP 将 PNG 转换为 JPG 并将透明背景设置为白色

将图像从 PNG 转换为 JPEG 时如何使用 ImageMagick 带有 php 扩展将透明背景设置为白色在撰写本文时您尚未指定正在使用哪个扩展但如果您使用命令行则命令将是 convert image png backgro
有没有办法在 Python 3 中子类化生成器？

除了显而易见的事情之外我想我应该尝试一下以防万一 def somegen input None yield gentype type somegen class subgen gentype def best function ever
VideoCapture.read() 返回过去的图像

我在跑python3 6 with openCV on the Raspberry pi OS is Raspbian 代码的大致结构如下 The image以时间间隔 3 5 分钟捕获被捕获image在函数中处理并返回度量精度的种类
使用 os.write 打印字体图标

在 Windows 10 上使用 Python 3 8 3 我的终端使用nerdfont https github com ryanoasis nerd fonts tree master patched fonts Agave有图标的
使用 jQuery 清除 IMG

我正在尝试从 a 中删除加载的图像 img 元素但清除或删除 src 不会执行此操作该怎么办 HTML img src https www google com images srpr logo3w png JQUERY img att
jasper 报告 pdf 导出中忽略半透明（半透明）背景色

问为什么保存为 PDF 时 Alpha 信息会丢失 Jaspersoft studio 不允许我用 Alpha 指定颜色因此我尝试聪明地在着色元素上指定键并更改代码中的颜色如下所示 JasperReport jasperRepor
React Native：加载图像后应用程序性能不佳

加载图像似乎没有问题但是加载完毕后就出现问题了在我的应用程序中我在整个游戏中一张一张地加载卡片图像一旦我加载了 40 张卡片图像整个应用程序就会变得很慢它总是发生在第 40 个图像处当我在第 40 个图像之后继续加载更多卡片图
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
如何在Django中显示内存中的图片？

我知道如何将图片显示为内存中的页面如下所示 import cStringIO mStream cStringIO StringIO picBin return HttpResponse mStream getvalue image jpg
Python 3 os.urandom

在哪里可以找到完整的教程或文档os urandom 我需要获得一个随机 int 来从 80 个字符的字符串中选择一个字符如果你只需要一个随机整数你可以使用random randint a b 来自随机模块 http docs pytho
Python3.0 - 标记化和取消标记化

我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
pytesseract 无法从图像中识别复杂的数学公式

我在用pytesseractpython 中的模块 pytesseract从图像中识别文本但它不适用于包含复杂数学公式例如根推导积分数学问题或方程的图像代码2 py Import modules from PIL import
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此

随机推荐

如何在cpanel上部署nextjs应用程序？

我按照以下步骤在 cPanel 上部署 nextjs 转到 package json 并添加以下行 homepage http afsanefadaei ir run next build具有 next文件夹作为我的构建文件夹 go to
Excel VBA，访问 URL 时提示“Windows 安全”

我有一个访问 URL HTTPS 的 Excel 文件 URL 作为使用用户名和密码的基本身份验证该宏每天早晚运行它需要它是自动的我有用户名和密码问题是每次我运行宏时它都会提示我输入 Windows 安全用户名和密码已填满因
WPF 线程：我可以在非 UI 线程中更新控件的数据上下文吗？

我们可以在非 UI 线程中更新 WPF 控件的数据上下文吗假设我们有一个Label具有MyClass作为数据上下文并绑定Content to MyProperty
java.lang.RuntimeException：无法反序列化对象。无法将 java.lang.Long 类型的值转换为布尔值

我有大问题使用 Android 模拟器运行应用程序效果很好但是当我将应用程序放在真正的手机上时我收到此错误 java lang RuntimeException Could not deserialize object Failed
Chrome 和 Firefox 中相同框阴影大小的不同输出

为什么尺寸为box shadowChrome 和 Firefox 有什么不同 box shadow 0 0 4px aaa inset Chrome Firefox 我已经尝试过以下方法但它在最新的 Firefox 中不起作用 moz b
在 DOM 中多次使用 React.render() 可以吗？

我想使用 React 在整个 DOM 中多次添加组件这把小提琴 http jsfiddle net ypcrumble gs7k1kth 1 显示了我想要做什么并且它不会引发任何错误这是代码 HTML div div div div
ASP.NET Core 中的自定义授权属性

我正在研究 asp net core 但我不明白一些事情例如在 mvc net 5 中我们可以使用 AuthorizeAttribute 创建类来过滤和授权操作并将属性设置为操作如下所示 public class AdminAut
从对象数组中删除原始对象和重复对象 - JS

我有一系列对象 const arr title sky artist Jon id 1 title rain artist Paul id 2 title sky artist Jon id 1 我想根据 id 从数组中删除所有重复项最终
JpaRepository 缓存新创建的对象。怎么刷新呢？

我有一个 JpaRepository 在 Spring MVC 应用程序中保存新创建的实体这个实体看起来像这样非常简单 Entity public class Translation Id GeneratedValue strategy
将日期字符串解析为某个 Java 对象

我正在从事一个读取文件和处理数据的项目例如我必须处理日期 2012 01 10 23 13 26 2012 年 1 月 13 日我找到了 Joda 包有点有趣但不知道它是否是最简单的我能够将第一个示例解析为 DateTime 对
如何仅在 DateTime 对象中删除 C# 中日期的时间部分？

我需要删除日期时间的时间部分或者可能有以下格式的日期object形式不以string 06 26 2009 00 00 00 000 我无法使用任何string转换方法因为我需要日期object form 我尝试首先转换DateTime
如何使用 Vuejs 加载 url

我正在建立一个包含几篇文章的网站我正在使用 Vue Router 目前我的文章的 url 看起来像 article id 例如 http localhost 8080 article 85 如何在 URL 中添加文章标题以便它可以htt
如何在 Bitbucket wiki 上的 Markdown 中转义“@”

谁知道如何逃脱 BitBucket wiki 上 markdown 中的字符就我而言后面紧跟着恰好是某人的用户名的单词即 blahblah 到目前为止我尝试过的 64 但这些都不起作用屏蔽被忽略当我使用字符代码时它只是按原样输出
DatePickerDialog 首先显示年份选择器

我希望我的 DatePickerDialog 一打开就显示年份列表 For example when I show the dialog I see the calendar view If I tap on the text 1900 t
在 div 类中使用 javascript 搜索文本 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我想制作一个脚本在其中我可以使用 document getElementByClassName 自动搜索某个字符串没有文本框或任何内容
C++/CLR 托管单元测试存在链接器错误

当将任何托管类包含到我的托管单元测试中时编译会输出以下错误 1 gt UnitTest obj error LNK2020 unresolved token 0A000360 extern C int cdecl CrtDbgReport
GCC 的“vstring”是什么？

我读了一些 GCC 错误报告那里的人在谈论 vstring 搜索网络我注意到http gcc gnu org onlinedocs libstdc libstdc html USERS 4 2 vstring 8h html http g
sql server 2008 Management Studio 不检查我的查询的语法

一如既往我的惊讶将会有一个合理的解释但在那之前我有这个查询 delete from Photo where hs id in select hs id from HotelSupplier where id 142 执行得很好后来我
Rails pub/sub 与 faye

在 Rails 应用程序中我使用 Faye 机架适配器来推送通知用于聊天我想将 Faye 用于另一个用例更多推送通知但我似乎无法弄清楚在我的应用程序中可以从后台作业创建模型因此我想在创建模型时刷新我的视图之一例如索引操作
Python3：将PDF下载到内存并将第一页转换为图像

我尝试执行以下操作将 PDF 文件下载到内存将第一页转换为图像将该图像与 tweepy 一起使用我尝试了以下代码但遇到了错误 from PIL import Image from pdf2image import convert

Python3：将PDF下载到内存并将第一页转换为图像

Python3：将PDF下载到内存并将第一页转换为图像 的相关文章

随机推荐

热门标签

Python3：将PDF下载到内存并将第一页转换为图像的相关文章