Windows 安装pdf2image运行后遇到PDFInfoNotInstalledError解决办法

2023-10-27

最近在学习图像处理,需要安装pdf2image,安装没有报错,运行之后报错:

pdf2image.exceptions.PDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?

一开始是想直接安装PDFInfo,或者poppler,但是都安装失败。按照网友提示安装python-poppler也因为ndk版本不对失败。

最终解决办法:

首先通过poppler-windows下载地址下载压缩包

然后解压到自定义文件目录,随后添加到环境变量。

最后就是更改安装包内的pdf2image.py中的poppler路径pdf2image.py安装目录

def convert_from_path(
    pdf_path,
    dpi=200,
    output_folder=None,
    first_page=None,
    last_page=None,
    fmt="ppm",
    jpegopt=None,
    thread_count=1,
    userpw=None,
    use_cropbox=False,
    strict=False,
    transparent=False,
    single_file=False,
    output_file=uuid_generator(),
    poppler_path=r'D:\poppler-0.68.0\bin',  #将这里改为你解压安装的poppler路径
    grayscale=False,
    size=None,
    paths_only=False,
    use_pdftocairo=False,
    timeout=None,

以上。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Windows 安装pdf2image运行后遇到PDFInfoNotInstalledError解决办法 的相关文章

  • Python 中的字节数组

    如何在 Python 中表示字节数组 如 Java 中的 byte 我需要用 gevent 通过网络发送它 byte key 0x13 0x00 0x00 0x00 0x08 0x00 在Python 3中 我们使用bytes对象 也称为s
  • Kivy - 文本换行工作错误

    我正在尝试在 Kivy 1 8 0 应用程序中换行文本 当没有太多文字时 一切正常 但如果文本很长并且窗口不是很大 它只是剪切文本 这是示例代码 vbox BoxLayout orientation vertical size hint y
  • 将 numpy 数组写入文本文件的速度

    我需要将一个非常 高 的两列数组写入文本文件 而且速度非常慢 我发现如果我将数组改造成更宽的数组 写入速度会快得多 例如 import time import numpy as np dataMat1 np random rand 1000
  • 如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器?

    如何在 PyCharm 4 5 2 中使用 PyPy 作为标准 默认解释器 一切都在 Ubunutu 14 10 下运行 并且 pypy 已经安装 您可以在项目的设置下进行配置 这个官方文档直接涵盖了 https www jetbrains
  • 了解 Python 中的酸洗

    我最近接到一项作业 需要以腌制形式放置一本字典 其中每个键引用一个列表 唯一的问题是我不知道腌制形式是什么 谁能给我指出一些好的资源的正确方向来帮助我学习这个概念 pickle 模块实现了一个基本但强大的算法 用于序列化和反序列化 Pyth
  • 当我在 Pandas 中使用 df.corr 时,我的一些列丢失了

    这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
  • 登录网站并使用 python 请求下载文件

    我有一个带有 HTML 表单的网站 登录后 它会将我带到 start php 站点 然后将我重定向到overview php 我想从该服务器下载文件 当我单击 ZIP 文件的下载链接时 链接后面的地址是 getimage php path
  • 使用 scipy curve_fit 拟合噪声指数的建议?

    我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
  • Apache Spark 中的高效字符串匹配

    我使用 OCR 工具从屏幕截图中提取文本 每个大约 1 5 句话 然而 当手动验证提取的文本时 我注意到时不时会出现一些错误 鉴于文本 你好 我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被 替换 2 表情符号未被正确提
  • 乘以行并按单元格值附加到数据框

    考虑以下数据框 df pd DataFrame X a b c d Y a b d e Z a b c d 1 2 1 3 df 我想在 列中附加数字大于 1 的行 并在该行中的数字减 1 df 最好应该 然后看起来像这样 或者它可能看起来
  • Python 惰性迭代器

    我试图了解迭代器表达式如何以及何时被求值 以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而 这个在构造上失败了 g line strip for line in open xxx r if
  • PyTorch DataLoader 对并行运行的批次使用相同的随机种子

    有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中 当并行加载批次时Da
  • 将文本注释到轴并对齐为圆

    我正在尝试在轴上绘制文本并将该文本与圆对齐 更准确地说 有一些具有不同坐标 x y 的点位于该圆内 并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义 因此
  • 由于 json 字符串化 dict 键导致数据丢失

    考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
  • 如何使用 Keras ImageDataGenerator 预测单个图像?

    我已经训练 CNN 对图像进行 3 类分类 在训练模型时 我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它 现在我的网络在测试集上训练得非常准确 但我不知道如何在单图像预测上应用预处理功能 如
  • 处理大文件的最快方法?

    我有多个 3 GB 制表符分隔文件 每个文件中有 2000 万行 所有行都必须独立处理 任何两行之间没有关系 我的问题是 什么会更快 逐行阅读 with open as infile for line in infile 将文件分块读入内存
  • Pandas - 合并数据框以将所有值保留在左侧,如果“左侧没有键”,则从右侧“插入”值,否则“更新”左侧现有的“键”

    我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
  • 更改 Python Cmd 模块处理自动完成的方式

    我有一个 Cmd 控制台 设置为自动完成 Magic the Gathering 收藏管理系统的卡牌名称 它使用文本参数在数据库中查询卡片 并使用结果自动完成 建议卡片 然而 这些卡片名称有多个单词 Cmd 会从last到行尾的空间 例如
  • Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

    只是一个问题 我试图将 csv 文件中的选定行写入新的 csv 文件 但出现错误 我试图读取的 test csv 文件是这样的 两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
  • Python:高精度time.sleep

    你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗 您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以

随机推荐

  • Vscode 使用插件 code runner 运行php 配置方法

    1 Vscode 插件中心搜索插件Code Runner 正常安装 2 打开设置页面 快捷键 Ctrl 直接打开 设置搜索输入 code runner map 打开settings json 配置 3 图中红框处的php配置修改为你电脑ph
  • css自定义属性/css变量

    css自定义属性 css变量 由自定义属性标记设定值 由 var 函数来获取值 属性名需要以两个减号 开始 全局变量 在 root伪类上定义自定义属性 可以在 HTML 文档中全局应用它 局部变量 在选择器中定义的变量 或 在标签中定义的变
  • Raspberry Pi Pico使用MicroPython---(4)

    这一次我们使用Raspberry pi pico点亮ST7735驱动的1 8寸RGB的TFT屏幕 网络的资料比较少 通过bing com能查到使用Arduino写的例程 这里我们还是采用熟悉的Micropython编程 这里主要参考的是 G
  • python 文件查找性能对比 python与powershell

    目录 6万行的文本文件 python遍历查找和powerchell 查找方式对比 代码 结论
  • 【计算机网络】网络数据传输流程详解

    目录 1 基础知识 1 1 IP地址 1 2 子网掩码 1 3 MAC地址 1 4 网络传输遇到的设备 1 4 1 集线器 1 4 2 交换机 1 4 3 主机 1 4 5 路由器 1 5 冲突域 1 6 广播域 2 局域网数据传输流程 2
  • PandoraBox 挂载不上摄像头,求大佬指导!

    PandoraBox 挂载不上摄像头 求大佬指导 安装好驱动 以及mjpg streamer Base on LEDE OpenWrt 19 09 r5054 2019 09 07 git b7ad7d224 更新一下 root Pando
  • Vue - 项目中使用iconfont(阿里图标库)

    项目中如何使用iconfont 阿里图标库 一 登陆iconfont官网 https www iconfont cn 二 创建一个图标项目 1 点击 图标管理 子目录中的子目录 我的项目 进入个人图标项目 2 点击创建一个图标项目 三 将需
  • 走进包装类

    引入 Java认为一切皆对象 引用数据类型就是对象 但是在Java中8中基本数据类型不是对象 只是表示一种数据的类型形式 Java为了一切皆对象的思想统一 把8中基本数据类型转换成对应的类 这个类称为基本数据类型的包装类 基本数据类型 包装
  • vue运行后没有显示内容

    运行成功没有报错但是就是不显示内容 进浏览器看到控制台的报错信息 vue runtime esm js c320 4573 Vue warn Property or method yzmStr is not defined on the i
  • 如何使用cookie信息,完成自动登录

    在做爬虫任务的时候 我们常常会遇到很多网页必须登录后 才可以开放某些页面 所以登录是爬取网页的第一步 但是 通过post表单 包含用户名和密码 的方法 对于那些不需要输入比较复杂的验证码的网页 可以使用正则表达式将验证码和验证码的ID匹配得
  • MMEditing环境配置

    MMEditing环境配置 MMEditing is an open source image and video editing toolbox based on PyTorch It is a part of the OpenMMLab
  • ZynqMP Petalinux2021.1设置工程离线编译

    前言 Ubuntu18 04安装Petalinux 2021 1 sudaroot的博客 CSDN博客 介绍 PetaLinux基于Yocto 每次创建或者编译工程下载都需要联网下载工程所需文件 且下载的文件非常庞大 这就导致编译速度还受网
  • 《Python量化投资》01 量化投资之单因子测试(概述,Pandas的适用)

    一 股票aplha多因子策略介绍 量化投资是指通过数量化方式及计算机程序化发出买卖指令 以获取稳定收益为目的的交易方式 在海外的发展已有30多年的历史 其投资业绩稳定 市场规模和份额不断扩大 得到了越来越多投资者认可 从全球市场的参与主体来
  • C#简单操作MongoDB

    新建一个窗体程序 使用Nuget安装mongodb driver 或者直接引用dll如下 代码 using System using System Collections Generic using System ComponentMode
  • Shader编程学习笔记(二)—— Shader和渲染管线

    http www cnblogs com maple share p 5395097 html Shader和渲染管线 什么是Shader Shader 中文翻译即着色器 是一种较为短小的程序片段 用于告诉图形硬件如何计算和输出图像 过去由
  • i2c

    I2C是由Philips公司发明的一种串行数据通信协议 仅使用两根信号线 SerialClock 简称SCL 和SerialData 简称SDA I2C是总线结构 1个Master 1个或多个Slave 各Slave设备以7位地址区分 地址
  • 使用Python3解压gz、tar、tgz、zip、rar五种格式的压缩文件例子

    使用Python3解压如下五种压缩文件 gz tar tgz zip rar 简介 gz 即gzip 通常只能压缩一个文件 与tar结合起来就可以实现先打包 再压缩 tar linux系统下的打包工具 只打包 不压缩 tgz 即tar gz
  • Chrome-网页另存为单个网页文件后,单个网页文件无法正常显示的问题

    通过Chrome浏览器另存单个网页文件 再次打开出现时出现下图效果 将存储的单个网页文件的扩展名由html修改为mhtml即解决该问题
  • 数据库的可伸缩性的探索

    数据库的可伸缩性的探索 Author skate Time 2009 5 30 数据库在当今社会越来越重要 尤其对于一个发展迅速的企业 其数据是爆炸式的发展 为了适应其数据的发展 对数据库的架构体系设计要求也越来越高 它要可以方便的线形扩展
  • Windows 安装pdf2image运行后遇到PDFInfoNotInstalledError解决办法

    最近在学习图像处理 需要安装pdf2image 安装没有报错 运行之后报错 pdf2image exceptions PDFInfoNotInstalledError Unable to get page count Is poppler