如何使用nodejs读取.pdf文件的内容?

2023-12-11

我有一个自动化 PDF 内容的方案。如何在nodejs中检索PDF文件的内容。

我对此完全被封锁了。虽然帖子很少pdf2jsona and jsonreader但那些对我不起作用。任何帮助将不胜感激。

var pdfParser = new PDFParser();
fs.readFile(pdfFilePath, function(err, pdfBuffer) {
    pdfParser.parseBuffer(pdfBuffer);
}, function(pdfBuffer){
    pdfParser.parseBuffer(pdfBuffer);
})

错误:参数数组无效,需要 .data 或 .url 在 FSReqWrap.readFileAfterClose [作为未完成] (fs.js:445:3)


 const fs = require("fs");
 const PdfReader = require('pdfreader').PdfReader;
  fs.readFile("E://file streaming in node js//demo//read.pdf", (err, pdfBuffer) => {
    // pdfBuffer contains the file content
    new PdfReader().parseBuffer(pdfBuffer, function(err, item){
       if (err)
           callback(err);
        else if (!item)
            callback();
         else if (item.text)
            console.log(item.text);
          });
       });
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用nodejs读取.pdf文件的内容? 的相关文章

随机推荐

  • 仅将元素放入 iframe 内,否则恢复

    EDIT 1 这是drag html 主页
  • 如何在具有多个域的 ASP.NET MVC4 应用程序中允许 Windows 身份验证?

    关于 MVC4 应用程序中的 Windows Auth 的两个问题 如何设置才能针对两个 Windows 域进行身份验证 我正在尝试做的事情 Authorize Roles DOMAINONE Group Name public class
  • 相互依赖的类模板和 std::is_base_of 专业化

    我对以下情况感到有点困惑 我在其中启用了专业化is base of is base of需要正在检查的类型的完整定义可用 但是 正在专门化的类型被用作正在检查的基类的类型的成员 因此两者都需要在另一个之前定义 并且我无法转发声明继承关系 令
  • onActivityResult 中的空意图附加内容

    我有两项活动 首先像这样调用第二个 Intent intent new Intent this Second class startActivityForResult intent 1 返回第二个数据 Intent intent new I
  • 使用 Google Maps SDK 在地图上绘制错误的折线

    我正在尝试使用 Google Maps SDK 在地图上绘制路线 This是我正在调用的 URL 我解析对坐标数组的 JSON 响应 id jsonResponse NSJSONSerialization JSONObjectWithDat
  • 在 C++ 程序中添加不必要的大括号 { } 是否会减慢速度?

    这可能是一个愚蠢的问题 但我对 C 和一般编程很陌生 我在这里找不到答案 我知道在 C 中 在某些情况下是可选的 例如 如果您有一个简单的 if 语句 其中仅执行一个操作 则不需要用 将其括起来 我只是想知道额外的括号是否对程序的速度有任何
  • 使用链接器脚本重命名符号

    是否可以使用链接描述文件或映射文件来重命名符号 我正在尝试修改一些用 C 和 Fortran 混合编写的代码 以便它可以在 Linux 上与多个 Fortran 编译器一起工作 目前它是为 Solaris Studio 编译器编写的 并且启
  • Volley - NetworkImageView 有时不显示错误图像?

    所以我决定尝试一下新的排球库如上所示谷歌IO 2013 我在使用简单的解决方案时尝试过NetworkImageView在一个上显示多个图像GridView 它运行良好并显示图像 但如果我让它下载图像 然后在下载过程中关闭 WiFi 它不会显
  • Visual Studio 2010 Professional Beta 2 上的 Windows Mobile 6 Standard SDK 刷新安装问题

    当我安装Windows Mobile 6 标准 SDK 更新我收到错误 未安装 Visual Studio 2005 SP1 或更高版本 我安装了 Visual Studio 2010 Professional Beta 2 请你告诉我如何
  • 使用 props 以纯文本或数组访问对象路径

    考虑以下对象和存储在对象内的值的路径 var obj a 1 b a x 2 b 3 c 4 var path b a x 获取对象路径中的内容的最佳方法 最佳性能 是什么 使用 eval path obj concat path var
  • vba中dim和set有什么区别

    请原谅我 我是 VBA 新手 有时我用 Dim r as Range r Range A1 其他时候我用 Set r Range A1 有什么不同 我什么时候应该使用什么 没有理由使用set除非引用对象引用 最好只在这种情况下使用它 对于所
  • 画布上的 Android Center 文本

    我正在尝试使用下面的代码显示文本 问题是文本没有水平居中 当我设置坐标时drawText 它将文本的底部设置在此位置 我希望绘制文本 以便文本也水平居中 这是进一步显示我的问题的图片 Override protected void onDr
  • Toast 类型中的方法 makeText 不适用于参数

    我正在使用 ViewPagerIndicator 并尝试使用 Toast 在滚动到下一个片段页面时显示 我收到以下错误 The method makeText Context CharSequence int in the type Toa
  • C# 获取文件更改事件

    我确实有一个程序可以在文本文件中记录一些特定事件 它使文件保持打开状态 现在我想编写第二个应用程序 在表单上显示这些日志 我可以为另一个进程打开的文本文件中的任何更改设置事件吗 或者我必须定期阅读 thanks 看看文件系统观察者类
  • 选择对不同数据库服务器上的 2 个表进行查询

    我试图通过在经典 ASP 中查询 2 个数据库 Sybase 来生成报告 我创建了 2 个连接字符串 数据库的 connA数据库 B 的 connB 两个数据库都存在于同一服务器上 不知道这是否重要 Queries q1 SELECT co
  • 如何读写Excel文件

    我想从 Java 读取和写入一个 3 列 N 行的 Excel 文件 在每个单元格中打印一个字符串 谁能给我简单的代码片段 我是否需要使用任何外部库或者 Java 是否有内置支持 我想做以下事情 for i 0 i
  • 尝试从谷歌搜索编辑框获取并打印数据,但出现 InvalidElementStateException

    我试图在谷歌搜索编辑框中写一个单词并捕获所有相关的列表项并显示它 但在这样做时我遇到了例外 org openqa selenium InvalidElementStateException 元素已禁用 因此不能用于操作 我经历了相同的异常相
  • 如何从另一个组件调用一个组件方法?

    我有一个包含按钮的标题组件 我希望该按钮在单击时显示另一个组件 模式页面 我可以做这样的事情吗 这是我的标题组件 import ComponentToDisplay from components ComponentToDisplay in
  • DirectShow 过滤器未显示为输入捕获设备

    从捕获源过滤器的优秀示例开始here我编写了自己的输入捕获设备 该设备在 Graph Studio Next 中运行良好 但在 Skype 或类似应用程序中并未显示为捕获设备 即网络摄像头 因为我想了解发生了什么 所以我请您帮助我找出那些应
  • 如何使用nodejs读取.pdf文件的内容?

    我有一个自动化 PDF 内容的方案 如何在nodejs中检索PDF文件的内容 我对此完全被封锁了 虽然帖子很少pdf2jsona and jsonreader但那些对我不起作用 任何帮助将不胜感激 var pdfParser new PDF