我正在他们的 github 上关注他们的“代码示例”指南。https://github.com/modesty/pdf2json#code-example https://github.com/modesty/pdf2json#code-example
在“解析 PDF 然后写入 .txt 文件(仅包含 PDF 的文本内容)”的示例中,我将确切的实现复制并粘贴到本地 JavaScript 文件中并调用它,但输出文本文件完全是空白的。
'use strict';
let fs = require('fs');
let PDFParser = require("pdf2json");
let pdfParser = new PDFParser();
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
fs.writeFile("./node_modules/pdf2json/test/F1040EZ.content.txt", pdfParser.getRawTextContent());
});
pdfParser.loadPDF("./node_modules/pdf2json/test/pdf/fd/form/F1040EZ.pdf");
难道是我做错了什么?或者这对他们来说不起作用?另外,在没有安装额外二进制文件的情况下,Nodejs 是否有任何替代 pdf 到文本转换器的方法?
首页文档有点错误!为了使这项工作简单地设置为 PDFParser 参数 null 和 1
这个有效:
var fs = require("fs");
// https://github.com/modesty/pdf2json
var PDFParser = require("./node_modules/pdf2json/PDFParser");
var pdfParser = new PDFParser(this,1);
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError));
pdfParser.on("pdfParser_dataReady", pdfData => {
console.log(pdfParser)
fs.writeFile("./content.txt", pdfParser.getRawTextContent());
});
华泰
-XDVarpunen
pdf2json 中问题的链接:https://github.com/modesty/pdf2json/issues/76 https://github.com/modesty/pdf2json/issues/76
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)