我的目标是在我的 JavaFX 应用程序中显示 pdf 文档。经过研究,我发现了 Mozilla 的 PDFJS 库,发现它非常有用。我正在做的是从 JAVA 读取 PDF 文件作为字节数组,并在 Web 视图中调用 js 代码。这是代码。
JAVA代码
byte[] data = Files.readAllBytes(Paths.get("D:\\test\\test.pdf"));
String base64 = Base64.getEncoder().encodeToString(data);
btn.setOnMouseClicked(e -> {
String js = "openFileFromBase64('" + base64 + "')";
engine.executeScript(js);
});
JavaScript 代码
<script>
var openFileFromBase64 = function(data) {
var arr = base64ToArrayBuffer(data);
PDFViewerApplication.open(arr);
}
function base64ToArrayBuffer(base64) {
var binary_string = window.atob(base64);
var len = binary_string.length;
var bytes = new Uint8Array(new ArrayBuffer(len));
alert(len);
for (var i = 0; i < len; i++) {
bytes[i] = binary_string.charCodeAt(i);
}
return bytes.buffer;
}
Problem
我可以很好地渲染一些 pdf 文件,但有些 pdf 文件无法正确打开。所以我做了一些分析并发现以下内容:-
有问题的 pdf 文件可以在 adobe reader、firefox 和 Edge 浏览器中正确打开。
我认为问题可能出在 PDFJS 库上。所以我尝试将我的pdf文件放在WEB目录中并打开viewer.html。出乎我的意料
pdf正确显示。
我认为当我将数据从 Java 发送到 Javascript 时,可能会丢失一些字节。所以我在每一端打印了字节数,它们匹配。
最后,我认为java可能搞乱了编码。所以我从java读取文件并将字节写入单独的文件,生成的文件是正确的。
我试图了解我是否忽略了某些事情。任何建议表示赞赏。提前致谢。
Here is how my pdf looks like after it is rendered:-
我有同样的问题:没有文本可以正确呈现截至今天,在 JavaFX WebView 中使用 PDF.js 的当前稳定版本(v2.0.943)。基于图像的 PDF 可以正确呈现。
查看 PDF.js 发行说明,我发现v2.0.943 https://github.com/mozilla/pdf.js/releases/tag/v2.0.943引入了许多与字体相关的更改,并且似乎破坏了 JavaFX 中的字体渲染。
好消息是当前预发布, v2.1.266 https://github.com/mozilla/pdf.js/releases/tag/v2.1.266 has 一些错误修正 https://github.com/mozilla/pdf.js/pull/10539关于字体的处理及其修复文本渲染问题在 JavaFX Web 视图中。
如果您觉得使用预发行版感到不舒服,您可以使用v1.10.100 https://github.com/mozilla/pdf.js/releases/tag/v1.10.100,文本渲染也适用于此版本,尽管我建议使用最新版本,因为它似乎可以更好地渲染不同的字体。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)