如何?解析器 PDF 到 Javascript 数组?

2024-01-10

如何使用 JavaScript 手动将 PDF 文档解析为单词数组。我不关心图像、数字、表格——只关心单词,因为我可以将其作为 JavaScript 对象来使用。


有一个著名的 JavaScript 库叫做jspdf https://code.google.com/p/jspdf/. Its getTextContent()函数对你的情况非常有帮助。看看这两个例子:

https://stackoverflow.com/a/20522307/2117492 https://stackoverflow.com/a/20522307/2117492,

https://groups.google.com/d/msg/mozilla.dev.pdf-js/Qzq-xA2MHjs/nmlpttSIJcsJ https://groups.google.com/d/msg/mozilla.dev.pdf-js/Qzq-xA2MHjs/nmlpttSIJcsJ

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何?解析器 PDF 到 Javascript 数组? 的相关文章

  • Javascript 对象属性名称

    在 C 中 可以将对象属性的名称作为字符串值获取 名称 对象 Property gt myProperty 这可以在 Javascript Typescript 中完成吗 Object Keys 是我找到的唯一东西 但它给了我所有的键 示例
  • 以下文档我无法创建 Vue.js 3 的实例

    The code https stackblitz com edit vue ttt file src main js https stackblitz com edit vue ttt file src main js 问题 我正在尝试在
  • 更新存储在 chrome 扩展本地存储中的对象

    我正在开发一个 chrome 扩展 我将存储服务器发送的对象 例如 我将收到 命令 id 1 类型 A 大小 B 优先级 C 如果我有一个数据库 我会将其作为表中的一行插入commands 使用 chrome storage 我将这些对象的
  • onClick 处理程序在每个渲染周期触发

    我有这样的默认状态 this state selectedTab tab1 then 我的渲染方法是这样的 render const selectedTab this state return li tab1 li li tab2 li d
  • 我可以在 GWT 中使用第三方 Javascript 库吗

    例如穆工具 用 js 编码对我来说很舒服 但显然不适合所有人 你当然可以 最好的事情就是给自己写一些好看的JavaScript 覆盖类型 http code google com webtoolkit doc latest DevGuide
  • Apache Thrift Java-Javascript 通信

    我正在编写一个基于 Apache Thrift 的 Java 服务器 它将从 Javascript 客户端接收数据 我已经完成了 Java 服务器 但问题是我可以获得 Javascript 客户端的工作示例 我无法找到一个好的示例 构建文档
  • EmberJS:对象作为查询参数来刷新模型

    我遵循了查询参数指南 http guides emberjs com v1 11 0 routing query params http guides emberjs com v1 11 0 routing query params 而且效
  • 正则表达式中连字符的这种用法有效吗?

    NB I only想知道它是否是正则表达式定义中未转义连字符的有效应用 它是not关于匹配电子邮件 连字符或反斜杠的含义 量词或其他任何内容的问题 另外 请注意 链接的答案并没有真正讨论转义 未转义连字符之间的有效性问题 通常我会像这样声明
  • 检查用户设备的 GPS 是否开启

    我正在使用 jQuery Mobile 和 PHP 开发一个应用程序 我没有使用 Phonegap 或其他框架 我需要找到用户的geolocation 如果用户设备的 GPS 关闭 那么我无法获取位置 现在我需要查找用户设备的 GPS 是否
  • 静态数组VS。 C++11 中的动态数组

    我知道这是一个非常古老的争论 全世界已经讨论过很多次了 但我目前很难决定在特定情况下应该使用静态数组和动态数组之间的哪种方法而不是另一种方法 实际上 我不会使用 C 11 我会使用静态数组 但我现在很困惑 因为两者可能有相同的好处 第一个解
  • 使用 float:left 与 display:inline-block 的 jQuery UI 拖放排序比较

    我这里有两个例子 这两个例子之间的唯一区别是 一种使用display inline block 另一种使用float left li doc item 显示 内联块 与 li doc item float left 我的问题是 displa
  • jquery 中的函数返回未定义[重复]

    这个问题在这里已经有答案了 我在 jquery 中调用的函数返回未定义 我检查了该函数 当我对其进行调试时 它返回正确的数据 function addToPlaylist component type add to pl value pl
  • 从链接打开本地文件夹

    如何通过单击任何链接打开本地文件夹视图 我尝试了很多选择 例如 a href Open folder a or a Open folder a or a Open folder a 解决方案 启动可下载链接 以下内容适用于所有浏览器 但一如
  • 轮播滑动(未滑动)事件上的火灾事件,Bootstrap 3

    Bootstrap 2 似乎可以很好地处理幻灯片事件 请参阅这个问题 https stackoverflow com questions 9651466 how to attach slide slid events to the boot
  • 如何将MathJax公式转换为img

    Mathjax 现在在我的项目中运行良好 但有一个问题 有没有办法将MathJax的公式 纯html和css 转换成img文件 我可以保存 MathJax 可以配置为生成 SVG 看http docs mathjax org en late
  • onPress 方法中箭头函数与普通函数的行为

    正在学习 Native React 并学习更多关于 javascript 的知识 所以我仍然不明白它的行为的很多事情 我使用 TouchableOpacity 及其 onPress 属性创建了一个按钮组件 为了让它工作 我必须发送我想要执行
  • 如何跨多个文件跨越 javascript 命名空间?

    我永远忽略了javascript 几年前我开始使用 jQuery 这样我就可以过得去 但随着我开始更多地进行 TDD 我昨天决定真正深入研究 javascript 之后可能还有咖啡脚本 在我的 ASP NET Web 窗体应用程序中 我有很
  • 如何缩短 PHP if 语句?

    我有一个 if 语句 我需要将单个字符串与许多不同的选项进行比较 我在下面发布的代码非常清楚地表明了我的意思 我知道有两种方法可以做到这一点 但另一种甚至更长 那么 是否有任何函数可以以更短的方式实现类似的功能 我的要求可能看起来很愚蠢 但
  • 为什么 JavaScript 中是 [1,2] + [3,4] = "1,23,4" ?

    我想将一个数组的元素添加到另一个数组中 所以我尝试了以下方法 1 2 3 4 它的回应是 1 23 4 到底是怎么回事 The 操作员没有为数组定义 发生的事情是 JavaScript将数组转换为字符串并将它们连接起来 Update 由于这
  • JavaScript 阶乘防止无穷大

    我一直在 JavaScript 中使用这个函数来计算阶乘数 var f function factorial n if n 0 n 1 return 1 if f n gt 0 return f n return f n factorial

随机推荐

  • azure devops 本地代理管道权限被拒绝

    我有一个 python 脚本 可以在远程 SUT 上执行自动化脚本 并且考虑到该脚本在使用用户 tester 和密码 xxx 在本地执行时正常工作 当我构建 DevOps Azure 管道时 我已从 GIT 将项目签出到代理中 然后尝试从命
  • PHP 中传递给 exec 的命令长度有限制吗?

    目前我需要将 50 多个 PDF 文件合并为 1 个 PDF 我正在使用 PDFTK 使用以下指南 http www johnboy com blog merge multiple pdf files with php http www j
  • 如何关闭hbm2ddl?

    我找不到有关如何关闭 hbm2ddl 的参考 只是省略hibernate hbm2ddl auto默认情况下 Hibernate 不执行任何操作 来自参考文档 1 1 4 休眠配置 http docs jboss org hibernate
  • Mysql 查询发布日期减去 7 天

    这不断出现错误 我不明白为什么 SELECT i user id FROM SELECT SUM us score AS score sum us user id FROM user scores us WHERE us created g
  • 特殊字符未按预期显示

    我有以下简单的 HTML 页面 div m ywe div 当在 Chrome 或 Firefox 中显示它时 我没有测试其他浏览器 我看到以下内容 m ywe 我错过了什么 html 文件以 UTF 8
  • 将 JSON 数据写入磁盘

    编写 JSON 数据 NSDictionary 并再次读取它的最简单方法是什么 我知道有 NSFileManager 但是有没有一个开源框架库可以使这个过程变得更容易 iOS5 NSJSONSerialization 类是否支持将数据写入磁
  • 带有 jquery 的 Django 模板:现有页面上的 Ajax 更新

    我有一个带有表单的 Google App Engine 当用户单击提交按钮时 将调用 AJAX 操作 服务器将输出一些内容并附加到其来源页面的末尾 怎么样 我有一个 Django 模板 我打算使用 jquery 我有以下观点 welcome
  • 传感器的本机模块不可用。 React-Native链接运行成功了吗?

    我遵循了第一步React Native教程在这里 https facebook github io react native docs getting started html https facebook github io react
  • 在 Primefaces 中的不同布局单元之间拖放

    我在全页 Primefaces 布局中有 4 个布局单元 我在西布局单元中有输出标签 我想将其拖放到中心布局单元 我想要将输出标签拖放到此处的拖放区域是 tabView 中的一个面板 当我开始拖动outputLabel时 它不会从西布局单元
  • Snakemake:如何记录由 script 指令执行的 python 脚本?

    有没有什么方法可以轻松保存来自snakemake规则执行python脚本的日志script指示 该脚本使用的库已经有一些集成的日志记录 我想存储它们的日志 我不想使用shell or run指令 因为在使用 python 脚本时它们都不太舒
  • 用于读写的 Java FileLock

    我有一个进程 会从 cron 中频繁调用来读取其中包含某些与移动相关的命令的文件 我的进程需要读取和写入此数据文件 并将其锁定以防止其他进程在此期间接触它 用户可以执行完全独立的过程来 可能 写入 附加到同一数据文件 我希望这两个进程能够正
  • 在 Heroku 应用程序之间共享 Python 代码

    我有 2 个 Heroku 应用程序 都是 Pyhon 以及它们之间共享的一些 python 模块 即 它们在两个应用程序中是相同的 设置 git requirements txt 以实现以下目标的最佳方法是什么 共享代码是版本化的 也就是
  • 有没有办法在打字稿中实例化通用文字类型?

    我想做一些可能非正统的事情 如果我们诚实的话 几乎没有用 所以我们开始 我想传递一个文字作为通用参数 然后实例化它 考虑以下示例 const log console log class Root
  • 在 apache httpd 反向代理和 Tomcats 之间进行双向 SSL 身份验证

    我有一个 Apache HTTPD 作为反向代理 还有 Tomcat 6 0 35 服务器 我想要实现的是 Tomcat 服务器和反向代理之间存在相互信任 这意味着当反向代理转发请求时 它将提供自己的证书 该证书将被导入到 Tomcat 的
  • Bash 管道到 python

    我需要通过管道实时吸收 bash 命令的输出 例如 for i in seq 1 4 do echo i sleep 1 done script py script py 哪里有这个 for line in sys stdin readli
  • Objective-C:如何在运行时更改对象的类?

    我试图回答将 UITableView 子类与 UITableViewController 一起使用 https stackoverflow com questions 874906 using a uitableview subclass
  • 在Python中使用psycopg2获取插入行到Redshift表的自动ID

    我正在将一条记录插入亚马逊红移表来自Python 2 7 using psycopg2库 我想取回插入行的自动生成主 ID 我尝试了使用谷歌搜索在这里或其他网站中找到的常用方法 例如 conn psycopg2 connect conn s
  • 在 BigQuery 中“创建表为”

    如何根据结果创建表格select在 BigQuery 中查询 例如 create table abc as select x y z from mnp 有什么方法或解决方法可以在 BigQuery 中实现相同的目的吗 有线索吗 只需尝试在创
  • 如何从 Codeigniter 中的控制器调用模型?

    我想要一个网页 主要内容是通过ajax视图使用的 和一个菜单侧边栏 我的应用程序视图文件夹是 pages home templates header footer 我的主页控制器是
  • 如何?解析器 PDF 到 Javascript 数组?

    如何使用 JavaScript 手动将 PDF 文档解析为单词数组 我不关心图像 数字 表格 只关心单词 因为我可以将其作为 JavaScript 对象来使用 有一个著名的 JavaScript 库叫做jspdf https code go