这是一个 pdf 文档的示例,我需要从中提取用户的选择http://www.ada.gov/hospcombrprt.pdf http://www.ada.gov/hospcombrprt.pdf。如果我们查看页面源代码,我们将看到如下内容:
<html>
<body marginwidth="0" marginheight="0" style="background-color: rgb(38,38,38)">
<embed width="100%" height="100%" name="plugin"
src="http://www.ada.gov/hospcombrprt.pdf" type="application/pdf">
</body>
</html>
我们如何从这个嵌入的 pdf 中获取用户的选择?
我发现了一篇关于从 pdf 文档中提取全文的帖子here https://stackoverflow.com/questions/1554280/extract-text-from-pdf-in-javascript和我的帖子类似here https://stackoverflow.com/questions/17774634/is-it-possible-to-extract-the-text-selected-by-the-user-in-a-pdf那里写着不存在这种可能性。
但应该有一些出路。也许可以提取整个文本,然后以某种方式确定选择了什么?或者通过鼠标按下和向上事件上的鼠标光标位置来确定选择?将不胜感激任何想法。
我怀疑这是可能的 - 如果是的话,就不会有通用的解决方案,因为每个 PDF 查看器都是不同的。
并非每个人都使用 Adobe 自己的 Acrobat 插件。福昕很受欢迎。这两个插件很可能不提供访问此信息的接口。
Chrome 和 Firefox 等一些浏览器现在提供内置 PDF 查看器,其工作方式与插件完全不同。
另外,您是否在不同的域上访问 PDF?在这种情况下,同源策略无论如何都会阻止访问此类信息。
最后,您需要考虑到并非每个用户都喜欢使用(甚至被允许使用)PDF 浏览器插件,因此您的“解决方案”在这些情况下将不起作用。
还有一点:事实上,您正在使用非常过时的embed
元素而不是object
表明您正在使用非常古老的知识。
您可能需要退后一步,真正重新考虑您在这里想要做什么。更大的图景是什么?你想达到什么目的?
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)