如何使用 Node JS / Webdriver.io / Chimp 打印为 PDF?

2024-04-12

我正在尝试在 Node JS 中使用 Chimp / Webdriver.io / Selenium 来测试我的@media printCSS 确保当人们从我的网站打印时一切都正确显示。

如何以编程方式让 Chrome / Firefox 打印为 PDF?我不想将屏幕截图转换为 PDF。我希望 PDF 看起来像打印时的样子。

那么,如何扫描PDF以确保结果正确呢?


成功!我必须安装/使用以下工具:

npm install html-pdf-chrome --save-dev
npm install pdfreader --save-dev

html-pdf-chrome https://github.com/westy92/html-pdf-chrome用于神奇地调用 Chrome 以 Chrome 通常用于打印的方式将某些给定的 HTML 转换为 PDF。pdf阅读器 https://github.com/adrienjoly/npm-pdfreader是一个读取 PDF 并提供其中文本的包。

浏览到我想使用 webdriver 打印的页面后,我可以调用:

this.When(/^I print the page to a PDF named "([^"]*)"$/,
  async function(outputFilename) {

    console.log("Getting the html...");
    let sourceHTML = await browser.getSource();

    console.log("Printing the html using Chrome...");
    let pdf = await HtmlPdf.create(sourceHTML);

    console.log("Saving the PDF to " + outputFilename + "...");
    await pdf.toFile(path.join(DEFAULT_PRINT_PATH, outputFilename));
  });

然后,为了获取 PDF 中的文本,我调用此函数:

function readPdfText(filename) {
  return new Promise((resolve, reject) => {
    let pdfText = "";
    new pdfReader.PdfReader().parseFileItems(path.join(DEFAULT_PRINT_PATH, filename), function(err, item){
      if (err){
        console.log("Error received on parsing PDF: " + err, err.stack);
        reject(err);
      }
      else if (!item) {
        resolve(pdfText);
      }
      else if (item.text) {
        if(item.text.trim() === ":") {
          pdfText += item.text;
        } else {
          pdfText += "\n" + item.text;
        }
      }
    });
  });
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Node JS / Webdriver.io / Chimp 打印为 PDF? 的相关文章

  • Nodejs + mongodb:如何查询 $ref 字段?

    我将 MongoDB 与 Nodejs REST 服务一起使用 该服务公开了存储在其中的数据 我有一个关于如何查询使用 ref 的数据的问题 这是一个对象的示例 其中包含对花药集合中另一个对象 详细信息 的引用 id ObjectId 59
  • npm install 冻结并显示 IdealTree:chatting: sill IdealTree buildDeps

    当我安装任何东西时 npm 冻结了 即使删除 package lock json 也没有任何变化 这里有一个类似的问题 https stackoverflow com questions 50522376 npm install hangs
  • Node.js 子进程

    我试图弄清楚这对于 node js 子进程来说是否是一个不错的用例 我有一款多人游戏 人们可以进行 1v1 比赛 我应该为每场比赛使用子进程吗 并不是真的需要 由于节点是基于事件的 并且单个进程将能够处理数千个这样的玩家对 您将为每个这样的
  • npm 安装旧版本的(typescript 编译器)包

    在Windows环境下 我有 节点 v4 6 0 npm v3 10 8 我的本地打字稿版本是 npm run tsc v 3 10 8 但是 我有时想使用我的全局 tsc 因为出于某种原因 gulp 使用全局 tsc 但是当我这样做时 n
  • 如何在 Node.js 中将 HTML 转换为图像

    我需要在 Node 服务器上将 HTML 模板转换为图像 服务器将以字符串形式接收 HTML 我尝试过 PhantomJS 使用一个名为 Webshot 的库 但它不能很好地与 Flex 框和现代 CSS 配合使用 我尝试使用 Chrome
  • 元素不存在,尽管它具有 ID 属性

    在 selenium excel vba 中 我试图了解有关如何处理 CSS 选择器的更多信息 我很想知道 因为在检查带有 ID 的元素并运行代码时 我收到一条消息 指出未找到该元素 这是到目前为止的代码 Private bot As Ne
  • 在 ExpressJS 中通过管道传送远程文件

    我想读取远程图像并显示它 我可以保存文件 但无法正确显示代码 理想情况下 我只想直接传递文件而不进行处理 不确定是否需要 tmp 文件步骤 此代码不显示任何内容 没有错误 我也尝试了 res pipe response var url ht
  • 如何使用restify上传文件

    我正在尝试使用 Restify 模块将图像文件上传到 Rest 服务器 更具体地说是 Confluence 但出现断言错误 我不确定我是否使用正确的方法将文件上传到 REST 服务器 有人能指出我正确的方向吗 这是我的尝试 var rest
  • npm 脚本:node-sass 不监视部分 sass 文件

    我有这个项目结构 src assets css sass main scss variables scss 我正在尝试编写一个 npm 脚本 该脚本将监视我的所有 scss 文件 包括部分文件 中的更改 然后仅编译我的 main scss
  • npm install -D sass-loader node-sass Vue.js 2021

    您好 问题是为 Vue js 设置 SASS 我跑 Node js 15 7 0 Vue js vue cli 4 5 11 这是我在运行此命令时在控制台中遇到的错误 npm install D sass loader 节点 sass np
  • 设计 Javascript 前端 <-> C++ 后端通信

    在我最近的将来 我将不得不制作一个具有 C 后端和 Web 前端的系统 要求 目前 我对此了解不多 我认为前端将触发数据传输 而不是后端 所以不需要类似 Comet 的东西 由于在该领域的经验可能很少 我非常感谢您对我所做的设计决策的评论
  • 垃圾收集器不适用于 NodeJS / Chrome 中的类型化数组

    我最初将其记录为原项目中的一个问题 https github com nodejs help issues 3590 它立即转移到帮助主题 没有很好的解释 所以现在我想在这里提问 如果我们在 NodeJS v14 v16 v17 中运行以下
  • 我可以在 Node 的标头中发送带有 cookie 的 GET 请求吗?

    在浏览器中 如果我发送 GET 请求 该请求同时会发送 cookie 现在我想模拟Node的GET请求 那么代码怎么写呢 使用奇妙的request https github com mikeal request 默认情况下启用库 cooki
  • 使用 pg-promise 进行多行插入

    我想用一个插入多行INSERT查询 例如 INSERT INTO tmp col a col b VALUES a1 b1 a2 b2 有没有一种方法可以轻松地做到这一点 最好是对于像这样的对象数组 col a a1 col b b1 co
  • Express Cassandra 从目录自动加载模型 - models.instance.Person 不是构造函数

    我基本上是想实现一个人模型express cassandra教程 http express cassandra readthedocs io en latest usage 我在自动加载模型时遇到问题model文件夹 我的模型位于 mode
  • 我想使用 Sequelize 将 MySQL 中的对象数组存储在单个列中

    之前我正在寻找如何使用 Sequelize 在 MySQL 中插入对象数组 然后我找到了一种直接插入数组的解决方案 例如 1 2 在单列中 insert into TABLE NAME id marks VALUES 21 1 2 但我正在
  • 定时器内嵌套异步等待 - 不返回所需的值

    我必须使用 Mocha 和 chai 测试来测试端点的响应 下面是相同的代码 async function getData userId let response let interval setInterval async gt resp
  • 从 bash 脚本运行节点

    很简单 我正在尝试使用 cron 自动运行 nodejs 脚本 但是脚本本身似乎无法运行该文件 我的脚本很简单 usr bin env node node var node assets js update js 但是 在运行此命令时 它返
  • 如何在没有 DOM 的情况下将 javascript 作为 node.js 脚本运行?

    https github com jasondavies d3 cloud https github com jasondavies d3 cloud是一个使用 D3 库的 javascript 文字云 这是一个交互式演示 http www
  • NPM 全局标志在 Windows 上似乎不一致

    从控制台运行 gt npm root g 或者以编程方式 var npm require npm npm load null function err npm npm config set global true npm root 我在 W

随机推荐

  • 如何在没有互联网的情况下通过 wifi 提供网站服务?

    我想通过开放的 wifi 连接提供网站服务 但我不希望此 wifi 连接能够访问互联网 这是否可能以及我将如何去做 我已经在本地设置了网站 并通过本地主机或 IP 地址在浏览器中进行了访问 但我不确定如何设置网络服务器并通过 wifi 为网
  • 使用 WPF 对象在另一个对象上“打孔”?

    我有一个椭圆 它只是一个圆 我的问题是我想从大圆的中间切出一个圆形的孔 但似乎没有任何效果 我尝试过不透明蒙版 但没有任何效果 更复杂的是 大圆圈具有 DropShadowEffect 但因为这个圆圈是稍微透明的 所以你可以看到它后面有一个
  • Eclipse 文件搜索模式恰好出现两次

    我想对像所示的人那样的文件进行文件搜索here http jgeeks blogspot com 2013 10 searching multiple words in multiple html 我想找到包含以下内容的文件字符串1和字符串
  • 无法访问类的内部接口

    我有一个用于 recyclerview 的适配器类 public abstract class RecyclerViewArrayAdapter
  • 如何配置 BizTalk WCF-SQL 适配器以从 SQL Server 2012“始终在线”副本数据库获取数据?

    我们有一个客户端将使用 SQL Server 2012 的 AlwaysOn 可用性功能 他们希望将 BizTalk WCF SQL 端口连接到只读副本 The 文档 http technet microsoft com en us lib
  • .net 4.0 中引用类型的 volatile

    我很困惑volatile供参考类型 据我了解 对于原始类型 volatile可以立即反映来自另一个线程的值变化 对于引用类型 可以立即反映地址变化 但是 对象的内容呢 它们仍然被缓存吗 假设List Add 是一个原子操作 例如 我有 cl
  • React Native:执行 UI 块时抛出异常

    我正在构建一个 iOS React Native 应用程序 目前正在使用 React Native swipe card 包为我的应用程序构建 tinder 例如刷卡 该应用程序工作正常 但是当我向左或向右滑动卡片 并在它离开屏幕一半时放开
  • 如何在rails控制器中获取上传文件的文件名

    在我的控制器中 如果我根据建议给出以下内容 filename params upload result filename original filename 我正进入 状态 undefined method original filenam
  • Python 是否有相当于 Java 的 AWT Robot 类? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 有谁知道类似的Python类Java机器人 http java sun com javase 6 docs api java awt Ro
  • WPF DataGrid - 禁用时保留选择

    我已经为此苦苦挣扎了一段时间了 我的应用程序中有一个 主 详细信息 布局 并且像许多其他人一样面临着 DataGrid 在禁用它时丢失其选择的问题 本质上 从列表中选择一个元素来填充一系列字段后 用户按下 编辑 这会禁用 DataGrid
  • ical导出的格式化时间

    我在 jquery 中创建了一个导出到 ical 的日历 但是 我对日期时间有一些问题 ical 导出脚本需要以下格式的日期 时间 19970714T170000Z 有谁知道这是什么以及我应该如何准备我的字符串 Thanks 阅读 RFC
  • 'effect' 在 jsfiddle 中工作正常,但在实时代码中不起作用([object Object] 没有方法 'effect' )

    相关 但不是修复 jQuery 问题 没有方法 https stackoverflow com questions 2988485 jquery issue an object has no method 我收到错误Object objec
  • for 循环范围不起作用 ksh

    我试过这个 bin ksh for i in 1 10 do echo Welcome i times done 在 AIX 机器的 Ksh 中 我得到的输出为 欢迎 1 10 次 这是怎么回事 不是应该打印从1到10吗 编辑 根据 per
  • Windows 上的正则表达式 PCRE

    如何在 Windows 上安装 regex pcre cabal install regex pcre Resolving dependencies Configuring regex pcre 0 94 4 cabal Missing d
  • Dapper SqlMapperExtensions / Dapper.Contrib?

    好像有一个DapperExtensions项目 但是Dapper项目中还有一个SqlMapperExtensions类 有重叠吗 其中一个比另一个更受青睐吗 我找不到有关 Dapper Contrib 的任何文档 Dapper Contri
  • 用于运行异步请求的 Python Celery 与线程库 [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我正在运行一个解析大量数据的 python 方法 由于它是时间密集型的 我想在单独的线程上异步运行它 以便用户仍然可以访问网站 UI 如果用户退
  • 如何关闭 AWS S3 客户端连接

    关闭 aws s3 客户端连接的协议是什么 Override public boolean connect if connected return false else s3Client new AmazonS3Client credent
  • Python:检查目录是否是别名

    python 是否有一个简单的函数来检查目录是否是实际目录或者它是否只是另一个目录的别名 我试图列出目录中的所有文件 文件夹 但由于这些别名文件夹 我丢失了如下所示的内容 系统 库 Java JavaVirtualMachines 1 6
  • 我应该如何处理 WiX 安装程序中的产品升级?

    我有一个相当大的 WiX 安装程序 250 Mb 以上 我正在尝试制定合适的升级策略 安装程序中的大多数文件都不会更改 并且当只有一两个文件发生更改时 我们不希望分发整个包 我研究了主要和次要升级 我的理解是 如果产品 ID 发生变化 只要
  • 如何使用 Node JS / Webdriver.io / Chimp 打印为 PDF?

    我正在尝试在 Node JS 中使用 Chimp Webdriver io Selenium 来测试我的 media printCSS 确保当人们从我的网站打印时一切都正确显示 如何以编程方式让 Chrome Firefox 打印为 PDF