如何使用 CasperJS 通过自定义 POST 请求下载文件

2023-12-14

我正在编写一个爬虫，需要使用 POST 下载表单请求后生成的文件。

我已成功将 this.download(url,'POST',Params) 用于常规表单。其中一个网站有许多字段使用相同的名称，从而使我无法使用常规下载方法。

在尝试了很多事情之后，我尝试了$.ajax() and __utils.sendAJAX()像这样处理表单：

response = this.evaluate(function(){
  url=...
  params = $('form#theirForm').serialize();
  data = __utils__.sendAJAX(url, 'POST', params,false,{contentType:"application/x-www-form-urlencoded"});
return __utils__.encode(data);
});
function decode_base64(s) { var e={},i,k,v=[],r='',w=String.fromCharCode; var n=[[65,91],[97,123],[48,58],[43,44],[47,48]]; for(z in n){for(i=n[z][0];i<n[z][1];i++){v.push(w(i));}} for(i=0;i<64;i++){e[v[i]]=i;} for(i=0;i<s.length;i+=72){ var b=0,c,x,l=0,o=s.substring(i,i+72); for(x=0;x<o.length;x++){ c=e[o.charAt(x)];b=(b<<6)+c;l+=6; while(l>=8){r+=w((b>>>(l-=8))%256);} } } return r; }
casper.then(function() {
    utils.dump(response);
    fs.write("test.zip",decode_base64(response),'w');
});

这些代码返回我的 Base64 数据，我将其转换并存储在 test.zip 文件中。但我就是无法解压它，说它已损坏。我转储正确的 zip 文件的数据 =>

PK^C^D^T^@^H^@^H^@<F4><89><96>F^@^@^@^@^@^@^@^@^@^@^@^@?^@^@^@fourniture denr<E9>es alimentaires - dietetique infantile\CCAP.pdf<AC><BC>^ET\K<D3><F7>;^D<B7><U+0B81>^@<C1><99>^Y^F'^D<B7><E0>^D^ON<90><E0><EE><EE><EE>^Dwww'^P<9C>^D^H<EE>^^܂<C3>%'<CF>9<E7><C9><F7><U+07B5><BE>7<F7>f^SVOzf

将其与我文件的第一行进行比较：

PK^C^D^T^@^H^@^H^@)_^M^@^@^@^@^@^@^@^@^@^@^@^@^@b^@^@^@fourniture denr<FD>es alimentaires - dietetique infantile\Bordereau de prix dietetique infantile.xlsx<FD>zuT<FD>I<FD><FD><FD><FD>^^4hp^M^D^M^R^H<FD>.<FD><FD>}p<FD>3<FD>kpw<FD>@pw^M<FD><FD>^R4<FD>Gv<FD>~<FD>[<FD><FD><FD><FD><FD>

任何人都知道可能出了什么问题吗？

我已经尝试了很多东西（编码工具，编码设置，从chrome控制台转储以获得纯base64等）

我不明白为什么它与 latin-1 或 utf8 编码有关，因为网站要求我选择要使用的编码。两者都尝试过。

casper.download()很高兴接受序列化形式而不是对象，因此您仍然可以使用它。您只需预先在页面上下文中序列化表单：

var formData = casper.evaluate(function(){
  return $('form#theirForm').serialize();
});

var url;
casper.download(url, targetFile, 'POST', params);

唯一的问题可能是使用了另一个 mimeType：“text/plain; charset=x-user-defined”。

在这种情况下，您将不得不重新创建进入的整个级联函数casper.download():

var url;
var response = casper.evaluate(function(url){
    var params = $('form#theirForm').serialize();
    var data = __utils__.sendAJAX(url, 'POST', params, false);
    return __utils__.encode(data);
}, url);

var cu = require('clientutils');

fs.write("test.zip", cu.decode(response), 'wb');

默认情况下使用“application/x-www-form-urlencoded”__utils__.sendAJAX().

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

javascript

encoding

casperjs

binaryfiles

如何使用 CasperJS 通过自定义 POST 请求下载文件的相关文章

命名和配置jsfiddle

对于任何知道答案的人来说这听起来都是一个非常愚蠢的问题当我创建 JSfiddle 时它会出现在我的列表页面上如下所示 cGzCe Revision 8 然后我将其命名为多创建节点由于添加了修订号因此该短语中没有空格所以有额
验证以防止角度形式出现重复的形式值

我有几个表单数组我需要进行验证以便每个表单行中的特定字段在所有表单数组中必须是唯一的如果任何值出现多次则两个表单字段都必须标记为红色我设法编写了一个函数以便如果这些字段有任何更改该函数将返回 true false 但我不确定如
Bootstrap 按钮的检查状态

我想在 Bootstrap 3 0 2 中设置组复选框的选中状态 docs http getbootstrap com javascript buttons html div class btn group div
该脚本在 IE 中不起作用。我该如何修复它？

有一个脚本可以根据用户的显示器屏幕分辨率更改页面模板但是它在 IE 中不起作用请告知如何修复它 table align center tr td head td tr tr td nbsp td td nbsp td td nbsp
使用 ng-if 内容短暂呈现然后消失

我的页面上有一些内容包含在 ng if 中如下所示 div class text danger p strong Message displayed to User strong p div 然后在我的 Angular js 控制器中我有
与拉斐尔的路径位置

我如何使用 raphael js 更改路径位置很奇怪的是明显的方法不起作用 var p paper path some path string p attr fill red p attr x 200 y 100 not working
div 准备好后如何调用函数？

我的 javascript 文件中有以下内容 var divId divIDer jQuery divId ready function createGrid Adds a grid to the html html 看起来像这样 div
Angular JS未知提供者错误

删除 Bower components 并清理缓存后我使用 Bower install 重新安装了依赖项该应用程序无法加载并出现以下错误未捕获的错误 injector unpr 未知提供程序 forceReflowProvider 这
使用express记录所有GraphQL响应

我成功地设置了记录 graphQL 错误 app use graphql graphqlHTTP request gt return schema rootValue request formatError error gt const p
ES6 在defineAsyncComponent 中命名导入

我想异步加载我的网络应用程序的一些元素这是旧的导入 import Popover PopoverButton PopoverPanel from headlessui vue export default components Popov
为什么此 Firebase 可调用函数不返回值？

我有一个应返回值的可调用函数但唯一返回的是 null 以下是该功能的当前版本我也尝试过回报第一个承诺原来的once调用最后在另一个then返回 GUID 在这种情况下它实际上返回了数据但它立即返回并且 GUID 为空我怎样才能实
Xml、xsl Javascript 排序

我正在寻找一种使用 javascript 对 xml 数据进行排序的方法并希望最终过滤掉数据我知道这一切都可以在 xsl 文件中实现但我想在客户端进行我已经搜索了多个使用 javascript 进行排序的地方但其中大部分要么太特定
Safari 和 Edge 中的 audioContext.copyToChannel() 替代方案

Safari 和 Edge 都不支持audioContext copyToChannel 函数用自定义内容填充audioBuffer 还有其他方法吗就我而言我想创建一个脉冲响应用该响应填充缓冲区并将一些声音与该缓冲区进行卷积对于
jQuery/JavaScript“this”指针混淆

当函数时 this 的行为bar被称为让我困惑请参阅下面的代码当从单击处理程序调用 bar 时有什么方法可以将 this 安排为普通的旧 js 对象实例而不是 html 元素 a class with a method functi
Meteor：即使设置了 ANDROID_HOME 也未设置

操作系统 Ubuntu 14 04 框架流星1 1 0 2 应用名称 Songofy 这是输出meteor install sdk android meteor install sdk android Found Android bund
ajax调用后如何停止刷新页面？

ajax 调用后我无法停止刷新页面我尝试过放置 e preventDefault 并返回 false 但我的页面又刷新了我不知道代码有什么问题或者什么请帮助我在ajax调用后停止刷新页面解决这个问题对我来说会有很大的帮助提前致谢
以编程方式将子节点添加到 jstree

我正在尝试编写一些动态添加节点到 jstree 的代码我已经关注了医生http www jstree com documentation crrm http www jstree com documentation crrm但无法获得一个
无法使用 Excel JavaScript API 设置 NumberFormat

我正在使用 Excel Javascript API 在搜索文档后仍然找不到我想要实现的解决方案因此我想将所有内容设置为数字格式文本这样 Excel 的自动格式设置就不会与任何单元格的内容混淆不会删除前导零或更改日期格式文档建
为什么间接更改复选框时不会触发复选框上的 onchange

我使用 Prototype 来监视复选框因此我可以向它们添加 javascript 检查当单击复选框所在的 tr 或 td 时应选中该复选框当您直接单击复选框时会触发 onchange 事件因此您会收到警报当 javascri
如何在不接受焦点的元素上捕获键盘事件？

我知道要处理输入字段中的键盘事件您可以使用 input keyup function e var code e keyCode and 13 is the keyCode for Enter 但是现在我有一些div and li元素

随机推荐

是否可以在 Flash 或 Flex 中存储 cookie 的值？

在PHP中有一个setcookie基于函数来存储它在Flash中可以吗如果可以的话怎么办我想储存价值首先 PHP 运行在服务器上因此可以发送必要的 HTTP 标头来设置 cookie Flash 运行在客户端浏览器中因此不能执行
如何在主应用程序中合并 Rails Engine ApplicationController 方法？

如何将 Rails 引擎 ApplicationController 它的方法合并到主应用程序中我需要访问这些引擎控制器方法并且我想在不使用主应用程序的 ApplicationController 中的包含的情况下执行此操作 mo
如何使用 AngularJS 限制输入值？

我正在寻找将输入内的值限制为 4 并将 4 位数字值处理到我的控制器的方法
捕获 FileSystemWatcher 侦听器线程抛出的异常

我正在尝试找出一种方法来捕获抛出的异常FileSystemWatcher正如我从软件的崩溃报告日志中注意到的那样这些似乎是随机发生的崩溃并不频繁因为上个月只发生了两次但很烦人我很想修复它有问题的异常似乎与路径中包含无效字符的文件
C# 代码无法“查看”我的 C++ dll 中的方法

我有一段用 C 编写的代码不是我写的并且想在 C 中使用它所以我决定制作一个 dll 并从那里使用这个类我对 C 的了解很少并且在我的 C 项目中引用此类的方法时遇到问题 C 代码是这样的 ifndef BeamAn class
使用 jQuery 更改 URL 和重定向

我有一些这样的代码
PCA 中第一个分量覆盖的 99% 方差的显着性

当第一个分量覆盖 PCA 分析中总方差的 99 以上时这意味着什么我有一个大小为 500X1000 的特征向量我在其中使用了 Matlab 的 pca 函数该函数返回 coeff score latent tsquared expl
Android OpenGL ES 透明背景

我正在构建一个利用 OpenGL 的 Android 应用程序就目前而言本次活动的背景GLSurfaceView由我的代码动态生成并作为纹理加载并用glDrawTexfOES 这是好的但我可以简单地将图像更平滑地显示到其自己的表面
Mediacodec 解码器在解码 H264 文件时总是超时

我一直在努力decode编码的视频文件H264编码与安卓的媒体编解码器并尝试将解码器的输出放入surface 但是当我运行应用程序时它显示黑色表面并且在 DDMS logcat 中我看到解码器超时我已将文件解析为有效frames首先
Jmeter 中突发模式的负载测试

我正在运行 1 小时的负载测试在测试之间我希望场景以 15 分钟的固定间隔运行 1 分钟的持续时间在jmeter中目前我可以模拟除突发模式之外的所有其他场景如何保持延迟15分钟并触发持续1分钟的请求如何达到突发的TPS 目前我必须
如何将 HH:mm:ss.SSS 转换为毫秒？

我有一个字符串00 01 30 500这相当于90500毫秒我尝试使用SimpleDateFormat给出包括当前日期在内的毫秒数我只需要毫秒级的字符串表示形式我是否必须编写自定义方法来分割并计算毫秒或者还有其他方法可以做到这一点吗
在php中获取memcache项的过期时间？

我在我的网站上缓存推文过期时间为 30 分钟当缓存为空时第一个找到的用户将重新填充它然而那时 Twitter API 可能会返回 200 在这种情况下我想将之前的数据再延长 30 分钟但之前的数据已经丢失了因此我想考虑在过
在 UITableViewController 中弹出多个级别

我希望能够从 UITableViewController 堆栈中弹出多个视图例如在 Apple DrillDownSave 示例中当查看级别 3 时返回级别 1 或者当查看项目时按按钮返回级别 2 我试过 self navigatio
值为 Empty 的 Variant 类型的变量如何在堆栈上表示？

以下解释来自Rhino 开发者文档 Empty 当您在 VBScript 中声明变量时变量的值之前第一个赋值未定义或者Empty Dim varValue Empty value 所以基本上 Empty说我是一个未初始化的变体如果
`int 3` 到底应该做什么？

根据this int 3从用户空间使用来生成 SIGTRAP 但是在用户空间下的特权下应该做什么呢还有更多的东西可以从用户空间 SIGTRAP 生成这样的东西吗操作码int 3对 UNIX 约定一无所知例如 SIGTRAP Int
获取Windows 8自动颜色主题的活动颜色

在 Windows 8 中我已将配色方案设置为自动并将壁纸配置为在 x 分钟后更改配色方案根据活动壁纸而变化我正在开发一个 WPF 应用程序并且希望在 Windows 更改配色方案以匹配当前壁纸时更改我的渐变有没有办法获取当前
解析开源服务器重置密码错误

I updated the parse server to run on AWS and I get this error when I hit the reset password but the login works I am not
是什么导致了这个属性错误？

我一直在寻找解决方案但还没有找到所以这是我的代码 class snakeGame def init self pygame init self isRunning False self surface None self drawLis
RNetLogo 无法在 Mac Yosemite 上运行

我刚刚尝试过此操作但收到此错误消息关于如何修复它有什么想法吗我使用的是R版本3 1 1 RNetLogo 1 0 1 平台是x86 64 apple darwin13 1 0 64位 Java 7 update 60 Sys sete
如何使用 CasperJS 通过自定义 POST 请求下载文件

我正在编写一个爬虫需要使用 POST 下载表单请求后生成的文件我已成功将 this download url POST Params 用于常规表单其中一个网站有许多字段使用相同的名称从而使我无法使用常规下载方法在尝试了很多事情之后

如何使用 CasperJS 通过自定义 POST 请求下载文件

如何使用 CasperJS 通过自定义 POST 请求下载文件 的相关文章

随机推荐

热门标签

如何使用 CasperJS 通过自定义 POST 请求下载文件的相关文章