如何使用 PhantomJS 下载 csv 文件

2024-03-18

当我使用普通浏览器（Chrome）浏览网站 A 时，当我点击网站 A 上的链接时，Chrome 会立即下载 CSV 文件形式的报告。

当我检查服务器响应标头时，我得到以下结果：

Cache-Control:private,max-age=31536000
Connection:Keep-Alive
Content-Disposition:attachment; filename="report.csv"
Content-Encoding:gzip
Content-Language:de-DE
Content-Type:text/csv; charset=UTF-8
Date:Wed, 22 Jul 2015 12:44:30 GMT
Expires:Thu, 21 Jul 2016 12:44:30 GMT
Keep-Alive:timeout=15, max=75
Pragma:cache
Server:Apache
Transfer-Encoding:chunked
Vary:Accept-Encoding

现在，我想使用 PhantomJS 下载并解析该文件。我设置page onResourceReceived侦听器以查看 Phantom 是否会接收/下载文件。

clientRequests.phantomPage.onResourceReceived = function(response) {
    console.log('Response (#' + response.id + ', stage "' + response.stage + '"): ' + JSON.stringify(response));
};

当我发出 Phantom 请求下载文件时（这是 page.open('URL OF THE FILE')），我可以在 Phantom 日志中看到该文件已下载。以下是日志：

"contentType": "text/csv; charset=UTF-8",
    "headers": {
        "name": "Date",
        "value": "Wed, 22 Jul 2015 12:57:41 GMT"
    },
    "name": "Content-Disposition",
    "value": "attachment; filename=\"report.csv\"",
    "status":200,"statusText":"OK"

我收到了文件及其内容，但如何访问文件数据？当我打印当前的 PhantomJS 时page对象，我获取了页面 A 的 HTML，但我不想要它，我想要 CSV 文件，我需要使用 JavaScript 对其进行解析。

我找到了 PhantomJS 的解决方案。通读此文讨论 https://github.com/ariya/phantomjs/issues/10505我找到了一个jsfiddle http://jsfiddle.net/3kUXy/它通过 jQuery 的 ajax 方法下载 url 并将文件编码为 base64。

我想下载的文件是纯文本（CSV），所以我删除了编码功能。我的目标页面也已经包含了 jQuery，所以我不需要将 jQuery 注入目标页面 http://phantomjs.org/page-automation.html.

我的代码假设您已经打开了要使用 PhantomJS 下载文件的页面，并且该页面中有 jQuery。就我而言，我必须首先登录该网站才能获取下载链接。

var fs = require('fs');

var page=this;

var result = page.evaluate(function() {

    var out;
    $.ajax({
        'async' : false,
        'url' : 'fullurltodownload.csv',
        'success' : function(data, status, xhr) {
            out = data;
        }
    });
    return out;

});

fs.write('mydownloadedfile.csv', result);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 PhantomJS 下载 csv 文件的相关文章

如何设置上传的文件名？

By using multer I made it to request image file like this 这个文件存储在我设置的上传文件夹中我的代码如下 var multer require multer var uploa
React Native：不透明视图内的透明视图

我想用不透明框架和透明中心显示相机的视图就像图片中的一样黑色部分是相机的视图我正在寻找具有纯反应本机组件的解决方案没有额外的库例如https github com gilbox react native masked view h
您可以将现有的 div 复制到模式对话框吗

我有一个带有多个面板的仪表板来显示不同的信息我希望能够添加一个按钮来以模式显示面板我正在使用引导程序我所能找到的只是已经编写的模态我想复制作为面板的 div 标签的内容然后将其显示在模型中但我不确定如何进行该面板的 html
在多个动态添加的表单上初始化 jQuery validate() 函数

有人建议最好初始化一个 form validate 在页面加载而不是点击事件上运行 jquery form validate 插件仅允许在输入更改时提交 https stackoverflow com questions 10984196
如何在php中使用一张图像绘制形状

我需要使用图像的一部分来创建帧图像例如用户将从后端上传图像片段现在我需要根据前端用户的要求在前端创建一个框架用户将选择框架的高度和宽度然后他将选择该图像片段如下所示我没有办法做到这一点我尝试通过 css 和 html can
游戏手柄 JavaScript 未能按预期更新

我正在尝试让浏览器报告我的 XBOX 控制器的状态然而在第一次按下按钮后它似乎变得卡住我究竟做错了什么
setInterval() 在用户离开选项卡时暂停？

javascript 中是否有任何方法的行为类似于 setInterval 并且当用户离开选项卡时停止并在用户再次进入选项卡时恢复您可以使用以下方法创建自己的 API可见性API https developer mozilla org e
如何循环遍历对象数组并生成键值对？

我有一个像这样的对象数组 let someObj items id 12 value true id 34 value true id 56 value false 我想将其添加到现有对象中其中 id 是该对象的键如下所示 let ob
如何将文件透明地传输到浏览器？

受控环境 IE8 IIS 7 ColdFusion 当从 IE 发出指向媒体文件例如 mp3 mpeg 等的 GET 请求时浏览器将启动关联的应用程序 Window Media Player 我猜测 IIS 提供文件的方式允许应用程序
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
@aspnet/signalr 与 @microsoft/signalr javascript 库

aspnet signalr 与 microsoft signalr javascript 库有什么区别两者似乎都对 DotNetCore SignalR 有效两者似乎都很活跃在一些教程中我找到 aspnet signalr 在Do
如何记录进入 IIS 的 HTTP 请求

我在我的开发机器上运行 IIS 5 我有一个 asp net 3 5 Web 服务在其上运行我从同一服务器上运行的不同 Web 应用程序调用该服务我的服务返回错误 500 内部服务器错误我正在对其进行故障排除我的请求是通过Syste
尝试使用 Firebug 查找 JavaScript 文件中的函数

我试图找到这个函数调用 myFooBar 该函数在某些 HTML 中内联引用但页面加载了大量 JavaScript 并且在每个文件中搜索该函数需要相当多的工作如何使用 Firebug 找到此函数所在的 JavaScript 文件打开脚
jQuery 悬停时滚动到 div 并返回到第一个元素

我基本上有一个具有设定尺寸的 div 和overflow hidden 该 div 包含 7 个子 div 但一次只显示一个我希望当它们各自的链接悬停时能够平滑地垂直滚动但是第一部分 div 没有链接并且是没有悬停链接时的默认部分
如何从任何网站下载视频

我只是想知道如何从任何网站下载视频的总体思路我尝试的事情我检查页面在视频属性标记中看到 blob URL 将 blob URL 复制粘贴到浏览器中但无法打开 I also look around the Developer tool
JavaScript 中的实时摩尔斯电码转换器

在看到谷歌关于莫尔斯电码 gmail 的愚人节笑话后我想我应该尝试用 javascript 创建一个实时莫尔斯电码转换器我正在使用正则表达式和替换将莫尔斯电码更改为字符例如 replace g a replace g r 我遇到的问题
不使用控件时，视频元素在 Chrome 中消失

So I think这是一个浏览器错误它出现在一个更复杂的设计网站中但我已经进行了很好的尝试简化了我的代码和设计等并发现了以下内容嵌入时
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
使用 AJAX 和 JQuery 按设定的时间间隔刷新 Rails 部分

I have a page in my rails application that looks like 现在我有另一个用 python 编码的人工智能应用程序它处理视频显示在 Rails 应用程序页面的左侧并使用捕获的车辆及其相
在方法内部执行方法

我目前正在 FreeCodeCamp 中进行 JavaScript 练习我的代码应该使用的测试用例之一是函数调用如下所示 addTogether 2 3 这是我得到的基本功能 function addTogether return 当我

随机推荐

单个 django 查询集获取 n 个相邻项目

我正在制作一个无限连续滚动列表如 Twitter 并希望能够导航到特定项目找到该项目很简单但我需要在它之前和之后获取一些项目我使用与此处建议的答案类似的方法获取 Django 中的下一个和上一个对象 https stackov
与 Hub 中的 HttpContext.GetOwinContext() 等效的是什么？

我在控制台应用程序中创建了一个自托管的 OWIN SignalR 服务器从在 ASP NET MVC 应用程序在 IIS 中托管 SignalR 的示例中我看到以下代码行 var authenticateResult await H
url 重写规则不会忽略文件请求

http www iis net learn extensions url rewrite module url rewrite module configuration reference http www iis net learn e
为什么我需要 cglib (Spring AOP) 来拥有多个测试类？

我有一个弹簧应用我的测试课程如下 RunWith SpringJUnit4ClassRunner class ContextConfiguration locations classpath META INF spring applicat
AFNetworking - 偶尔会在 http 响应上收到“不可接受的内容类型：application/json”

我不明白为什么 AFNetworking 2 0 会抛出此消息我的理解是 application json 是默认的序列化方案因此如果服务器返回 content type application json 的 JSON 为什么 AFNe
Angular 2：如何使用 [routerLink] 提供插值

我以这种方式在routing ts 文件中定义了路由 const routesapp Routes path user id component UserComponent export const routing ModuleWithPr
放大或缩小时如何保持画布区域在 ScrollViewer 中居中，并且并非所有内容都可以显示在查看窗口中

每个人我有一个 WPF 应用程序它有一个画布我将其包裹在滚动查看器中我在状态栏中有一个滑块允许用户放大和缩小就像 Win 7 的 mspaint 一样以下是一些 XAML
Phonegap 调用 playAudio() 30 到 40 次后声音停止播放

在我的应用程序中我在鼠标单击时给出了声音响应这就是我所做的我已经这样调用函数了
如何让消息框3秒后消失？

我的应用程序中有一个确认屏幕我告诉用户他的项目已成功保存他可以按确定消息框就会消失但如果他不这样做如果没有响应我怎样才能使消息框在3秒后消失根据 MSDN 没有用户操作就无法关闭消息框没有为此操作提供方法 http msd
语法无效：使用初始排序键创建表排序键 auto

我正在尝试使用target redshift将数据推送到aws redshift https pypi org project target redshift https pypi org project target redshift 我
适用于 Android 的 Google Drive API - 仅 Drive.SCOPE_FILE 访问权限，需要只读

所以我是个新手我希望列出 Google 云端硬盘中的所有文件和文件夹我已经下载了新的 SDK 让我的应用程序获得了所有授权等我使用示例通过打开工具选择一个文件夹然后在列表视图中显示内容 BUT NO文件已显示它仅显示所选文件夹中的
如何在构建之间缓存 Maven 存储库？

我的目标是能够使用 councourse 构建管道构建打包和测试使用 Maven 构建的 java 项目这样的设置已经就位一切都运行良好但由于我们的 Nexus 的 Maven 下载率较差构建时间太长我的构建作业 yml 文件使
无法创建将编辑者和签名者作为嵌入式收件人的信封

我将使用我的应用程序凭据创建一个文档该文档应由编辑接收者编辑并由签名接收者签名尽管收件人编辑者有文档签名帐户但它失败并出现以下错误 com docusign esign client ApiException errorCode ED
Android：与充当主机的 USB 设备通信

我们制作了一个可以充当 USB 主机或从机并处理其接收到的数据的设备我想使用Android手机通过USB向其发送数据我的研究使我得出结论如果不修改硬件或操作系统我们就无法在 USB 主机模式下使用 Android 设备这样做不是一
比较两个字母数字字符串

我需要将字符串与以下方式进行比较任何人都可以为我提供一些关于 C 的见解或算法吗例如 a5 lt a11 because 5 is less than 11 6xxx lt 007asdf because 6 lt 7 00042Q l
Django 模型验证日期和日期时间范围

在 Django 模型中验证日期和日期时间间隔的最佳解决方案是什么这是我的模型 class PriceOption Model from datetime DateTimeField verbose name from datetime
WPF：ViewModel 类型不包含任何可访问的构造函数

我正在实例化我的存储库MainViewModel并将这个实例传递给我的孩子使用ViewModel i e CategoryViewModel 我得到了严重性代码说明项目文件行错误类型 CategoryViewModel 不包含任何可
Firebird 多个语句

有没有办法在 Firebird 上执行多个语句其中任何一个都不需要返回任何内容就像导入 SQL 文件并执行它一样我已经寻找了一段时间但找不到任何与此相关的东西执行块是exactly为了这个目的工作于IBExpert还有一个简单的
Nodejs 和 Chrome 中 setTimeout 的不同行为

代码示例是 global a aaa const obj a a desc console log this console log this a setTimeout obj desc 2000 当我在 Node js 中运行此代码时我
如何使用 PhantomJS 下载 csv 文件

当我使用普通浏览器 Chrome 浏览网站 A 时当我点击网站 A 上的链接时 Chrome 会立即下载 CSV 文件形式的报告当我检查服务器响应标头时我得到以下结果 Cache Control private max age 315

如何使用 PhantomJS 下载 csv 文件

如何使用 PhantomJS 下载 csv 文件 的相关文章

随机推荐

热门标签

如何使用 PhantomJS 下载 csv 文件的相关文章