如何将 HTML 表格抓取为 CSV?

2024-06-02

问题

我在工作中使用一种工具来进行查询并获取 HTML 信息表。我没有任何后端访问权限。

如果我可以将这些信息放入电子表格中进行排序、平均等操作,那么这些信息将会更加有用。如何通过屏幕抓取这些数据到 CSV 文件?

我的第一个想法

因为我了解 jQuery,所以我想我可以用它来去掉屏幕上的表格格式,插入逗号和换行符,然后将整个乱七八糟的内容复制到记事本中并另存为 CSV。还有更好的想法吗?

解决方案

是的,伙计们,这确实就像复制和粘贴一样简单。我不觉得自己很傻吗。

具体来说,当我粘贴到电子表格中时,我必须选择“选择性粘贴”并选择格式“文本”。否则,即使我突出显示整个电子表格,它也会尝试将所有内容粘贴到单个单元格中。


  • 在工具的 UI 中选择 HTML 表并将其复制到剪贴板(如果可能的话)
  • 将其粘贴到 Excel 中。
  • 另存为 CSV 文件

然而,这是一种手动解决方案,而不是自动解决方案。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将 HTML 表格抓取为 CSV? 的相关文章

随机推荐

  • Python Flask 是否定义了路由顺序?

    在我看来 我的设置类似于以下内容 app route test def test app route
  • gdb:如何禁用特定的漂亮打印机

    如何在 gdb 中禁用特定的漂亮打印机 例如 禁用 C 11 std unique ptr 打印机 gdb 帮助或文档没有提供真实的或工作的示例 这对我有用 gdb info pretty printer global pretty pri
  • 使用 GCC 生成可读的程序集?

    我想知道如何使用GCC http en wikipedia org wiki GNU Compiler Collection在我的 C 源文件中转储机器代码的助记符版本 这样我就可以看到我的代码被编译成什么 你可以使用 Java 来做到这一
  • 将子视图发送到后面

    我正在尝试模仿 facebook ios 侧面菜单并让它工作 但是我遇到的问题是我无法将侧面菜单发送到后面 正如另一个问题中所讨论的那样使用 Objective C 的 iphone facebook 侧边菜单 https stackove
  • 无法创建 PDF:sh:wkhtmltopdf:找不到命令

    只是 wkhtmltopdf 遇到一些问题 它在命令行中工作正常 但在 PHP 中我不断收到此错误 Could not create PDF sh wkhtmltopdf command not found 在 Apache 停止并重新启动
  • python中的sys.stdin.fileno()是什么

    如果这是非常基本的或之前已经问过的 我很抱歉 我用谷歌搜索但找不到简单且令人满意的解释 我想知道什么sys stdin fileno is 我在代码中看到了它 但不明白它的作用 这是实际的代码块 fileno sys stdin filen
  • 在pycharm中调试python代码

    这个问题类似于this https stackoverflow com questions 10240018 how to use pycharm to debug python script一 我正在尝试调试pyethapp https
  • 帮我用光线追踪器解决这个错误

    我不会针对这个问题发布任何代码 因为它需要太多的上下文 但我将从概念上解释我正在做什么 我正在构建一个使用仿射变换的简单光线追踪器 我的意思是 我将来自相机坐标的所有光线与通用形状相交 这些形状都具有关联的仿射变换 并且光线在与场景对象相交
  • React Hooks 常量组件与功能组件

    我理解函数组件和类组件之间的区别 但是 const 组件和函数组件之间有什么区别 e g const Home gt return div Home div To function Home return div Home div 两者都可
  • Java 中处理异步响应的设计模式

    我读过类似问答的答案 如何在 JAVA 中创建异步 HTTP 请求 https stackoverflow com questions 3142915 how do you create an asynchronous http reque
  • 如何控制每个队列的并发数?

    Sidekiq 文档表明我只能控制 sidekiq 的全局并发性 而不是每个队列的并发性 我在这里提出一个问题 希望有一个针对每个队列并发设置的解决方案 一些第 3 方服务不接受高并发性 并且仅针对这些服务限制整个 sidekiq 是痛苦的
  • Lisp 中的十进制到二进制 - 制作非嵌套列表

    当达到我的递归情况时 我使用list将未来结果附加到当前结果 但由于递归 我最终得到一个嵌套列表 当我有一个导致递归超过五次的数字时 这会导致错误 任何想法如何我可以在一个简单的非嵌套列表中获得结果 例如 CL 用户 100 8 gt BI
  • 如果我的应用程序安装在 SD 卡上,私人数据也在那里吗?

    我假设应用程序的私有数据 例如 SharedPreferences 和 SQLite 数据库 位于手机的内部存储而不是 SD 卡上 即使应用程序本身安装在 SD 卡上 我在任何地方都找不到对此的简单明确的确认 有人可以确认一下吗 是的 私有
  • 如何将 BQL Bloomberg excel 公式实现为 python API (blpapi)?

    有没有办法使用 python API 甚至任何语言的 API 来实现 BQL 您应该请求访问 BQNT 目前 任何编程语言都没有公开可用的 BQL Excel 公式接口
  • 如何从 Rx Subscribe 回调异步函数?

    我想回调 Rx 订阅中的异步函数 例如 像那样 public class Consumer private readonly Service service new Service public ReplaySubject
  • 当rest api应用程序服务器(express)和Angulars js应用程序在不同端口上运行时出现Cors问题

    我有用node js编写的rest api应用程序 express在端口3000上运行 而angularjs应用程序在同一服务器上的端口9001上运行 从 angularjs 应用程序调用 rst api 时 出现了 cors 问题 在re
  • 是否可以将 cython 函数作为参数传递给 scipy 函数?

    Scipy 有许多函数接受 python 可调用来执行某些操作 特别是 我正在使用数学优化函数scipy optimize leastsq接受 Python 可调用作为目标函数参数 该目标函数可以通过以下方式调用leastsq在最小化过程中
  • MVC 框架中的缓存策略?

    我编写了自己的小型 PHP MVC 框架 现在正在探索 PHP MVC 框架中的缓存策略 我正在考虑可以缓存什么 在哪里以及如何缓存 我的框架是简单的MVC框架 我有前端控制器 它启动应用程序 注册类自动加载 设置 php 运行时指令 最后
  • 为什么 console.log() polyfill 不使用 Function.apply()?

    我一直在看一些流行的console log 包装 填充 保罗 爱尔兰的 http paulirish com 2009 log a lightweight wrapper for consolelog 本阿尔曼的 http benalman
  • 如何将 HTML 表格抓取为 CSV?

    问题 我在工作中使用一种工具来进行查询并获取 HTML 信息表 我没有任何后端访问权限 如果我可以将这些信息放入电子表格中进行排序 平均等操作 那么这些信息将会更加有用 如何通过屏幕抓取这些数据到 CSV 文件 我的第一个想法 因为我了解