具有大数据集的 DC 和交叉过滤器

2024-02-10

我一直在研究 dc 和 crossfilter js,目前有一个包含 550,000 行、大小为 60mb csv 的大型数据集,并且面临着很多问题,例如浏览器崩溃等

因此,我试图了解 dc 和 crossfilter 如何处理大型数据集。http://dc-js.github.io/dc.js/ http://dc-js.github.io/dc.js/

他们主站点上的示例运行非常顺利,在看到时间线 -> 内存(在控制台中)后,它达到最大 34 mb,并随着时间慢慢减少

当我的项目加载 json 文件并渲染整个可视化时,每个下拉选项占用的内存范围为 300-500mb

那么,2个问题

  • dc 站点示例的后端是什么?是否可以找到确切的后端文件?
  • 我的应用程序运行速度非常慢并最终崩溃,如何减少 RAM 上的数据过载?

您好,您可以尝试运行加载数据,并在服务器上过滤它。当数据集的大小太大而浏览器无法处理时,我遇到了类似的问题。 几周前我发布了一个关于实施同样的问题。在客户端使用 dc.js,在服务器上使用 crossfilter https://stackoverflow.com/questions/24184986/using-dc-js-on-the-clientside-with-crossfilter-on-the-server/

以下是对此的概述。

在客户端,您需要创建具有 dc.js 期望的基本功能的假维度和假组(https://github.com/dc-js/dc.js/wiki/FAQ#filter-the-data-before-its-charted https://github.com/dc-js/dc.js/wiki/FAQ#filter-the-data-before-its-charted)。您可以在客户端创建 dc.js 图表,并在需要的地方插入虚假维度和组。

现在在服务器端您已经运行了交叉过滤器(https://www.npmjs.org/package/crossfilter https://www.npmjs.org/package/crossfilter)。您可以在此处创建实际的维度和组。

假尺寸有一个.filter()基本上向服务器发送 ajax 请求以执行实际过滤的函数。过滤信息可以以查询字符串的形式进行编码。你还需要一个.all()在您的假组上运行函数以返回过滤结果。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

具有大数据集的 DC 和交叉过滤器 的相关文章

随机推荐

  • 如何从业务/模型类发送进度更新?

    假设我们有一个具有分层架构的应用程序 在视图上我们使用 MVC 或 MVVM 模型被视为域 它有很好的业务逻辑部分 现在假设我们在模型中有一个需要一些时间的方法 例如 必须对对象的每个项目进行复杂的计算或处理 在 UI 中 我们希望显示一个
  • 在 Google Colab 上训练模型时,我应该保持连接吗?

    在 Google Colab 上训练用于对象检测的数据集模型 Darknet 时 我是否需要保持与 Colab 和互联网的连接 当训练在 Colab 上进行并连接到我的驱动器时 这里的权重文件将保存在我的谷歌驱动器文件夹中 那么 我可以断开
  • R中的参数传递机制

    下面的函数用于将一个序列相乘1 x by y f1 lt function x y return lapply 1 x function a b b a b y 好像a用于表示序列中的元素1 x 但是不知道如何理解这个参数传递机制 在其他
  • java.io.File 中 mkdir() 和 mkdirs() 之间的区别

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 谁能告诉我这两种方法之间的区别 file mkdir file mkdirs mkdirs 还创造了父目录在这个路径中File代表 jav
  • 从常规 ES6 类方法调用静态方法

    调用静态方法的标准方法是什么 我可以考虑使用constructor或者使用类本身的名称 我不喜欢后者 因为它感觉没有必要 前者是推荐的方式 还是还有其他方式 这是一个 人为的 示例 class SomeObject constructor
  • jQuery - keydown / keypress /keyup ENTERKEY 检测?

    尝试让 jQuery 检测 Enter 输入 但检测到空格和其他键 未检测到 Enter 下面有什么问题 entersomething keyup function e alert up var code e keyCode e keyCo
  • RxJS 运算符在事件流中等待安静期,但在事件流繁忙的情况下不会永远等待

    场景 我有一个事件流 每个事件都应该导致信息的更新显示 事件流来自 websockets 显示在 highcharts 图表中 但这并不重要 出于性能原因 我不想为每个事件触发 UI 更新 我宁愿做以下事情 当我收到一个事件时 我只想更新
  • 帮我用“apply”函数替换 for 循环

    如果可能的话 我的任务是找到用户连续参与游戏的最长连续天数 我没有编写 sql 函数 而是选择使用 R 的 rle 函数来获取最长的条纹 然后用结果更新我的数据库表 附加的 数据框是这样的 day user id 2008 11 01 20
  • 日语字符的正则表达式

    我正在 Struts 中进行国际化 我想为日语和英语用户编写 Javascript 验证 我知道英语的正则表达式 但不知道日语用户的正则表达式 是否可以为两个用户编写一个基于 Unicode 进行验证的正则表达式 请帮我 下面是一个正则表达
  • Prolog 中的递归 - 寻找城市之间的路径

    我正在努力完成底部的练习我发现自己对第三点完全困惑 我们获得以下旅游信息知识库 byCar auckland hamilton byCar hamilton raglan byCar valmont saarbruecken byCar v
  • 使用 Zombie.js 验证 Qunit 的结果

    我正在进行测试驱动开发Qunit http qunitjs com 当创建一个新函数时 我为它编写测试 创建函数 重新加载页面 如果所有测试都通过 我就继续 虽然一开始工作正常 但之后它开始成为一个耗时的过程一段时间 因为所有测试都需要几秒
  • 如何在另一个线程上运行阻塞代码并使http请求立即返回

    我们开始了一个新项目Quarkus and Mutiny 并使用 Quarkus 创建了一堆端点 Funq 到目前为止一切都运行良好 现在我们想要在一个端点中处理一些非常耗时的事情 我们期望的是 一旦用户单击按钮从前端发送 http 请求并
  • Javascript 中的递归函数和深度跟踪

    我正在用 JS 编写一个递归函数 但遇到了一些麻烦 让我们从这个非常基本的函数开始 function traverse thing if typeof traverse depth undefined traverse depth 1 el
  • Python 中的“For”循环行为

    为什么下面的简单循环没有保存i在循环的末尾 for i in range 1 10 print i i i 3 以上打印 1 2 3 4 5 6 7 8 9 但它应该打印 1 4 7 for sets i每次迭代 到被迭代对象的下一个值 无
  • 运行 `yo angular` 时出现很多“npm ERR!”

    我正在努力让 Yeoman 工作 但是却是一堵又一堵墙 感谢上帝的 stackoverflow 和所有好心人的帮助 无论如何 我一直在努力奔跑yo angular 但我得到了一堆npm ERR 包括 npm ERR Please try r
  • Plotly:如何在 x 轴上绘制月份和日期? (忽略年份)

    我正在尝试绘制时间序列数据 并希望 x 轴只是月份和日期 Plotly 要求格式为yyyy mm dd 但我有几年来数据集的每日平均值 所以我只想绘制mm dd在 x 轴上 当我发送一个日期时间时mm dd它假设mm成为那一年 我可以让它绕
  • 自定义适配器 getView 方法在位置 0 处频繁调用

    我有一个 GridView 绑定到自定义 ArrayAdapter 派生
  • Rails jquery 日期选择器时区

    我在尝试使用 Rails 处理 JQuery 日期 时间选择器中的时区时遇到问题 日期选择器正确显示当地时区 问题出现了 当我将所选日期保存到数据库中时 rails 会将其保存为 UTC 时间 即使该时间位于客户端的时区中 当我尝试将时间转
  • 如何包含 头文件并使用 std::numbers

    在 gcc 和 g 版本 11 1 0 上运行 每次我运行这段代码时 我都会遇到问题 它说 std numbers 未声明 我尝试跑步g randomCodeWhileReading cpp o main std c 20在我的终端 我运行
  • 具有大数据集的 DC 和交叉过滤器

    我一直在研究 dc 和 crossfilter js 目前有一个包含 550 000 行 大小为 60mb csv 的大型数据集 并且面临着很多问题 例如浏览器崩溃等 因此 我试图了解 dc 和 crossfilter 如何处理大型数据集