JuliaDB 或 DataFrame 比普通数组更快吗？

2024-02-03

我想知道普通数组与 JuliaDB 或 DataFrame 在大型数据集（很大但仍然适合内存）上进行计算的性能是否存在差异？

我可以使用普通数组和算法来进行排序、分组、归约等。那么为什么我需要 JuliaDB 或 DataFrame？

我有点理解为什么 Python 需要 Pandas - 因为它将慢速的 python 转换为快速的 C。但是为什么 Julia 需要 JuliaDB 或 DataFrame - Julia 已经很快了。

这可能是一个广泛的话题。让我重点介绍我认为的关键功能。

DataFrames.jl 或 JuliaDB.jl 相对于标准数组有哪些优势

它们允许您存储不同类型的数据列。您可以在数组中执行相同的操作，但它们必须是数组Any一般来说，与具有具体类型的数据列相比，这会更慢并且占用更多内存。
您可以使用名称访问列。然而，这是次要特征 - 例如NamedArrays.jl 提供具有命名维度的类数组类型。
额外的好处是，有一个生态系统建立在列有名称的事实之上（例如，连接两个DataFrames 或使用 GLM.jl 构建 GLM 模型）。

这种类型的存储（具有名称的异构列）是关系数据库中表的表示。

DataFrames.jl 和 JuliaDB.jl 有什么区别

JuliaDB.jl支持分布式并行； DataFrames.jl 的正常使用假设数据适合内存（您可以使用SharedArray但这不是设计的一部分），如果你想并行计算，你必须手动完成；
JuliaDB.jl 支持索引，而 DataFrames.jl 目前不支持；
Column types of JuliaDB.jl are stable and for DataFrames.jl currently they are not. The consequences are:
- 当每次创建新类型的数据结构时使用 JuliaDB.jl 时，必须重新编译应用于该类型的所有函数（对于大型数据集可以忽略，但在处理许多异构小数据集时可以具有可见的性能影响）;
- 使用 DataFrames.jl 时，在某些情况下，您必须使用特殊技术来确保类型推断以实现高性能（最值得注意的是所讨论的屏障函数）here https://github.com/bkamins/Julia-DataFrames-Tutorial/blob/master/11_performance.ipynb).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Julia

JuliaDB 或 DataFrame 比普通数组更快吗？的相关文章

与 Julia 实时绘图

我正在尝试绘制一个与 Julia 一起实时演化的函数为此当我尝试完全应用给定的示例时我发现 GR 包可以在 Julia 中使用here https pgi jcns fz juelich de pub doc anim html im
优化 Julia 中的递归函数

我编写了一个 Julia 代码它计算高斯函数的积分并且我有一种被一遍又一遍调用的核函数根据 Julia 内置Profile模块这是我在实际计算过程中花费大部分时间的地方因此我想看看是否有任何方法可以改进它这是一个递归函数我以一
获取 Julia Lang 中当前变量的列表

我是朱莉娅朗的新手我是Matlab背景出来的在Matlab中当按下whos命令我将获取当前范围内的所有变量而且我可以将它们存储在另一个变量中例如x whos Julia 中是否存在这样的命令 Matlab 中的示例代码 gt
为什么我的 Julia 代码运行速度比 JavaScript 慢？

最近我对 Julia lang 很感兴趣因为它声称是一种具有接近 C 性能的动态语言然而到目前为止我的经验并不好至少在性能方面我正在编写的应用程序需要随机访问特定的数组索引然后将它们的值与其他特定的数组索引进行比较经过多次迭
处理 Julia 中 kwargs 的类型

我该如何使用kwargs在 Julia 函数中并声明其类型以提高速度 function f x Float64 kwargs kwargs Dict kwargs if haskey kwargs c c Float64 kwargs c
关于 Julia 中的 ndarray 创建：在额外维度中堆叠

我想将以下 python 代码转换为 julia import numpy as np x np random random 4 5 6 y np array x x x 2 x 3 x 4 x print y shape gt 2 3 4
有什么方法可以获取模块中定义的函数列表？

是否有任何内省的魔法可以给我一个模块中定义的函数列表 module Foo function foo foo end function bar bar end end 一些神话般的功能例如 functions in Foo 这将返回 fo
Julia 作用域：为什么这个函数会修改全局变量？

我是 Julia 的新手但到目前为止我还是它的粉丝但根据多年的 R 编程经验一些范围规则让我感到困惑我们来看看这个函数这与我的预期完全一致 function foo1 x y x t 1 while t lt 1000 t 1 y
Julia 中的 @code_native、@code_typed 和 @code_llvm 有什么区别？

在使用 julia 时我想要有一个类似于 python 的功能dis模块通过网络我发现 Julia 社区已经解决了这个问题并给出了这些 https github com JuliaLang julia issues 218 https
Julia 中的内存分配

将程序从 Python 翻译成 Julia 后我非常不满意对于小非常小的输入 Python 更快对于中等输入 Julia 更快但没那么快对于大输入 Python 更快我认为原因是我不明白内存分配是如何工作的这里自学者没有C
在 julia 中打开 csv 文件时转义序列无效

当打开 CSV 文件时julia它给无效的转义序列 error 无效的转义序列 https i stack imgur com U9hn0 png julia gt using CSV julia gt wikiEVDraw CSV re
如何更改julia(1.8.5)默认安装包的位置？

如何更改julia 1 8 5 默认安装包的位置我不想把包安装到c盘因为pwd 和homedir 都默认到c盘如何修改我想每次都像安装python包一样打开Julia 有固定的安装路径例如user Base User site 我
有没有办法在 writetable() 中使用字符串作为分隔符 - Julia

当使用 writetable 将数据帧写入文件时我希望能够将分隔符设为空格然后逗号即作为分隔符我知道 writetable 只能选择将单个字符作为分隔符参数是否有可能的解决方法能够将字符串作为分隔符或者是否可以简单地在数据框中
在 Julia 中提取参数类型

假设我在 Julia 中编写了一个函数它接受Dict K V 作为参数然后创建类型的数组Array K 1 and Array V 1 我怎样才能提取类型K and V来自 Dict 对象以便我可以使用它们来创建数组斯文和约翰的答案
@distributed 似乎有效，函数返回很不稳定

我正在学习如何在 Julia 中进行并行计算我在用着 sync distributed在 3x 嵌套的开始处for循环并行化事物参见底部的代码从线路上看println errCmp row col 我可以观察数组的所有元素errCmp
具有单变量优化的 NLopt

任何人都知道 NLopt 是否适用于单变量优化尝试运行以下代码 using NLopt function myfunc x grad x 2 end opt Opt LD MMA 1 min objective opt myfunc mi
带有 return 语句的 Julia @parallel for 循环

如何在满足条件时立即返回所有工作人员的函数中编写并行 for 循环 IE 像这样的东西 function test n sync parallel for i in 1 1000 statement if condition return
如何在一张图中显示多个相邻的图像？

我正在使用 Julia PyPlot 和 Images 来处理一些图片因为显示几十个图是不可能的所以我想堆叠图像如下所示我有图像数据Array Array Float64 2 1 已经正常化了以下代码仅显示最后一个最小的图像该数
Julia：如何使用 PyPlot 创建不同大小的子图？

我想创建一个包含多个绘图的图形不过我希望能够使每个图具有不同的大小例如我希望第一个子图的宽度大约是第二个子图的两倍我希望做这样的事情 using PyPlot a rand 500 900 b rand 500 400 notice
获取参数类型的参数

假设我定义了一个这样的类型 type Point Tx Ty end 然后我创建一个这种类型的变量例如 a Point Int64 something 现在我只知道我可以获得以下类型a by typeof a 那是 Point Int6

随机推荐

Typescript：在类中扩展 Set 会导致错误（构造函数 Set 需要“new”）

我正在尝试对 Set 对象实现一些基本操作如下所示here https developer mozilla org es docs Web JavaScript Referencia Objetos globales Set 这是代码 e
使用 JQ 工具实用程序解析或查看 JSON 数据字段，其中字段名称的键名称中包含“-”破折号

我有一个 JSON 数据文件如下所示我正在尝试使用查找字段值jq https stedolan github io jq tutorial 公用事业如果键名称包含一个字段则它工作正常其中的破折号字符我怎样才能得到的值field
如何在 CSS 中包含 HTML 编码的“content:”字符？ [复制]

这个问题在这里已经有答案了可能的重复使用 CSS 内容添加 HTML 实体 https stackoverflow com questions 190396 adding html entities using css content
重新连接时 Firebase JavaScript API 是否能赶上服务器

我对 Firebase 的 JavaScript 离线功能有疑问具体来说我想知道如果在 Web 应用程序上填写表单显然由 firebase 提供支持时失去连接然后尝试发送该表单它是否会对本地数据库执行写入操作然后捕获重新建立连
SQL - 分组为单独的列

使用 SQL Server 2008 R2 我不确定这是否可能但我想按两列进行分组并获取它们的差异并将它们放入新列中用一个例子可能更容易解释 BEFORE DATE ID AMT TYPE 2013 01 11 36374DCD 47F
如何使用 OWIN 中间件组件检查 MVC 响应流？

这个问题以前曾以几种形式被问过但我无法得到任何工作答案我正在掉头发不确定问题是否只是解决方案是两年前的而且事情已经发生了变化如何安全地拦截自定义 Owin 中间件中的响应流 https stackoverflow com ques
源文件控制cvs到svn的转换？

大家好我目前使用 cvs 来控制所有源文件但想从 cvs 迁移到 svn 有人能给我一些指点吗我有很多项目但它们都很相似因此只想拥有以下结构树干 prj1 2 3 等分支如上标签如上我将使用 cvs2svn 工具已阅
为什么在数组内声明常量并分配给其他常量，以便在 Ruby 中作为类常量进行访问？

给定以下 Ruby 类 class Example PARENTS FATHER father MOTHER mother end 这些按预期工作 gt Example PARENTS gt father mother gt Example
应用程序使用 https - ITSAppUsesNonExemptEncryption 的正确值是多少

我的应用程序使用的唯一加密是通过 HTTPS 进行的调用目前 2017 年 6 月 7 日 iTunes Connect 需要根据 iTunes Connect 中的此信息获得出口合规性我已进入 iTunes Connect gt 我的
Magento 设计更新，仅替换搜索结果页面上的 list.phtml

我如何向 Magento 发布设计更新以仅替换搜索结果页面的 list phtml 模板有不止一种方法吗如果有一种方法可以像我对各个类别那样通过管理面板来完成此操作那就太理想了但如果没有那么编辑 xml 文件也可以您应该创建该文
在 Java 中缩小和混淆 JavaScript 代码

我多年来一直使用 YUI Compressor 来缩小和混淆 JS 文件但现在我需要在服务器上混淆和缩小动态生成的 JavaScript 代码因此这里的主要区别在于不会有应该混淆的 JS 文件而是向服务器 Java 发出请求该服
如何使用相同的 ListView 移动 Group 的 ListViewItem 部分来代替另一个 ListViewItem？

下面我正在尝试移动item4代替item5 我期望的操作是第 4 项位于item5和第 5 项下item4 下面我尝试移动 item4 来代替item5 我期望的动作是为了item4位于之上item5 and item5 under ite
URL 检测 adobe air 桌面小部件

我是 Adob e Air 的新手我需要紧急使用 Adob e Air 制作一个小部件用于监视我导航的 URL 当我进入特定站点时该小部件会出现在我的屏幕前面并显示信息问题是我不知道如何使用 Adob e air flash 监
Android Studio：无法解析符号 MainActivity

我在此代码中收到错误无法解析符号 MainActivity
header 和 include 之间有什么区别，应该在哪里使用哪一个

我对两个术语感到困惑 header Location homepage php include homepage php 我猜想在检查密码过程和包含之后使用标头您可以在任何地方使用它但我不确定它们之间的实际区别是什么以及应该在这两者中的
在 D3 forceSimulation 中拖动一个节点时停止移动其他节点

我制作了一个 D3 力导向图d3 forceSimulation 并附加了拖动功能单击一个节点时我不希望其他节点相应移动现在我可以通过设置来冻结正在拖动的节点d fx and d fy如下 function dragended d i
C++/C# 浮点问题

我在尝试从 C 中的 C 读取结构时遇到问题我这样做了很多次而且总是有效但我从未使用过浮点数这些是我在 C 端使用的结构 StructLayout LayoutKind Sequential public struct ImageD
如何将 cte 值分配给变量

with CTEima PersonId IsEmployeeActive as select count from custom viwSSAppsEmpMasterExtended vem where vem SupervisorPer
使用 Firestore 规则中的参考数据类型

我想定义一个规则允许用户仅更新自己的项目而管理员则更新所有项目 As uid of logged in administrator我应该能够同时更新items item 1 and items item 2 这有效 As uid of
JuliaDB 或 DataFrame 比普通数组更快吗？

我想知道普通数组与 JuliaDB 或 DataFrame 在大型数据集很大但仍然适合内存上进行计算的性能是否存在差异我可以使用普通数组和算法来进行排序分组归约等那么为什么我需要 JuliaDB 或 DataFrame 我有点理

JuliaDB 或 DataFrame 比普通数组更快吗？

DataFrames.jl 或 JuliaDB.jl 相对于标准数组有哪些优势

DataFrames.jl 和 JuliaDB.jl 有什么区别

JuliaDB 或 DataFrame 比普通数组更快吗？ 的相关文章

随机推荐

热门标签

JuliaDB 或 DataFrame 比普通数组更快吗？的相关文章