迭代 Polars Rust 行

2023-11-27

我正在尝试迭代 Polars rust 数据帧的每一行。

在这次努力中，我发现df.get但文档说这很慢。然后我尝试过df.column("col").get但这似乎也带来了类似的问题。

处理数据帧每一行的正确方法是什么？我需要将其上传到数据库并将其转换为结构。

如果您激活rows极地功能，您可以尝试：

DataFrame::get_row and DataFrame::get_row_amortized.

后者是首选，因为它通过重用行缓冲区来减少堆分配。

反模式

这会很慢。从列式数据存储请求行将导致许多缓存未命中，并且会经过多个间接层。

稍微好一些

稍微好一点的是使用 Rust 迭代器。这将比get_row方法。

df.as_single_chunk_par();
let mut iters = df.columns(["foo", "bar", "ham"])?
    .iter().map(|s| s.iter()).collect::<Vec<_>>();

for row in 0..df.height() {
    for iter in &mut iters {
        let value = iter.next().expect("should have as many iterations as rows");
        // process value
    }
}

If your DataFrame由单一数据类型组成，您应该向下转换Series to a ChunkedArray，这将加快迭代速度。

在下面的代码片段中，我们假设数据类型是Float64.

let mut iters = df.columns(["foo", "bar", "ham"])?
    .iter().map(|s| Ok(s.f64()?.into_iter())).collect::<Result<Vec<_>>>()?;

for row in 0..df.height() {
    for iter in &mut iters {
        let value = iter.next().expect("should have as many iterations as rows");
        // process value
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DataFrame

Rust

rustpolars

迭代 Polars Rust 行的相关文章

使用空/空字段值创建新的数据框

我正在从现有数据帧创建一个新数据帧但需要在这个新 DF 中添加新列下面代码中的 field1 我该怎么做工作示例代码示例将不胜感激 val edwDf omniDataFrame withColumn field1 callUDF v
为什么在字符串上调用 .to_string() 可以避免移动错误？不是说无操作吗？

以下测试程序无法编译 fn f1 string String println string fn f2 string String println string fn main let my string String ABCDE to s
如何在 Scala 中将 DataFrame 模式写入文件

我有一个 DataFrame 它从一个巨大的 json 文件加载并从中获取架构该架构基本上大约有 1000 列我希望将 printSchema 的相同输出保存在文件中而不是控制台中有任何想法吗如果您在本地环境中工作您可以执行以下操
检测 JSON 数组中没有重复项的最快正确方法是什么？

我需要检查数组中的所有项目是否都是唯一的serde json Value 由于该类型没有实现Hash我想出了以下解决方案 use serde json json Value use std collections HashSet fn is
将lines()应用于数据框/矩阵的列；每条线都有不同的颜色

我正在尝试提出一个不涉及使用其他软件包例如 ggplot 的解决方案虽然绘制多条线非常简单但我还没有找到一种方法将参数的不同值例如不同的颜色应用于不同的线下面的代码以及结果图是我的尝试显然没有达到我想要的效果我也不想使用
如何在 Rust 中使用条件编译宏的示例

我已经关注了相当多 https doc rust lang org reference attributes html conditional compilation of 文档 https doc rust lang org stable
当我使用日期时间索引时添加到数据框

我试图获取它以便当我循环遍历一系列事物时我可以将特定日期从每个仓库收到的数量添加到数据框中当我尝试以下操作时它不起作用 if inv prod not in self inventory columns add row in sel
无论如何返回自定义错误类型的更简单方法::Error?

我的工作代码按以下方式返回错误 fn foo gt anyhow Result lt gt Err anyhow Error new MyError MyVariant actual 0 expected 1 有没有更简洁的方法来返回实例M
dplyr 更改许多数据类型

我有一个数据框 dat lt data frame fac1 c 1 2 fac2 c 4 5 fac3 c 7 8 dbl1 c 1 2 dbl2 c 4 5 dbl3 c 6 7 要更改数据类型我可以使用类似的东西 l1 lt c f
Pandas DataFrame：根据条件替换列中的所有值

我有一个简单的 DataFrame 如下所示 Team First Season Total Games 0 Dallas Cowboys 1960 894 1 Chicago Bears 1920 1357 2 Green Bay Pac
在 pandas 数据框中搜索字符串列表并将每个搜索字符串添加到新列

我有一个带有文本列描述的数据框我有一个搜索字符串列表 search FR 001 FR 002 FR 003 FR 004 我想使用搜索列表中的字符串搜索数据框我用了 df loc df Description str contai
如何向“子进程”发送信号？

Child kill https doc rust lang org std process struct Child html method kill发送一个SIGKILL 但是我如何发送任何其他信号例如SIGTERM 我大概可以用li
有没有办法编辑此函数以将数字添加到同一列？

我有这个函数可以将整数添加到现有的数据帧中它获取我的整数并将它们作为一列转置到数据框中当我添加一列较短值时行将自动分配为 0 当我添加另一列长度较长时所有现有的较短长度列都会添加 0 使其与最长列的长度相同例如 Function
在 Rust 中用 Polars-Lazy 编写表达式

我需要在 Polars lazy 中编写自己的表达式根据我对源代码的理解我需要编写一个返回 Expr Function 的函数问题是为了构造这种类型的对象必须提供 FunctionOptions 类型的对象需要注意的是这个类是公
如何在Windows中使用rust获取任何文件或目录ico？

有没有办法让任何文件或目录ico在Windows中使用rust 我在 google 和 stackoverflow 中找不到任何解决方案 None
pySpark 映射多列

我需要能够使用多列比较两个数据帧 pySpark尝试 get PrimaryLookupAttributeValue values from reference table in a dictionary to compare them t
Python：按组计算数据框中的特定出现次数

假设我有一个 df df pd DataFrame id 12 35 37 67 99 78 product banana apple banana pear banana apple reordered 1 0 0 1 1 1 id pr
Python DataFrame：将一列转置为多列

我有一个如下所示的数据框 df pd DataFrame month 2017 09 27 2017 09 27 2017 09 28 2017 09 29 Cost 100 500 200 300 我怎样才能得到这样的 df 2017 0
Spark中DataFrame、Dataset、RDD的区别

我只是想知道有什么区别RDD and DataFrame Spark 2 0 0 DataFrame 只是一个类型别名Dataset Row 在阿帕奇火花你能将其中一种转换为另一种吗首先是DataFrame是从SchemaRDD 是的
如何在不需要设置 LD_LIBRARY_PATH shell 变量的情况下输入“cargo run”？

我构建了一个 Rust 程序通过 C 接口调用 C 函数为了执行该程序我必须运行 export LD LIBRARY PATH

随机推荐

如何使用 sqlite 创建 ASP.NET Web 应用程序 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我想使用sqlite在as
整数矩阵的精确整数零空间？

nullspace A 找到矩阵零空间的基A 返回的向量具有浮点坐标如果矩阵A是一个整数矩阵可以在整数坐标中找到基础例如在数学 NullSpace RandomInteger 10 10 3 4 始终返回整数向量有没有办法在 Ju
如何从 C 运行外部程序并解析其输出？

我有一个实用程序可以输出游戏所需的文件列表如何在 C 程序中运行该实用程序并获取其输出以便我可以在同一程序中对其进行操作更新关于缺乏信息的好呼吁该实用程序会输出一系列字符串这应该可以跨 Mac Windows Linux 移植
适用于 .NET 的 HTML 到 PDF 转换器 [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案我正在寻找一个适用于 NET 的免费 HTML 到 PDF 转换器它最好采用 HTML 页面并将其呈现为 PDF 文档 HTML 页面打印时将通常不止一页我知道 ABCPDF
两个日期之间的天数？ [复制]

这个问题在这里已经有答案了查看两个日期之间过去了多少天的最短方法是什么这就是我现在正在做的事情 math floor b a total seconds float 86400 假设您实际上有两个日期对象您可以从另一个中减去一个并查询
查询与 activerecord 的交集

我真的很想在活动记录的帮助下执行以下查询 select from people p join cities c join services s where p city id c id and p id s person id and s
rql 从 javascript 中的键 rethinkdb 列表中获取多个文档

我有一个人数据表它有一个唯一的键 id 我有一个 id 列表我想获取这些数据并将其作为 JSON 数组从客户端发送到服务器服务器以 JSON 数组的形式接收该数据现在有没有一种方法可以运行查询来获取每个 id 的文档或者是我
DOM：获取文档中的所有文本节点（PHP）

我有以下 PHP 代码它遍历整个 DOM 文档以获取所有文本节点这是一个有点丑陋的解决方案我确信一定有更好的方法那么有吗 skip false node document nodes array while node if nod
在内存耗尽之前，GC 不应该在 Xamarin.Android 中自动运行吗？

我花了几乎一整天的时间试图找出 Android 内存泄漏的原因有一个活动我打开关闭很多次使用计时器一段时间后我收到了 OutOfMemory 错误每次活动打开时我都会在 Xamarin Profiler 中看到内存不断增加我
为什么我们应该使用 Exception 作为超类，为什么不使用 BaseException

在Python中每当我们编写用户定义的异常时我们都必须从类扩展它Exception 我的问题是为什么我们不能把它从BaseException这是异常层次结构的超类 Exception也是以下子类BaseException BaseExc
RestTemplate + 杰克逊

我想使用Spring的RestTemplate加上Jackson来消费WebService 我遵循了几个教程现在已经到了创建 DAO 的阶段这是我获取所有域对象的方法 Create a Rest template RestTemplat
在 $_GET 变量中添加空格有什么问题

例如如果我的网址看起来像index php category IT 20 20Soft 然后我尝试打印 GET category 我只得到 IT 而不是 IT Soft 这里有什么问题吗这让我很沮丧问题不在于空格而在于符号 Use
类是否在 lambda 表达式中实例化？ [复制]

这个问题在这里已经有答案了我有以下方法调用其中传递了 lambda 表达式这里是否隐式实例化了一个类 printStudents roster Student s gt s getGender Student Sex MALE s g
jdbc.SQLServerException：任何用户的用户登录失败

我试图测试与本地 sql 数据库的连接我有这个代码 try Class forName com microsoft sqlserver jdbc SQLServerDriver newInstance DriverManager getC
加载 Dicom 图像并显示它 - 使用 ClearCanvas 库

这是一个非常狭窄和具体的问题但我知道还有其他人在使用这个问题所以我会祈祷并希望你们中的任何人都能提出这个问题我正在开发一个 WPF 应用程序其中一部分是 Dicom 查看器我们希望使用第 3 方组件来处理 Dicom 内容而 C
如何水平居中未知宽度的无序列表？

页脚中通常有一组以列表形式表示的链接例如 div ul li a href Home a li li a href About a li li a href Contact a li ul div 我希望 div footer 内的所有内
自定义 NewtonSoft.Json 以进行值对象序列化[重复]

这个问题在这里已经有答案了有时也许在 DDD 情况下您可能希望使用 C 创建值对象来表示数据以便为您的领域赋予比使用基本类型更多的含义并具有不可变的额外好处例如 public class PostalCode Bit like
Google 电子表格脚本将 A 列中包含“Hello”的单元格与 B 列中的相邻单元格合并

我正在尝试将 A 列中包含某个单词的单元格例如 Hello 与紧邻右侧的单元格 B 列中合并 E g A4 Hello 因此我想合并单元格 A4 和 B4 到目前为止我有这个代码 function formatCells var ss
在闭包中，什么触发捕获变量的新实例？

我正在读乔恩斯基特的书C 深入探讨在第 156 页他有一个示例清单 5 13 使用多个委托捕获多个变量实例 List
迭代 Polars Rust 行

我正在尝试迭代 Polars rust 数据帧的每一行在这次努力中我发现df get但文档说这很慢然后我尝试过df column col get但这似乎也带来了类似的问题处理数据帧每一行的正确方法是什么我需要将其上传到数据库并将其

迭代 Polars Rust 行

反模式

稍微好一些

迭代 Polars Rust 行 的相关文章

随机推荐

热门标签

迭代 Polars Rust 行的相关文章