xtensor 类型与 NumPy 简单归约的性能对比

2023-12-30

我正在尝试xtensor-python https://github.com/QuantStack/xtensor-python并开始编写一个非常简单的求和函数，之后使用千篇一律的设置 https://github.com/QuantStack/xtensor-python-cookiecutter并启用 SIMD 内在函数xsimd https://github.com/QuantStack/xsimd.

inline double sum_pytensor(xt::pytensor<double, 1> &m)
{
  return xt::sum(m)();
}
inline double sum_pyarray(xt::pyarray<double> &m)
{
  return xt::sum(m)();
}

Used setup.py构建我的 Python 模块，然后在由以下代码构建的 NumPy 数组上测试求和函数np.random.randn不同尺寸，比较np.sum.

import timeit

def time_each(func_names, sizes):
    setup = f'''
import numpy; import xtensor_basics
arr = numpy.random.randn({sizes})
    '''
    tim = lambda func: min(timeit.Timer(f'{func}(arr)',
                                        setup=setup).repeat(7, 100))
    return [tim(func) for func in func_names]

from functools import partial

sizes = [10 ** i for i in range(9)]
funcs = ['numpy.sum',
         'xtensor_basics.sum_pyarray',
         'xtensor_basics.sum_pytensor']
sum_timer = partial(time_each, funcs)
times = list(map(sum_timer, sizes))

这个（可能有缺陷的）基准测试似乎表明，与 NumPy 相比，对于较大的数组，该基本函数的 xtensor 的性能会下降。

           numpy.sum  xtensor_basics.sum_pyarray  xtensor_basics.sum_pytensor
1           0.000268                    0.000039                     0.000039
10          0.000258                    0.000040                     0.000039
100         0.000247                    0.000048                     0.000049
1000        0.000288                    0.000167                     0.000164
10000       0.000568                    0.001353                     0.001341
100000      0.003087                    0.013033                     0.013038
1000000     0.045171                    0.132150                     0.132174
10000000    0.434112                    1.313274                     1.313434
100000000   4.180580                   13.129517                    13.129058

知道为什么我会看到这个吗？我猜这是 NumPy 使用的东西，而 xtensor 还没有，但我不确定它可以用于像这样简单的减少。我挖通了xmath.hpp https://github.com/QuantStack/xtensor/blob/master/include/xtensor/xmath.hpp但没有看到任何明显的东西，并且文档中没有引用任何类似的内容。

Versions

numpy                          1.13.3
openblas                       0.2.20
python                         3.6.3
xtensor                        0.12.1
xtensor-python                 0.14.0

哇，这真是巧合！我正在努力实现这个加速！

xtensor 的 sum 是一个惰性操作——它不使用最高效的迭代顺序进行（自动）向量化。然而，我们刚刚添加了一个evaluation_strategy减少（以及即将到来的累积）的参数，允许您选择immediate and lazy减少。

立即减少立即执行减少（而不是惰性），并且可以使用针对矢量化减少优化的迭代顺序。

您可以在此 PR 中找到此功能：https://github.com/QuantStack/xtensor/pull/550 https://github.com/QuantStack/xtensor/pull/550

在我的基准测试中，这应该至少与 numpy 一样快或更快。我希望今天能把它合并起来。

顺便提一句。请随时访问我们的 gitter 频道并发布问题链接，我们需要更好地监控 StackOverflow：https://gitter.im/QuantStack/大厅 https://gitter.im/QuantStack/Lobby

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

xtensor 类型与 NumPy 简单归约的性能对比的相关文章

安塞布尔 + 10.11.6

我在非常干净地安装 10 11 6 时遇到了 Ansible 的奇怪问题我已经安装了brew zsh oh my zsh Lil snitch 和1password 实际上没有安装其他任何东西我安装了ansible brew ins
重载算术运算符

赋值运算符可以声明为 T 运算符 const t 在类中但不能以这种方式定义算术运算符它必须是友元函数我不明白为什么你能解释一下吗算术运算符不必须是友元那么你可以这样定义 MyClass MyClass operator con
如何在 C 中链接目标文件？失败并显示“架构 x86_64 的未定义符号”

因此我尝试在我的文件 file2 c 中使用另一个 C file1 c 文件中定义的函数为了做到这一点我包含了 file1 file1 h 的标头但是每当我尝试使用 gcc 编译文件时我都会收到以下错误 Undefined sy
如何从 Powerpoint 2010 导出电影？

如何使用 MS Office PIA 主互操作程序集或其他方式以编程方式将嵌入视频从 powerpoint 2010 导出到外部文件在演示文稿中嵌入视频是 Powerpoint 2010 中的一项新功能我找不到解决方案 PPTX 文件
如何在Windows窗体中打开进程

我想在我的 Windows 窗体应用程序中打开进程例如我希望当用户按下 Windows 窗体容器之一中的按钮时 mstsc exe 将打开如果他按下按钮它将在另一个容器上打开 IE DllImport user32 dll SetL
如何在VS2005中使用从.bat而不是.exe启动的外部程序进行调试？

在我的 c 项目的调试属性中我选择了启动外部程序并选择了我希望将调试器附加到的程序的 exe 但是现在我需要从 bat 文件而不是 exe 启动程序但 VS2005 似乎不允许这样做这可能吗编辑为了澄清我需要调试从 bat
MPI - 发送和接收列

我需要从一个进程发送矩阵列并从另一个进程接收它我尝试运行以下程序但得到了一个奇怪的结果至少我这么认为仅复制矩阵的第一个元素某些矩阵元素会发生意外变化 include
g++ / gcc 是否支持 C++20 新的atomic_flag 功能？

根据参考参数 https en cppreference com w cpp atomic atomic flag c 20 有丰富的对我来说有用的支持atomic flag运营然而目前尚不清楚 gcc 是否支持这些功能它们在任何
给定一个字符串，如何删除所有重复的连续字母？

如何从字符串中删除两个连续的字母例如 a str hii thherre 应该成为 hi there 我尝试这样做 a str join sorted set a str key a str index 但是我得到 hi ter 是的
让 Windows 尝试读取文件

我正在对 Windows 文件系统进行某种封装当用户请求打开文件时 Windows 调用我的驱动程序来提供数据在正常操作中驱动程序返回缓存的文件内容但是在某些情况下实际文件没有缓存我需要从网络下载它问题是是否有可能让 Win
尝试 Catch 性能 Java

当捕获异常而不是进行检查时 try catch 需要多长时间以纳秒为单位假设消息具有用于查找的 HashMap 类型性能 try timestamp message getLongField MessageField TIMESTAMP
c++ - <未解析的重载函数类型>

在我的班级里叫Mat 我想要一个将另一个函数作为参数的函数现在我有下面 4 个函数但是在调用 print 时出现错误第二行给了我一个错误但我不明白为什么因为第一行有效唯一的区别是功能f不是班级成员Mat but f2是失败的是
如何防止 Lotus Notes 用户转发或复制通过 System.Net.Mail 发送的邮件？

我想使用 SMTP 客户端 uiing microsft net 以 C 作为编程语言发送电子邮件但是对于通过SMTP客户端发送的电子邮件我们是否可以添加禁止转发或禁止复制等安全功能我不希望电子邮件的收件人转发或复制电子邮件的
C# 多维数组解析

我有一个多维数组内容在调试器中看起来像这样数组设置为 String s new String 6 4 A B Yes C A B Yes C A B No C A B Yes C A B Yes C A B Yes C A B No C
重写 PyGObject 中的虚拟方法

我正在尝试实施高宽几何管理 http developer gnome org gtk3 3 2 GtkWidget html geometry management在 GTK 和 Python 中用于我的自定义小部件我的小部件是来自的子类
scikit-learn kmeans 聚类的初始质心

如果我已经有一个可以作为初始质心的 numpy 数组我该如何正确初始化 kmeans 算法我正在使用 scikit learn Kmeans 类这个帖子具有选定初始中心的 k 均值 https stackoverflow com q
C++ 中的析构函数

我的 AB h 文件中有一个构造函数 class AB private int i public AB i 0 constructor AB i 0 destructor virtual void methodA unsigned int
使用通用存储库模式和流畅的 nHibernate

我目前正在开发一个中型应用程序它将访问不同站点上的 2 个或更多 SQL 数据库等我正在考虑使用类似的东西 http mikehadlow blogspot com 2008 03 using irepository pattern w
NHibernate：无状态会话错误消息无法获取代理

我正在使用 nHibernate 无状态会话来获取对象更新一个属性并将对象保存回数据库我不断收到错误消息无状态会话无法获取代理我在其他地方有类似的代码所以我不明白为什么这不起作用有谁知道问题可能是什么我正在尝试更新Screen
Pandas 2 个字段中唯一值的数量

我正在尝试查找覆盖 2 个字段的唯一值的数量例如一个典型的例子是姓氏和名字我有一个数据框当我执行以下操作时我只获取每列的唯一字段数在本例中为最后一个和第一个不是复合体 df Last Name First Name nu

随机推荐

mongo dbname --eval 'db.collection.find()' 不起作用

为什么这有效 mongo dbname MongoDB shell version 1 8 3 connecting to nextmuni staging gt db collection find foo bar gt bye 虽然这不
--disable-web-security 在 Chrome 中工作吗？

我正在尝试做一个简单的测试而不更改任何涉及的服务器端代码跨域 https developer mozilla org en US docs Web HTTP CORS AJAX调用 https www w3schools com xml
如何使用cached_network_image预加载图像？

我刚刚实现了 Flutter包cached network image我想知道如何预加载图像以便稍后可以立即使用它们我从我们的服务器检索稍后将使用的所有图像网址我已经定义了自定义缓存管理器 getter class LocalCach
如何在 Linux 中针对分段错误生成核心转储？

我的 Linux 中有一个进程出现分段错误我怎样才能告诉它在失败时生成核心转储这取决于您使用的 shell 如果您使用的是 bash 则 ulimit 命令控制与程序执行相关的多个设置例如是否应该转储核心如果您输入 ulimit c
仅当属性为 null 时，如何从 lombok 构建器中排除该属性

我有一个用户模型类如下所示 JsonSerialize Getter Setter FieldDefaults level AccessLevel PRIVATE Builder public class User Default Str
基于 Python 中较小的数据集生成较大的综合数据集

我有一个包含 21000 行数据样本和 102 列特征的数据集我希望根据当前数据集生成一个更大的合成数据集例如 100000 行这样我就可以将其用于机器学习目的我在这篇文章中提到了 Prashant 的答案https sta
替换“/”之前的任何字符串，PHP

我想替换之前的任何字符串无论字符串长度如何谢谢让一种方式假设您想更改第一个之前的字符串 str anystring the rest blah s explode str s 0 new string print r impl
谷歌浏览器本地存储保存在哪里？

某些网站显示正在使用本地存储在 Google Chrome 中 CTRL I 资源选项卡本地存储例如 StackOverflow 有一个 login prefs 键和我的默认登录提供程序所以据我所知它是一个 json 对象这些数据
Spring embeddeb 数据库表已存在错误

我正在尝试使用嵌入式数据库运行 Spring Boot 应用程序在 bean 初始化期间由于某种原因我的表创建脚本被调用两次第二次调用失败并出现表已存在错误下面是我的代码可能是什么问题 Configuration publ
MatLab - 将函数应用于矩阵中的每一行

我有一个矩阵行数为 4 个整数列数未指定取决于文本文件我想独立地将函数应用于矩阵的每一行该函数有 4 个输入和 2 个输出我尝试使用 arrayfun 函数来执行此操作但每当我调用该函数时都会收到一条错误消息输入参数不足
如何在木偶上使用参数化正则表达式（例如/${user}/）进行测试？

我需要获取用户的主目录我决定通过解析 getent passwd 字符串来获取它这是一个自定义事实构建为内容的串联 etc passwd 并借助正则表达式提取相关信息当我测试 getent带有固定字符串 adam 提取工程 if g
如何在C#中使用Either类型？

佐兰霍瓦特 https www pluralsight com authors zoran horvat提议使用Either类型以避免空检查和不要忘记处理问题在执行操作期间 Either在函数式编程中很常见为了说明其用法 Zoran 展
如何对“新风格”Django 中间件进行单元测试

我正在学习如何对 Django 中间件进行单元测试在旧式中间件中使用以下命令加载中间件非常容易process request 测试结果例如 def test session self request self factory ge
衍生品警告没有意义

我收到以下形式的警告 DerivativesWarning Constraints or objectives traj linkages stage 1 grav turn alpha final coast 1 alpha initia
错误显示：dyld_sim 与加载的进程不兼容

我有一个 iPhone 中运行的应用程序的源代码适用于 iOS 7 及之前的操作系统但 iOS 8 0 及更高版本不支持该应用程序当我尝试编译代码时它可以正常执行所有文件但会引发体系结构不匹配错误在控制台中 dyld dyld
如何更改查询以仅保留叶节点

我有包含以下数据的表 id parent id short name 6 5 cpu 7 5 ram 14 9 tier a 15 9 rfc1918 16 9 tolerant 17 9 nononymous 13 12 cloudsta
HTTPServletRequest getParameterMap() 与 getParameterNames

HTTPServletRequestreq 有一个方法getParameterMap 但是这些值返回一个String 代替String 对于发布数据为姓名玛丽姓氏约翰年龄 20 我在帖子数据中看到它不是一个数组但是getPar
AngularJS 根据用户输入切换样式表

如何根据用户单击的按钮来切换切换 AngularJS 页面的样式表您实际上可以在 html 级别放置一个控制器并修改link标签的href Demo http plnkr co edit jBtP6FfmeRzOYUCnHg3t p p
如何检测通知/系统栏何时打开

我需要知道系统通知栏何时在我的应用程序中打开但我找不到任何真正的解决方案所以我将一些东西组合在一起看起来效果很好在详细介绍实现之前我将简要解释一下我的非常老套的逻辑当某个 Activity 由于任何原因不再对用户可见时将
xtensor 类型与 NumPy 简单归约的性能对比

我正在尝试xtensor python https github com QuantStack xtensor python并开始编写一个非常简单的求和函数之后使用千篇一律的设置 https github com QuantStack x

xtensor 类型与 NumPy 简单归约的性能对比

xtensor 类型与 NumPy 简单归约的性能对比 的相关文章

随机推荐

热门标签

xtensor 类型与 NumPy 简单归约的性能对比的相关文章