优化数组压缩

2024-05-01

假设我有一个数组k = [1 2 0 0 5 4 0]

我可以按如下方式计算掩码m = k > 0 = [1 1 0 0 1 1 0]

仅使用掩码 m 和以下操作

左移/右移
And/Or
加/减/乘

我可以将 k 压缩为以下形式[1 2 5 4]

以下是我目前的做法（MATLAB 伪代码）：

function out = compact( in )
    d = in
    for i = 1:size(in, 2) %do (# of items in in) passes
        m = d > 0
        %shift left, pad w/ 0 on right
        ml = [m(2:end) 0] % shift
        dl = [d(2:end) 0] % shift

        %if the data originally has a gap, fill it in w/ the 
        %left shifted one
        use = (m == 0) & (ml == 1) %2 comparison  

        d = use .* dl + ~use .* d

        %zero out elements that have been moved to the left
        use_r = [0 use(1:end-1)]
        d = d .* ~use_r
    end

    out = d(1 : size(find(in > 0), 2)) %truncate the end
end

直觉

每次迭代，我们将掩码向左移动并比较掩码。如果我们发现在这次移位之后，原来为 void(mask[i] = 0) 的索引现在有效(mask[i] = 1)，则我们将索引设置为具有左移数据。

Question

上述算法的复杂度为 O(N * (3 次移位 + 2 次比较 + AND + 加法 + 3 次乘法))。有没有办法提高其效率？

原始伪代码没有太多需要优化的地方。我在这里看到了一些小改进：

循环可以少执行一次迭代（即 size-1），
如果“use”为零，您可能会提前打破循环，
use = (m == 0) & (ml == 1)可能可以简化为use = ~m & ml,
if ~被算作单独的操作，最好使用倒置形式：use = m | ~ml, d = ~use .* dl + use .* d, use_r = [1 use(1:end-1)], d = d .*use_r

但发明更好的算法是可能的。算法的选择取决于所使用的CPU资源：

加载-存储单元，即将算法直接应用于内存字。在芯片制造商将高度并行的 SCATTER 指令添加到其指令集中之前，这里什么也做不了。
SSE 寄存器，即在寄存器的整个 16 字节上运行的算法。像所提出的伪代码这样的算法在这里无济于事，因为我们已经有了各种洗牌/排列指令，可以使工作更好。使用 PMOVMSKB 的各种比较指令、按 4 位对结果进行分组并在 switch/case 下应用各种洗牌指令（如 LastCoder 所描述）是我们能做的最好的事情。
具有最新指令集的 SSE/AVX 寄存器提供了更好的方法。我们可以直接使用 PMOVMSKB 的结果，将其转换为 PSHUFB 之类的控制寄存器。
整数寄存器，即 GPR 寄存器或同时在 SSE/AVX 寄存器的多个 DWORD/QWORD 部分上工作（允许执行多个独立的压缩）。所提出的应用于整数寄存器的伪代码允许压缩任意长度（从 2 到 20 位）的二进制子集。这是我的算法，它可能会表现得更好。

C++，64 位，子集宽度 = 8：

typedef unsigned long long ull;
const ull h = 0x8080808080808080;
const ull l = 0x0101010101010101;
const ull end = 0xffffffffffffffff;

// uncompacted bytes
ull x = 0x0100802300887700;

// set hi bit for zero bytes (see D.Knuth, volume 4)
ull m = h & ~(x | ((x|h) - l));

// bitmask for nonzero bytes
m = ~(m | (m - (m>>7)));

// tail zero bytes need no special treatment
m |= (m - 1);

while (m != end)
{
  ull tailm = m ^ (m + 1); // bytes to be processed
  ull tailx = x & tailm; // get the bytes
  tailm |= (tailm << 8); // shift 1 byte at a time
  m |= tailm; // all processed bytes are masked
  x = (x ^ tailx) | (tailx << 8); // actual byte shift
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

MATLAB

SSE

SIMD

优化数组压缩的相关文章

垂直子图的单一颜色条

我想让下面的 MATLAB 图有一个沿着两个子图延伸的颜色条像这样的事情使用图形编辑器手动完成 Note 这与提出的问题不同here https stackoverflow com questions 39950229 matlab t
删除队列中的最后一个元素

我需要删除队列的最后一个元素我唯一可以使用的操作是 Peek 获取第一个元素而不删除它 Enqueue element 向队列末尾插入一个元素 Dequeue 删除第一个元素 IsEmpty true 或 false 队列是否为空而且我
什么是“矢量化”？

现在好几次了我在 matlab fortran 其他一些中遇到这个术语但我从来没有找到解释它是什么意思它有什么作用所以我在这里问什么是矢量化例如循环矢量化是什么意思许多CPU具有向量或 SIMD 指令集它们同时对两
MATLAB 可执行文件太慢

我使用以下命令将 MATLAB 程序转换为基于控制台的应用程序deploytool在 MATLAB 中 MATLAB m文件执行大约需要 2 秒但在我将其转换为可执行文件并调用 exe 执行需要45秒太长了我想将 MATLAB 程序与
matlab部署工具到java包javac错误

我正在尝试将我的程序包装为与 java 一起使用我首先尝试了一个简单的 hello world 你好世界 m disp 你好世界我使用了deploytool并选择了java包当它到达这一行时执行命令 javac verbose cl
将数据提示堆栈放在轴标签顶部，并在轴位置发生更改后更新轴标签

此问题仅适用于 unix matlab Windows 用户将无法重现该问题我在尝试创建位于 y 轴标签顶部的数据提示时遇到问题下图很能说明问题正如您所看到的在 ylabel 附近创建的数据提示将到达 ylabel 文本的底部而期
寻找将集合映射到整数的双射函数

对于任意两个序列 a b 其中 a a1 a2 an 且 b b1 b2 bn 0a b具有相同的元素而不关心它们的顺序例如如果 a 1 1 2 3 b 2 1 3 1 c 3 2 1 3 则 f a f b f a f b 我知道有
在Matlab中对字符进行分组并形成矩阵

我有 26 个字符 A 到 Z 我将 4 个字符组合在一起并用空格分隔以下 4 个字符如下所示 abcd efgh ijkl mnop qrst uvwx yz 我的Matlab编码如下 str abcdefghijklmnopqrst
为什么 FMA _mm256_fmadd_pd() 内在函数有 3 个 asm 助记符：“vfmadd132pd”、“231”和“213”？

有人可以向我解释一下为什么融合乘法累加指令有 3 种变体 vfmadd132pd vfmadd231pd and vfmadd213pd 而只有一个 C 内在函数 mm256 fmadd pd 为了简单起见在 AT T 语法中有什么区别
关于在字典中查找所有有效单词的算法问题

给定一个字典只是一个字符串列表您收到来自外部来源的未知数量的信件给定字母串您将如何列出您可以通过这些字母的任意组合组成的所有有效单词来自字典因此如果您收到 applead 你应该找到apple bad pad lead等我知
如何仅使用单个数组在 JavaScript 中模拟调用堆栈

我正在看维基百科页面 https en wikipedia org wiki Call stack在调用堆栈上并尝试理解这个图像据我所知哈哈 const memory memory 0 3 top of stack pointer m
包围一组点的多边形

我有一组 S 点 2D 由 x 和 y 定义我想找到 P 包围该组所有点的最小含义具有最少数量的点多边形 P 是S 有没有已知的算法来计算这个我在这个领域缺乏文化令人惊讶感谢您的帮助对于这个问题有很多算法它被称为最小边界框
如何在向量中的所有点之间绘制线？

我有一个包含二维空间中一些点的向量我希望 MATLAB 用从每个点到每个其他点绘制的线来绘制这些点基本上我想要一个所有顶点都连接的图你能用情节来做到这一点吗如果可以怎么做一种解决方案是使用该函数为每个点组合创建一组索引MESH
从 MATLAB 调用 Java？

我想要Matlab程序调用java文件最好有一个例子需要考虑三种情况 Java 内置库也就是说任何描述的here http docs oracle com javase 6 docs api 这些项目可以直接调用例如 map ja
我如何编写一个名为 dedbi 的 MATLAB 函数，它将输入 xtx 作为字符串并返回另一个字符串 xtxx 作为输出。

dedbi 反转单词即 a 将被 z 替换 b 将被 y 替换 c 将被 x 替换依此类推 dedbi 将对大写字母执行相同的操作即将字符串 A 替换为 Z 将 B 替换为 Y 将 C 替换为 X 依此类推如果我给函数这个字符串 a
如何在Matlab中打印带有千位分隔符的整数？

我想使用逗号作为千位分隔符将数字转换为字符串就像是 x 120501231 21 str sprintf 0 0f x 但随着效果 str 120 501 231 21 如果内置fprintf sprintf做不到我想可以使用正则表达式
如何有效地找到距给定点最远的点（从一组点中）？

我正在寻找一种算法或数据结构来解决以下问题给你一组点 S 然后你会得到另一个点形式的 Q 查询对于每个查询找到集合中距离给定点最远的点集合中最多有 10 5 个点和 10 5 个查询所有点的坐标都在 0 到 10 5 范围内我想
MATLAB 编译器与 MATLAB 编码器

两者有什么区别据我了解 MATLAB Compiler将MATLAB代码包装成 exe文件这样就可以在不安装MATLAB的情况下使用它并且只需要MCR 除此之外 MATLAB Builder NE 还可以用于生成与 Net 框架一起使
Numpy 相当于 MATLAB 的 hist [重复]

这个问题在这里已经有答案了由于某种原因 Numpy 的 hist 总是返回比 MATLAB 的 hist 少 1 个 bin 例如在 MATLAB 中 x 1 2 2 2 1 4 4 2 3 3 3 3 Rep Val hist x un
绘制多边形

我正在使用 Google Maps API V3 根据路径绘制多边形该路径是随机未排序坐标点 LatLng 的数组这会产生以下形状 Polylines intersect Problem 由于多边形的形状取决于路径中点的顺序因此如何对

随机推荐

如何在 Windows 8 上安装 sqlite 或 postgresql 以进行 ruby on Rails 设置？

我一直在尝试安装数据库作为 ruby on Rails 设置的一部分我正在运行 64 位 Windows 8 基于 x64 的计算机我的ruby版本是2 1 3p242 rails版本是4 0 0 sqlite3版本是3 8 6 pos
CloudFormation - 永久删除堆栈

在 CloudFormation 中删除堆栈后堆栈保留在已删除下的 cloudformation 中有没有一种方法可以完全删除所有已删除的堆栈并在我的项目上获得干净的云信息我认为你在 90 天的时间里只能在历史中看到它们此命令讨
从具有重复元素的向量生成所有独特的组合

这个问题之前曾被问过但仅适用于具有非重复元素的向量我无法找到一个简单的解决方案来从具有重复元素的向量中获取所有组合为了说明这一点我在下面列出了一个例子 x lt c red blue green red green red 向量 x
删除编译时的 LESS // 注释

是否可以配置LESS在通过JS编译时删除注释我想从输出的 less 文件中删除它们 Less的单行注释根据文档所述应该保持沉默单行注释在 LESS 中也有效但它们是沉默的它们不会出现在编译后的 CSS 输出中 Hi I m
AutoFixture，创建电子邮件地址列表

我正在编写一些单元测试并有一个名为Account其中有 public Guid AccountId get set public IEnumerable
jQuery：检查字段的值是否为 null（空）

这是检查字段值是否为的好方法null if person data document type value NULL 或者还有更好的方法字段的值不能为空它始终是字符串值该代码将检查字符串值是否为字符串 NULL 您想检查它是否是空字
将 showModalDialog() 的内容添加到剪贴板 Google 脚本

当我单击按钮时我已将格式化数据添加到模态对话框中我想要的内容showModalDialog 当我单击按钮时也会自动添加到剪贴板模态是用下面的代码生成的并且temp是我想要添加到剪贴板的输出 Output to Html var ht
在 C# 汇编版本中使用前导零是否合适？

我正在为我的 dot net dll 设置程序集版本汇编版本具有以下格式主要版本次要版本内部版本号修订版我将 Verison 设置如下 200 1 1 0 现在我的问题是我是否需要在次要版本内部版本号和修订号中保留前导零 20
覆盖菜单按钮标签文本颜色 (MacOS SwiftUI)

我可以覆盖菜单按钮标签的设置后变暗颜色吗下面的 GIF 显示了一个清晰明亮的菜单项在新选择后会变暗此系统样式的默认行为例如在触控板首选项中但它不符合可访问性标准例如 WCAG 要求活动控件中该字体大小的亮度对比度 gt 4
删除ID最小的记录

当我在 MySQL 中输入此查询时 DELETE FROM myTable WHERE ID SELECT Min ID FROM myTable 我收到以下错误消息 1093 You can t specify target table
枚举本质上不是 IEnumerable 的集合？

当您想要递归枚举一个分层对象根据某些条件选择一些元素时有许多技术示例例如扁平化然后使用 Linq 进行过滤就像在这里找到的那些链接文本 https stackoverflow com questions 141467 rec
Razor：为什么我的变量不在范围内

inherits umbraco MacroEngines DynamicNodeContext using System Collections List
如何测试视图是否用“login_required”装饰（Django）

我正在对用 login required 装饰的视图进行一些独立的单元测试例子 login required def my view request return HttpResponse test 是否可以测试 my view 函数
使用 Python 和 Boto3 列出 S3 存储桶的目录内容？

我正在尝试使用 Python 和 Boto3 列出 S3 存储桶中的所有目录我正在使用以下代码 s3 session resource s3 I already have a boto3 Session object bucket nam
重用 Jest 单元测试

我正在尝试使用 Jest 测试几个数据库实现为了帮助测试这些实现我首先针对两个实现都预期实现的 API 提出了一组单元测试我目前正在努力将这两个实现传递给测试套件下面是最简单形式的虚拟 MongoDB 实现 class Mongo
使用 Ant 运行 JUnit 测试

我正在尝试运行我的 JUnit 测试用例但我不断收到错误 Test com capscan accentsWorld FAILED 报告已创建但测试未运行这是我的蚂蚁代码
backbone.js - 如何在视图之间进行通信？

我有一个带有多个backbone js 视图的单页Web 应用程序观点有时必须相互沟通两个例子当有两种方式视图同时以不同方式呈现集合时并且对一个视图中的项目的点击必须转发到另一个视图当用户转换到流程的下一个阶段时第一个视图将数据
Java发送邮件出错

我的代码是 File Name SendEmail java import java util import javax mail import javax mail internet import javax activation pub
使用虚拟列表视图调用 BeginUpdate/EndUpdate 是否有用

我有一个虚拟列表视图其中有数百个项目我必须定期更新文件列表视图方法是清除它然后向其中添加新的更新的项目执行此操作时调用 BeingUpdate 和 EndUpdate 有用吗我没有注意到任何视觉差异 Thanks 使用可能有一
优化数组压缩

假设我有一个数组k 1 2 0 0 5 4 0 我可以按如下方式计算掩码m k gt 0 1 1 0 0 1 1 0 仅使用掩码 m 和以下操作左移右移 And Or 加减乘我可以将 k 压缩为以下形式 1 2 5 4 以下是我目

优化数组压缩

优化数组压缩 的相关文章

随机推荐

热门标签

优化数组压缩的相关文章