数组访问可以优化吗？

2024-01-03

也许我被我的分析器（Netbeans）误导了，但我看到了一些奇怪的行为，希望这里有人可以帮助我理解它。

我正在开发一个应用程序，它大量使用相当大的哈希表（键是长整型，值是对象）。内置的 java 哈希表（特别是 HashMap）的性能非常差，在尝试了一些替代方案（Trove、Fastutils、Colt、Carrot）后，我开始自己工作。

该代码非常基本，使用双重哈希策略。这工作得很好，并且显示了迄今为止我尝试过的所有其他选项的最佳性能。

问题是，根据探查器，对哈希表的查找是整个应用程序中最昂贵的方法——尽管事实上调用了其他方法many更多次，和/或做a lot更多逻辑。

真正让我困惑的是，这些查找仅由一个类调用；调用方法进行查找并处理结果。两者被调用的次数几乎相同，并且调用查找的方法中有很多逻辑来处理查找结果，但速度大约快 100 倍。

下面是哈希查找的代码。它基本上只是对数组的两次访问（根据分析，计算哈希码的函数实际上是免费的）。我不明白这段代码怎么会这么慢，因为它只是数组访问，而且我没有看到任何让它更快的方法。

请注意，代码只是返回与键匹配的存储桶，调用者应该处理该存储桶。 'size'是hash.length/2，hash1在哈希表的前半部分查找，hash2在后半部分查找。 key_index 是传递给构造函数的哈希表上的最终 int 字段，Entry 对象上的值数组是一个小型 long 数组，通常长度为 10 或更小。

人们对此有任何想法都非常感激。

Thanks.

public final Entry get(final long theKey) {
    Entry aEntry = hash[hash1(theKey, size)];

    if (aEntry != null && aEntry.values[key_index] != theKey) {
        aEntry = hash[hash2(theKey, size)];

        if (aEntry != null && aEntry.values[key_index] != theKey) {
            return null;
        }
    }

    return aEntry;
}

编辑hash1和hash2的代码

private static int hash1(final long key, final int hashTableSize) { 
    return (int)(key&(hashTableSize-1)); 
}
private static int hash2(final long key, final int hashTableSize) { 
    return (int)(hashTableSize+((key^(key>>3))&(hashTableSize-1))); 
}

你的里面什么都没有执行我觉得效率特别低。我承认我并没有真正遵循你的哈希/查找strategy，但如果你说它在你的情况下表现良好，我会相信你。

我唯一期望的可能是some区别在于将键移出值数组Entry.

而不是这样：

class Entry {
    long[] values;
}

//...
if ( entry.values[key_index] == key ) { //...

尝试这个：

class Entry {
    long key;
    long values[];
}

//...
if ( entry.key == key ) { //...

您不应该产生访问成员的成本，加上进行边界检查，然后获取数组的值，而应该只产生访问成员的成本。

是否有比数组更快的随机访问数据类型？

我对这个问题的答案很感兴趣，所以搭建了一个测试环境。这是我的数组界面：

interface Array {
    long get(int i);
    void set(int i, long v);
}

当索引超出范围时，此“数组”具有未定义的行为。我将明显的实现放在一起：

class NormalArray implements Array {
    private long[] data;

    public NormalArray(int size) {
        data = new long[size];
    }

    @Override
    public long get(int i) {
        return data[i];
    }

    @Override
    public void set(int i, long v) {
        data[i] = v;
    }
}

然后是一个控件：

class NoOpArray implements Array {
    @Override
    public long get(int i) {
        return 0;
    }
    @Override
    public void set(int i, long v) {
    }
}

最后，我设计了一个“数组”，其中前 10 个索引是硬编码成员。成员通过开关设置/选择：

class TenArray implements Array {
    private long v0;
    private long v1;
    private long v2;
    private long v3;
    private long v4;
    private long v5;
    private long v6;
    private long v7;
    private long v8;
    private long v9;
    private long[] extras;

    public TenArray(int size) {
        if (size > 10) {
            extras = new long[size - 10];
        }
    }

    @Override
    public long get(final int i) {
        switch (i) {
        case 0:
            return v0;
        case 1:
            return v1;
        case 2:
            return v2;
        case 3:
            return v3;
        case 4:
            return v4;
        case 5:
            return v5;
        case 6:
            return v6;
        case 7:
            return v7;
        case 8:
            return v8;
        case 9:
            return v9;
        default:
            return extras[i - 10];
        }
    }

    @Override
    public void set(final int i, final long v) {
        switch (i) {
        case 0:
            v0 = v; break;
        case 1:
            v1 = v; break;
        case 2:
            v2 = v; break;
        case 3:
            v3 = v; break;
        case 4:
            v4 = v; break;
        case 5:
            v5 = v; break;
        case 6:
            v6 = v; break;
        case 7:
            v7 = v; break;
        case 8:
            v8 = v; break;
        case 9:
            v9 = v; break;
        default:
            extras[i - 10] = v;
        }
    }
}

我用这个线束测试了它：

import java.util.Random;

public class ArrayOptimization {
    public static void main(String[] args) {
        int size = 10;
        long[] data = new long[size];
        Random r = new Random();
        for ( int i = 0; i < data.length; i++ ) {
            data[i] = r.nextLong();
        }

        Array[] a = new Array[] {
                new NoOpArray(),
                new NormalArray(size),
                new TenArray(size)
        };

        for (;;) {
            for ( int i = 0; i < a.length; i++ ) {
                testSet(a[i], data, 10000000);
                testGet(a[i], data, 10000000);
            }
        }
    }

    private static void testGet(Array a, long[] data, int iterations) {
            long nanos = System.nanoTime();
        for ( int i = 0; i < iterations; i++ ) {
            for ( int j = 0; j < data.length; j++ ) {
                data[j] = a.get(j);
            }
        }
        long stop = System.nanoTime();
        System.out.printf("%s/get took %fms%n", a.getClass().getName(), 
                (stop - nanos) / 1000000.0);
    }

    private static void testSet(Array a, long[] data, int iterations) {
        long nanos = System.nanoTime();
        for ( int i = 0; i < iterations; i++ ) {
            for ( int j = 0; j < data.length; j++ ) {
                a.set(j, data[j]);
            }
        }
        long stop = System.nanoTime();
        System.out.printf("%s/set took %fms%n", a.getClass().getName(), 
                (stop - nanos) / 1000000.0);

    }
}

结果有些令人惊讶。 TenArray 的执行速度比 NormalArray 快得多（对于大小 is可能超过阵列的速度。我想 switch 使用比数组更少的边界检查或更有效的边界检查。

NoOpArray/set took 953.272654ms
NoOpArray/get took 891.514622ms
NormalArray/set took 1235.694953ms
NormalArray/get took 1148.091061ms
TenArray/set took 1149.833109ms
TenArray/get took 1054.040459ms
NoOpArray/set took 948.458667ms
NoOpArray/get took 888.618223ms
NormalArray/set took 1232.554749ms
NormalArray/get took 1120.333771ms
TenArray/set took 1153.505578ms
TenArray/get took 1056.665337ms
NoOpArray/set took 955.812843ms
NoOpArray/get took 893.398847ms
NormalArray/set took 1237.358472ms
NormalArray/get took 1125.100537ms
TenArray/set took 1150.901231ms
TenArray/get took 1057.867936ms

现在我不确定你在实践中是否可以获得比阵列更快的速度；显然，这种方式会产生与接口/类/方法相关的任何开销。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数组访问可以优化吗？的相关文章

(Java) App Engine 中的静态文件无法访问

The 示例文档 http code google com appengine docs java gettingstarted staticfiles html表示您只需将文件放在 war 或子目录中并且应该可以从主机访问它们只要它
如何将jscrollpane添加到jframe？

我有以下源代码有人可以给我建议如何将 jscrollpane 添加到 jframe 上吗我尝试了几次将其添加到 jframe 但没有任何进展它甚至没有显示 public class Form3 JFrame jframe new JF
Reactive Spring 不支持 HttpServletRequest 作为 REST 端点中的参数？

我创建了一个 RestController 如下所示 RestController public class GreetingController RequestMapping value greetings method RequestM
文本在指定长度后分割，但不要使用 grails 打断单词

我有一个长字符串需要将其解析为长度不超过 50 个字符的字符串数组对我来说棘手的部分是确保正则表达式找到 50 个字符之前的最后一个空格以便在字符串之间进行彻底的分隔因为我不希望单词被切断 public List
为什么 MOVE CURSOR 在 OS X Mountain Lion 上不显示？

我正在做一个项目想看看 Swing 提供的每个光标是什么样子的 public class Test public static void main String args JFrame frame new JFrame frame set
Spring数据中的本机查询连接

我有课 Entity public class User Id Long id String name ManyToMany List
是否可以从 servlet 内部以编程方式设置请求上下文路径？

这是一个特殊情况我陷入了处理企业网络应用程序的困境企业应用程序正在调用request getContext 并将其与另一个字符串进行比较我发现我可以使用 getServletContext getContextPath 获取 se
org/codehaus/plexus/archiver/jar/JarArchiver（不支持的major.minor版本49.0）-Maven构建错误

下午大家我在尝试构建项目时收到上述错误我很确定这与使用 Java 1 6 编译的 Maven 最新更新有关而我们尝试构建的项目是 1 4 项目在此之前的插件工作没有问题因此我将以下内容添加到 POM xml 文件中以尝试强制使用现
从直方图计算平均值和百分位数？

我编写了一个计时器可以测量任何多线程应用程序中特定代码的性能在下面的计时器中它还会在地图中填充花费了 x 毫秒的调用次数我将使用这张图作为我的直方图的一部分来进行进一步的分析例如调用花费了这么多毫秒的百分比等等 public st
虽然我的类已加载，但 Class.forName 抛出 ClassNotFoundException

代码如下它的作用是加载我放在主目录中的 jar 文件中的所有类 import java io File import java util jar JarFile import java util jar JarEntry import j
当 minifyEnabled 为 true 时 Android 应用程序崩溃

我正在使用多模块应用程序并且该应用程序崩溃时minifyEnabled true in the installed模块的build gradle 以下是从游戏控制台检索到的反混淆堆栈跟踪 FATAL EXCEPTION Controlle
Java：如何确定文件所在的驱动器类型？

Java 是否有一种独立于平台的方法来检测文件所在的驱动器类型基本上我有兴趣区分硬盘可移动驱动器如 USB 记忆棒和网络共享 JNI JNA 解决方案不会有帮助可以假设 Java 7 您可以使用 Java 执行 cmd fsut
如何从日期中删除毫秒、秒、分钟和小时[重复]

这个问题在这里已经有答案了我遇到了一个问题我想比较两个日期然而我只想比较年月日这就是我能想到的 private Date trim Date date Calendar calendar Calendar getInstanc
JAVA中遍历JSON数据

我是 JSON 新手我使用 HTTPUrlConnections 并在 JAVA 程序中获得一些响应响应数据将类似于 data id 1 userId 1 name ABC modified 2014 12 04 created 201
如何从 Ant 启动聚合 jetty-server JAR？

背景免责声明 I have veryJava 经验很少我们之前在 Ant 构建期间使用了 Jetty 6 的包装版本来处理按需静态内容 JS CSS 图像 HTML 因此我们可以使用 PhantomJS 针对 HTTP 托管环境运行单元
数组上的 Bash 子字符串扩展

我有一组带有给定后缀的文件例如我有一组带有后缀的pdf文件 pdf 我想使用子字符串扩展来获取不带后缀的文件名对于单个文件我可以使用 file test pdf echo file 0 4 要对所有文件执行此操作我现在尝试 file
源值 1.5 的错误已过时，将在未来版本中删除

我使用 scala maven plugin 来编译包含 scala 和 java 代码的项目我已经将源和目标设置为1 7 但不知道为什么maven仍然使用1 5 这是我在 pom xml 中的插件
何时在 hibernate 中使用 DiscriminatorValue 注解

在 hibernate 中使用 DiscriminatorValue 注释的最佳场景是什么以及何时这两个链接最能帮助我理解继承概念 http docs oracle com javaee 6 tutorial doc bnbqn html
检查应用程序是否在 Android Market 上可用

给定 Android 应用程序 ID 包名称如何以编程方式检查该应用程序是否在 Android Market 上可用例如 com rovio angrybirds 可用而 com random app ibuilt 不可用我计划从
如何使用通配符模拟泛型方法的行为

我正在使用 EasyMock 3 2 我想基于 Spring Security 为我的部分安全系统编写一个测试我想嘲笑Authentication http docs spring io autorepo docs spring secu

随机推荐

在 smarty 模板中创建数组？ [复制]

这个问题在这里已经有答案了我需要从 smarty 模板中的其他一维数组创建一个新数组那么在模板文件中创建数组的最佳可能性是什么谢谢萨钦 Smarty3 让您 var foo gt bar sub gt 1 2 3 and var
Ruby 中 $$ 的含义是什么？

irb main 002 0 gt gt 5052 是什么意思在 Ruby 中以及如何在哪里使用它 is the 进程号 http www opengroup org onlinepubs 9699919799 functions ge
HeapTaskDaemon 线程阻塞的 ANR

我的 Android 应用程序出现 ANR 错误跟踪显示只有一个线程处于阻塞状态所有其他线程都处于等待睡眠本机状态因此它似乎并未处于死锁状态我手动直接启动了两个线程因此我大致知道 ANR 发生在应用程序的哪个部分不幸的是
从Python文件中读取单个字符？

我的问题是除了下面之外是否还有其他方法可以一次一个字符地遍历文件 with open filename as f while True c f read 1 if not c print End of file break print
使 tkinter 文本小部件适合窗口

我正在制作一个文本编辑器其主要小部件是一个文本小部件供用户实际输入文本当用户调整窗格大小时我需要使文本小部件适合窗口我通过使小部件变大来有点作弊但这只是一个临时解决方案让我在寻找解决方案时可以处理其他部分如何使文本小部件自动
如何在 Rails 2.3.5 中安装/使用 Devise？

我尝试从 Github 上 Devise 的 v 1 2 oauth 分支进行安装但仍然出现错误如何在 Rails 2 3 5 应用程序上安装 devise gem 我特别想要一个可以与omniauth一起使用的 gem install
Mac App Store：放弃 32 位支持转而支持 ARC，32 位版本的现有用户会看到更新消息吗？

我正在考虑放弃 32 位支持转而支持自动引用计数仅支持 64 位二进制文件我想在 Mac App Store 中避免出现这两种情况 For a 旧 32 位 Mac 用户谁购买了支持 32 位的先前版本他们会在 Mac App
Python 中是否有用于纯文本文件的本机模板系统？

我正在寻找用于将输出格式化为简单文本的 Python 技术或模板系统我需要的是它将能够迭代多个列表或字典如果我能够将模板定义到单独的文件如output templ 中而不是将其硬编码到源代码中那就太好了作为我想要实现的简单示例我
如何从9GAG获取数据json

也许你认为这是一个愚蠢的问题但我希望你能给我一些建议我的问题当我查看 9gag com 的源代码时我意识到他们有一些行代码来加载更多内容 div class loading a class btn badge load more p
PyYAML 中的数组没有缩进或空格

在下面的代码中我创建了net plan dict变量字典并将其转换为YAML格式文件在字典里我有一个叫做addresses这是一个由三个元素组成的数组创建YAML文件后这三个数组元素没有放置在addresses field impor
JPA针对不同数据库的不同列类型

是否可以根据使用的数据库使用 JPA 定义不同的列类型我需要将 id 存储为 uuid 并且它必须是可移植的那就是问题所在 PostgreSQL有 uuid MSSQL有 uniqueidentifier 而Oracle什么都没有我想
android中textview的圆角

我有一个文本视图希望它的角是圆形的我已经知道可以使用android background drawable somefile 就我而言该标签已包含在内因此无法再次使用例如android background drawable my
Rails 更改 form_for 中提交的路由

我有一个模型文章和一个嵌套在文章中的模型评级文章 123 评级我想更改 ratings form html erb 中 f submit 的路由现在是这样按提交后我的申请路由到评分 111 但我想将其路由到文章 123
WCF 服务应该返回 EntityObject 还是 POCO/DTO 类？

我一直在查看很多使用 EntityFramework 的 WCF 示例其中大多数似乎都会向客户端返回某种 POCO 或 DTO 类我想知道为什么这是默认的EntityObject包括 DataContract 属性和工具INotifyP
Angula2 Karma 无法加载“webpack”！

我已经在 Angular2 项目 Webpack Karma 上工作了几个月该项目基于此入门程序的稍旧版本 https github com preboot angular2 webpack https github com preboo
带注入的定制 Serilog 水槽？

我创建了一个简单的 Serilog 接收器项目如下所示 namespace MyApp Cloud Serilog MQSink public class MessageQueueSink ILogEventSink private re
无法使用@Value在Spring应用程序中获取maven project.version属性

如何使用 Value注释在Spring Boot应用程序中获取maven project version属性经过一些关于如何在 SpringBoot 应用程序中获取 Maven 项目版本的研究和试验后我找不到任何适合我的东西由于类加载
为 Goldschmidt 部门挑选良好的初步估计

我正在计算 Q22 10 中的定点倒数戈德施密特师 http en wikipedia org wiki Division digital Goldschmidt division用于我的 ARM 上的软件光栅器只需将分子设置为 1 即可
实体 .ToList() 生成 System.OutOfMemoryException

我有一个包含 50 万行的表我需要更新每一行但 ToList 失败 List
数组访问可以优化吗？

也许我被我的分析器 Netbeans 误导了但我看到了一些奇怪的行为希望这里有人可以帮助我理解它我正在开发一个应用程序它大量使用相当大的哈希表键是长整型值是对象内置的 java 哈希表特别是 HashMap 的性能非常差在

数组访问可以优化吗？

是否有比数组更快的随机访问数据类型？

数组访问可以优化吗？ 的相关文章

随机推荐

热门标签

数组访问可以优化吗？的相关文章