失败如何使用 sun.misc.Unsafe 加快 byte[] 查找速度？

2023-11-27

我正在尝试使用 Unsafe 来迭代内存，而不是迭代 byte[] 中的值。使用 unsafe 分配内存块。内存足以保存 65536 字节值。

我正在尝试这个：

char aChar = some character

if ((byte) 0 == (unsafe.getByte(base_address + aChar) & mask)){
 // do something
}

代替：

char aChar = some character

if ((byte) 0 == ( lookup[aChar] & mask )){
 // do something
}

I thought不安全可以比使用常规数组访问更快地访问内存，并且对每个索引进行索引检查......

jvm 有一个特殊的操作（不安全）可以以某种方式使常规数组访问和迭代更快，这只是一厢情愿的想法。在我看来，jvm 可以很好地处理正常的 byte[] 迭代，并且使用正常的、纯粹的、普通的 java 代码尽可能快地完成它们。

@millimoose 击中了众所周知的“要害”

“不安全可能对很多事情都有用，但这种程度的微优化不是其中之一。——millimoose”

我认为你发布的两个函数基本上是相同的，因为它们只读取 1 个字节，然后将其转换为 int 并进行进一步比较。

每次读取 4 字节 int 或 8 字节 long 会更有效。我写了两个函数来做同样的事情：比较两个 byte[] 的内容，看看它们是否相同：

功能1：

public static boolean hadoopEquals(byte[] b1, byte[] b2)
  {
    if(b1 == b2)
    {
      return true;
    }
    if(b1.length != b2.length)
    {
      return false;
    }
    // Bring WritableComparator code local

    for(int i = 0;i < b1.length; ++i)
    {
     int a = (b1[i] & 0xff);
     int b = (b2[i] & 0xff);
     if (a != b) 
     {
       return false;
     }
    }
    return true;
  }

功能2：

public static boolean goodEquals(byte[] b1,byte[] b2)
  {   
    if(b1 == b2)
    {
      return true;
    }
    if(b1.length != b2.length)
    {
      return false;
    }
    int baseOffset = UnSafe.arrayBaseOffset(byte[].class);

    int numLongs = (int)Math.ceil(b1.length / 8.0);

    for(int i = 0;i < numLongs; ++i)
    {
      long currentOffset = baseOffset + (i * 8);
      long l1 = UnSafe.getLong(b1, currentOffset);
      long l2 = UnSafe.getLong(b2, currentOffset);
      if(0L != (l1 ^ l2))
      {
        return false;
      }
    }
    return true;    
  }

我在我的笔记本电脑（corei7 2630QM，8GB DDR3，64位win 7，64位Hotspot JVM）上运行这两个函数，并比较两个400MB byte[]，结果如下：

功能 1：~670ms

功能 2：~80ms

2 速度更快。

所以我的建议是每次读取8字节并使用XOR运算符(^)：

long l1 = UnSafe.getLong(byteArray, offset);  //8 byte
if(0L == l1 ^ 0xFF)  //if the lowest byte == 0?
/* do something */
if(0L == l1 ^ 0xFF00)  //if the 2nd lowest byte == 0?
/* do something */
/* go on... */

=================================================== =========================

嗨威尔夫，我使用你的代码制作了一个测试类，如下所示，该类比较了 3 个函数在字节数组中查找第一个 0 的速度：

package test;

import java.lang.reflect.Field;

import sun.misc.Unsafe;

/**
 * Test the speed in looking up the 1st 0 in a byte array
 * Set -Xms the same as -Xms to avoid Heap reallocation
 * 
 * @author yellowb
 *
 */
public class StackOverflow
{
    public static Unsafe UnSafe;

    public static Unsafe getUnsafe() throws SecurityException,
            NoSuchFieldException, IllegalArgumentException,
            IllegalAccessException
    {
        Field theUnsafe = Unsafe.class.getDeclaredField("theUnsafe");
        theUnsafe.setAccessible(true);
        Unsafe unsafe = (Unsafe) theUnsafe.get(null);
        return unsafe;
    }

    /**
     * use 'byte[index]' form to read 1 byte every time
     * @param buf
     */
    public static void normalLookup(byte[] buf)
    {
        for (int i = 0; i < buf.length; ++i)
        {
            if ((byte) 0 == buf[i])
            {
                System.out.println("The 1st '0' is at position : " + i);
                return;
            }
        }
        System.out.println("Not found '0'");
    }

    /**
     * use Unsafe.getByte to read 1 byte every time directly from the memory
     * @param buf
     */
    public static void unsafeLookup_1B(byte[] buf)
    {
        int baseOffset = UnSafe.arrayBaseOffset(byte[].class);
        for (int i = 0; i < buf.length; ++i)
        {
            byte b = UnSafe.getByte(buf, (long) (baseOffset + i));
            if (0 == ((int) b & 0xFF))
            {
                System.out.println("The 1st '0' is at position : " + i);
                return;
            }

        }
        System.out.println("Not found '0'");
    }

    /**
     * use Unsafe.getLong to read 8 byte every time directly from the memory
     * @param buf
     */
    public static void unsafeLookup_8B(byte[] buf)
    {
        int baseOffset = UnSafe.arrayBaseOffset(byte[].class);

        //The first (numLongs * 8) bytes will be read by Unsafe.getLong in below loop
        int numLongs = buf.length / 8;
        long currentOffset = 0L;
        for (int i = 0; i < numLongs; ++i)
        {
            currentOffset = baseOffset + (i * 8);  //the step is 8 bytes
            long l = UnSafe.getLong(buf, currentOffset);
            //Compare each byte(in the 8-Byte long) to 0
            //PS:x86 cpu is little-endian mode
            if (0L == (l & 0xFF))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8));
                return;
            }
            if (0L == (l & 0xFF00L))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8 + 1));
                return;
            }
            if (0L == (l & 0xFF0000L))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8 + 2));
                return;
            }
            if (0L == (l & 0xFF000000L))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8 + 3));
                return;
            }
            if (0L == (l & 0xFF00000000L))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8 + 4));
                return;
            }
            if (0L == (l & 0xFF0000000000L))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8 + 5));
                return;
            }
            if (0L == (l & 0xFF000000000000L))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8 + 6));
                return;
            }
            if (0L == (l & 0xFF00000000000000L))
            {
                System.out.println("The 1st '0' is at position : " + (i * 8 + 7));
                return;
            }
        }

        //If some rest bytes exists
        int rest = buf.length % 8;
        if(0 != rest)
        {
            currentOffset = currentOffset + 8;
            //Because the length of rest bytes < 8,we have to read them one by one
            for(; currentOffset < (baseOffset + buf.length); ++currentOffset)
            {
                byte b = UnSafe.getByte(buf, (long)currentOffset);
                if (0 == ((int) b & 0xFF))
                {
                    System.out.println("The 1st '0' is at position : " + (currentOffset - baseOffset));
                    return;
                }
            }
        }
        System.out.println("Not found '0'");
    }

    public static void main(String[] args) throws SecurityException,
            NoSuchFieldException, IllegalArgumentException,
            IllegalAccessException
    {
        UnSafe = getUnsafe();

        int len = 1024 * 1024 * 1024;  //1G
        long startTime = 0L;
        long endTime = 0L;

        System.out.println("initialize data...");
        byte[] byteArray1 = new byte[len];
        for (int i = 0; i < len; ++i)
        {
            byteArray1[i] = (byte) (i % 128 + 1);  //No byte will equal to 0
        }
        //If you want to set one byte to 0,uncomment the below statement
//      byteArray1[2500] = (byte)0;
        System.out.println("initialize data done!");

        System.out.println("use normalLookup()...");
        startTime = System.nanoTime();
        normalLookup(byteArray1);
        endTime = System.nanoTime();
        System.out.println("time : " + ((endTime - startTime) / 1000) + " us.");

        System.out.println("use unsafeLookup_1B()...");
        startTime = System.nanoTime();
        unsafeLookup_1B(byteArray1);
        endTime = System.nanoTime();
        System.out.println("time : " + ((endTime - startTime) / 1000) + " us.");

        System.out.println("use unsafeLookup_8B()...");
        startTime = System.nanoTime();
        unsafeLookup_8B(byteArray1);
        endTime = System.nanoTime();
        System.out.println("time : " + ((endTime - startTime) / 1000) + " us.");
    }
}

输出是：

initialize data...
initialize data done!
use normalLookup()...
Not found '0'
time : 1271781 us.
use unsafeLookup_1B()...
Not found '0'
time : 716898 us.
use unsafeLookup_8B()...
Not found '0'
time : 591689 us.

结果表明，即使每次通过 Unsafe.getByte() 读取 1 个字节，也比定期迭代 byte[] 快得多，并且读取 8 个字节长是最快的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

performance

unsafe

失败如何使用 sun.misc.Unsafe 加快 byte[] 查找速度？的相关文章

Java Swing BoxLayout 忽略 AlignmentX

在下面的代码中通过调用setAlignmentX with Component LEFT ALIGNMENT我希望在居中的滑块上获得左对齐的标签由于某种原因标签也居中似乎与传递给 setAlignmentX 的值无关我必须向 se
Android：java.lang.OutOfMemoryError：

我在 Android 上开发了一个使用大量图像的应用程序可绘制文件夹中有很多图像比如说超过 100 张我正在开发图像动画应用程序我使用 imageview 来显示 GIF 图像我使用了将 gif 图像分割成多个 PNG 格式图像的
java 中的梵文 i18n

我正在尝试使用来自互联网的示例 ttf 文件在 java 中使用 i18n 进行梵文印地文我可以加载资源包条目还可以加载 ttf 并设置字体但它不会根据需要呈现 jlabel 它显示块代替字符如果我在 Eclipse 中调试我可
为什么通过方法向 List 添加元素（类型正确）会出现编译错误？ [复制]

这个问题在这里已经有答案了我对泛型通配符概念几乎没有疑问 1 假设我有一个方法 void write List
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
如何将本机数据库运算符 (postgres ~) 与 JPA 标准生成器一起使用？

我使用 JPA 2 0 标准构建以下查询简化 select n from notif n where n message b la 我正在使用 postgresql 数据库我真的需要运算符而不是像我可以使用与 CriteriaBu
H2数据库：如何进行加密保护，而不暴露文件加密密钥

我们在服务器模式下使用Java H2数据库因为我们不希望用户访问数据库文件为了对数据库文件添加更多保护我们计划使用 AES 加密将 CIPHER AES 添加到数据库 URL 以防存储被盗但是每个用户在连接时还需要提供文件保护密
Selenium 和 TestNG 同时使用“dependsOn”和“priority =”问题

我正在努力在 GUI 自动化测试中实现更好的工作流程控制我首先从dependsOn开始但很快发现缺点是如果一个测试失败则套件的整个其余部分都不会运行所以我改用 priority 但看到了意外的行为一个例子 Test priorit
Spring HATEOAS 和 HAL：更改 _embedded 中的数组名称

我正在尝试使用 Spring HATEOAS 构建符合 HAL 的 REST API 经过一番摆弄后我终于开始工作了mostly正如预期的那样示例输出现在看起来像这样 links self href http localhost 808
膨胀类 android.support.design.widget.NavigationView 时出错

我按照 NavigationView 的教程进行操作但无法解决此错误消息 Error inflating class android support design widget NavigationView 教程链接 https www
Time.valueOf 方法返回错误值

我使用 Time valueOf 方法将字符串 09 00 00 转换为 Time 对象如下所示 Time valueOf LocalTime parse 09 00 00 当我调用 getTime 来显示我得到的值时 28800000
如何使用 Java 在 selenium webdriver 中打开新选项卡或如何使用使用 selenium webdriver 的操作类在 selenium 中按 ctrl +T [重复]

这个问题在这里已经有答案了如何使用 Java 在 Selenium Webdriver 中按 CTRL T 或者如何使用 Java 在 selenium webdriver 中打开新选项卡简单步骤 1 打开google com 不必触
Janusgraph 0.3.2 + HBase 1.4.9 - 无法设置 graph.timestamps

我在 Docker 容器中运行 Janusgraph 0 3 2 并尝试使用运行 HBase 1 4 9 的 AWS EMR 集群作为存储后端我可以运行 gremlin server sh 但如果我尝试保存某些内容我会得到粘贴在下面的堆
从字节数组设置 img src

我需要设置img src我在对象中拥有的字节数组的属性 img
Firebase：用户注册后如何进行电话号码验证？

所以我知道我可以使用电子邮件验证或电话号码验证但我想做的是在用户注册或登录后进行电话号码验证如何连接这两种身份验证方法最后 Firebase中是否有一个函数可以检查用户是否通过电话号码验证谢谢即使用户已通过身份验证您仍然可以使用
从 InputStream 中删除换行符

我喜欢从一个文件中删除所有换行符对于 n 和 r n java io InputStream 在读取文件时相应的方法如下所示 param target linkplain File return linkplain InputStrea
我怎样才能限定我不“拥有”的自动装配设置器

要点是 Spring Batch v2 测试框架具有JobLauncherTestUtils setJob与 Autowired注解我们的测试套件有多个Job类提供者由于这个类不是我可以修改的东西我不确定如何限定它自动连接的作业每个
如何在J2ME中获取数字的幂[重复]

这个问题在这里已经有答案了可能的重复 J2ME power double double 数学函数实现 https stackoverflow com questions 2076913 j2me powerdouble double ma
Android ClassNotFoundException：在路径上找不到类

10 22 15 29 40 897 E AndroidRuntime 2561 FATAL EXCEPTION main 10 22 15 29 40 897 E AndroidRuntime 2561 java lang Runtime
如何使用socket.io发送图像文件（二进制数据）？

我无法从以下位置发送数据Android Client to NodeJS Server I use Socket IO 客户端 https github com socketio socket io client java我的客户端中的ja

随机推荐

如何查找 Zip 文件中中央目录的位置？

我试图找到 Zip 文件中第一个中央目录文件头的位置我正在读这些 http en wikipedia org wiki Zip 文件格式 http www pkware com documents casestudies APPNOTE
将文件夹中的许多羽毛文件加载到dask中

一个文件夹有很多 feather文件我想将它们全部加载到 python 中的 dask 中到目前为止我已经尝试了以下来自 GitHub 上类似问题的内容https github com dask dask issues 1277 fi
带有 Babel 延迟加载模块的 Webpack 使用 ES6 推荐的 Import() 方法不起作用

我正在尝试使用 webpack 进行代码分割和延迟加载导入方法 import myLazyModule then function module do something with module myLazyModule 我越来越导入
如何使用反射调用泛型类的静态属性？

我有一个类我无法修改可以简化为 public class Foo
android底部导航栏超过3个项目

我是 android 新手我正在尝试制作一个底部导航栏中包含 3 个以上元素的应用程序我能够显示它们但它们在最后聚集在一起并且只有三个可以正确可见这是我的代码
数据绑定后如何将图像设置为数据网格视图单元格？

我在数据绑定后将图像添加到 DGV 单元时遇到问题这是我的代码 DataTable tab conn searchData searchTmp bindingSource1 DataSource tab DGV AllowUserToAd
Facebook 应用程序：Firebase 简单登录 URL 错误

我正在尝试使用 Facebook 登录和 Firebase 简单登录来制作我的第一个应用程序我在本地运行系统http localhost 8000 单击登录按钮时收到的错误如下应用程序配置不允许给定 URL 一个或应用程序的设置不允许
取消选中“调整滚动视图插入”xcode 6 后 UIScrollView 不滚动

在我的应用程序中我尝试使用滚动视图但我遇到了一个问题即滚动视图在顶部和底部添加了空间如以下问题所述 ScrollView 在子视图顶部添加空间 xcode 6 Swift 我被要求取消选中包含视图控制器的调整滚动视图插入这样做就
BadArgumentError：带游标的 _MultiQuery 需要 ndb 中的 __key__ 顺序

我无法理解这个错误的含义显然没有人在互联网上遇到过同样的错误 BadArgumentError 带游标的 MultiQuery 需要 key order 这发生在这里 return SocialNotification query or
巴比伦方法的时间复杂度

巴比伦方法的时间复杂度是多少是log n 吗其中n是我们要求平方根的数字如果是这样为什么会这样呢 Looking at the wikipedia section for the Babylonian method we can s
可以链接比较运算符吗？

到目前为止我无法在官方 PHP 文档或本网站上找到此信息因此这可能意味着我正在使用错误的术语进行搜索或者它不受支持我在寻找什么我来描述一下假设我在 PHP 中有以下比较 if a b b c doSomething else
Symfony 2：如何处理表单中的嵌套集合

我正在尝试创建一个包含嵌套集合的表单我不知道如何处理 JS 部分来显示子集合有人知道我该怎么做吗这是我的表单的代码 class ParentFormType extends AbstractType public function b
ffmpeg解码h264延迟

我正在获取原始 RGB 帧将它们编码为 h264 然后将它们解码回原始 RGB 帧 RGB frame encoder gt h264 stream decoder gt RGB frame encoder write encoder r
相当于SQL Server中Oracle的RowID

SQL Server 中 Oracle 的 RowID 相当于什么来自 Oracle 文档 ROWID伪列对于数据库中的每一行 ROWID 伪列返回该行的地址 Oracle数据库rowid值包含信息需要定位一行对象的数据对象编号
jq 按值从数组中删除元素

我在用着jq并尝试根据其值从数组中删除元素但无法弄清楚语法它适用于 map 但不适用于 del input 10 11 12 echo input jq r map select 10 回报 10 echo input jq r del
如何使用 Windows Powershell 自动打印为 PDF

我有一个文件夹其中有n个word excel和powerpoint文件扩展名为 Doc Docx xls xlsx ppt等应使用 Microsoft 打印到 PDF 选项将这些文件的内容转换为 PDF 而不改变其格式并且输出文件应
双模板方法的部分特化失败

有模板类List template
如何从 ruby 中调用 C++ 函数

我是一位经验丰富的 C C 开发人员但我是 Ruby 的新手如何在 Ruby 中使用 with 调用 C 函数你有3种可能性 1 Ruby能够加载库即使有点棘手您也可以决定编写自己的加载器并在 Ruby 中绑定您的 C 库这是使
如何在 PhpDoc 中指定对象数组[重复]
**失败** 如何使用 sun.misc.Unsafe 加快 byte[] 查找速度？

我正在尝试使用 Unsafe 来迭代内存而不是迭代 byte 中的值使用 unsafe 分配内存块内存足以保存 65536 字节值我正在尝试这个 char aChar some character if byte 0 unsafe

**失败** 如何使用 sun.misc.Unsafe 加快 byte[] 查找速度？

**失败** 如何使用 sun.misc.Unsafe 加快 byte[] 查找速度？ 的相关文章

随机推荐

热门标签

失败如何使用 sun.misc.Unsafe 加快 byte[] 查找速度？

失败如何使用 sun.misc.Unsafe 加快 byte[] 查找速度？的相关文章