如何加快这段 Java 代码的速度？

2024-04-19

我正在尝试测试 Java 执行一项简单任务的速度有多快：将一个大文件读入内存，然后对数据执行一些无意义的计算。所有类型的优化都很重要。无论是以不同的方式重写代码还是使用不同的 JVM，欺骗 JIT ..

输入文件是一个由逗号分隔的 5 亿长的 32 位整数对列表。像这样：

44439,5023
33140,22257
...

该文件需要5.5GB在我的机器上。该程序不能使用超过8GBRAM 且只能使用单线程.

package speedracer;

import java.io.FileInputStream;
import java.nio.MappedByteBuffer;
import java.nio.channels.FileChannel;

public class Main
{
    public static void main(String[] args)
    {
        int[] list = new int[1000000000];

        long start1 = System.nanoTime();
        parse(list);
        long end1 = System.nanoTime();

        System.out.println("Parsing took: " + (end1 - start1) / 1000000000.0);

        int rs = 0;
        long start2 = System.nanoTime();

        for (int k = 0; k < list.length; k++) {
            rs = calc(list[k++], list[k++], list[k++], list[k]);
        }

        long end2 = System.nanoTime();

        System.out.println(rs);
        System.out.println("Calculations took: " + (end2 - start2) / 1000000000.0);
    }

    public static int calc(final int a1, final int a2, final int b1, final int b2)
    {
        int c1 = (a1 + a2) ^ a2;
        int c2 = (b1 - b2) << 4;

        for (int z = 0; z < 100; z++) {
            c1 ^= z + c2;
        }

        return c1;
    }

    public static void parse(int[] list)
    {
        FileChannel fc = null;
        int i = 0;

        MappedByteBuffer byteBuffer;

        try {
            fc = new FileInputStream("in.txt").getChannel();

            long size = fc.size();
            long allocated = 0;
            long allocate = 0;

            while (size > allocated) {

               if ((size - allocated) > Integer.MAX_VALUE) {
                   allocate = Integer.MAX_VALUE;
               } else {
                   allocate = size - allocated;
               }

               byteBuffer = fc.map(FileChannel.MapMode.READ_ONLY, allocated, allocate);
               byteBuffer.clear();

               allocated += allocate;

               int number = 0;

               while (byteBuffer.hasRemaining()) {
                   char val = (char) byteBuffer.get();
                   if (val == '\n' || val == ',') {
                        list[i] = number;

                        number = 0;
                        i++;
                   } else {
                       number = number * 10 + (val - '0');
                   }
                }
            }

            fc.close();

        } catch (Exception e) {
            System.err.println("Parsing error: " + e);
        }
    }
}

我已经尝试了所有我能想到的。尝试不同的阅读器，尝试过openjdk6、sunjdk6、sunjdk7。尝试过不同的读者。由于 MappedByteBuffer 无法一次映射超过 2GB 的内存，因此必须进行一些丑陋的解析。我在跑：

   Linux AS292 2.6.38-11-generic #48-Ubuntu SMP 
   Fri Jul 29 19:02:55 UTC 2011 
   x86_64 GNU/Linux. Ubuntu 11.04. 
   CPU: is Intel(R) Core(TM) i5-2410M CPU @ 2.30GHz.

目前，我的结果是解析：26.50s，计算：11.27s。我正在与一个类似的 C++ 基准测试进行竞争，该基准测试执行 IO 的时间大致相同，但计算只需要 4.5 秒。我的主要目标是尽一切可能减少计算时间。有任何想法吗？

Update:看来主要的速度改进可能来自所谓的自动矢量化 http://cplusplus-soup.com/2009/02/12/auto-vectorization-and-c/。我能够找到一些提示，表明当前 Sun 的 JIT 只进行“一些矢量化”，但我无法真正确认这一点。如果能找到一些具有更好自动向量化优化支持的 JVM 或 JIT，那就太好了。

首先，-O3启用：

-finline-functions
-ftree-vectorize

其中...

所以看起来它实际上可能是矢量化的。

编辑：这已得到证实。（看评论）C++ 版本确实正在被编译器矢量化。禁用矢量化后，C++ 版本实际上比 Java 版本运行得慢一些

假设 JIT 没有对循环进行向量化，Java 版本可能很难/不可能匹配 C++ 版本的速度。

现在，如果我是一个智能 C/C++ 编译器，我将如何安排该循环（在 x64 上）：

int c1 = (a1 + a2) ^ a2;
int c2 = (b1 - b2) << 4;

int tmp0 = c1;
int tmp1 = 0;
int tmp2 = 0;
int tmp3 = 0;

int z0 = 0;
int z1 = 1;
int z2 = 2;
int z3 = 3;

do{
    tmp0 ^= z0 + c2;
    tmp1 ^= z1 + c2;
    tmp2 ^= z2 + c2;
    tmp3 ^= z3 + c2;
    z0 += 4;
    z1 += 4;
    z2 += 4;
    z3 += 4;
}while (z0 < 100);

tmp0 ^= tmp1;
tmp2 ^= tmp3;

tmp0 ^= tmp2;

return tmp0;

请注意，该循环是完全可矢量化的。

更好的是，我会完全展开这个循环。这些是 C/C++ 编译器要做的事情。但现在的问题是，JIT 会这么做吗？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何加快这段 Java 代码的速度？的相关文章

在大型文本文件中查找重复记录

我在一台 Linux 机器 Redhat 上并且有一个 11GB 的文本文件文本文件中的每一行包含单个记录的数据并且该行的前 n 个字符包含该记录的唯一标识符该文件包含略多于 2700 万条记录我需要验证文件中不存在具有相同唯一标
将列从日期转换为日期时间

我有一个名为Lastmodified 数据类型为Date 但本来应该是DateTime 有没有办法转换列当我使用 SQL Server Management Studio 的设计功能时出现以下错误不允许保存更改您所做的更改需要以
在 C++ 中是否有一种简单的方法可以将由空格字符分隔的一行输入拆分为整数？

我是一名 C 初学者我一直在开发一个项目在该项目中您必须输入一些用空格分隔的整数并且程序必须输出所有可能的整数排列我知道在 python 中这可以使用 int item for item in input split 但我不知道
为什么 clojure future 会阻塞主线程？

我有一个简单的 lein 项目其中 main包含一个未来 def f future 42 defn main args println f 当我跑步时lein run它打印42但不返回我不明白为什么它不返回如何得到lein run回来
语义 UI 表单验证 - 仅当值不为空时验证某些表单字段

我有一个表单其中包含必填字段和可选字段我正在使用语义 UI 的表单验证行为来验证字段然而我想要实现的是表单验证行为仅在可选字段具有值时才验证可选字段可选字段示例 div class field div
在工厂和控制器之间共享 http.get 数据

我成功创建了一个获取 php 文件输出 JSON 的工厂我的问题是如何从控制器内访问它 myApp angular module myApp myApp factory mainData http gt http get gethome
Kotlin 构造函数（主构造函数）

我有一个关于 Kotlin 构造函数的问题 class abc constructor a Int constructor a Int e Int class def a Int constructor a Int e Int this a
NSubstitute 不匹配 Linq 表达式

我正在实现一个存储库模式查询类并使用 NSubstitute 进行测试存储库接口 public interface IMyRepository IQueryable
安装 confluence-kafka 时“文件名或扩展名太长”？

我在使用 pip install confluence kafka 安装 confluence kafka 时遇到一些问题但我收到此错误文件名或扩展名太长详细信息如下 Collecting confluent kafka Using
google api 时刻错误 Google.GoogleApiException

我正在使用谷歌API 我尝试插入时刻但出现错误 Google GoogleApiException 未处理 Message 发生错误但错误响应无法反序列化来源 Google Apis 服务名称任务我的代码创建服务 var serv
如何使用 GWT 检测操作系统？

Basically what I want to know is to find out if my GWT application is running on a MacOS or any other operating system t
Java 将函数添加到 json 对象而不使用引号。

我正在用 java 构建一个 json 对象我需要将一个函数传递到我的 javascript 中并使用 jquery isFunction 对其进行验证我遇到的问题是我必须将 json 对象中的函数设置为字符串但 json 对象将周围
我可以在 Rust 中将 const 与重载运算符一起使用吗？

在此代码中 allow dead code use std ops Add struct Foo i32 const X i32 1 const Y i32 X X const A Foo Foo 1 const B Foo A A imp
pentaho 从不同的 csv 中相互划分 2 列

在pentaho中我有2个csv文件我需要将列彼此分开并将结果写入新表中 1 csv No A B 1 10 14 2 8 20 2 csv No A B 1 2 7 2 4 10 输出应该是输出 csv No A B 1 5 2 2
如何从 AppDelegate.m 设置 tabBarItem 的徽章（tabBarView 不是根视图）[重复]

这个问题在这里已经有答案了我可以通过以下代码更改 AppDelegate m 中的徽章值 UITabBarController tabController UITabBarController self window rootViewCo
Python list.extend() 是保序的吗？

我想知道扩展函数是否保留两个列表中的顺序 gt gt list 1 2 3 gt gt list extend 4 5 gt gt list 1 2 3 4 5 扩展总是这样工作吗 Yes list extend just extends给
类和结构在填充和继承方面的区别

以下所有操作都将在 GCC 9 1 上使用编译器资源管理器 https github com mattgodbolt compiler explorer 在 x86 64 中使用 O3 我有这个代码 struct Base Base do
Xcode 项目/应用程序名称带有空格问题 - 找不到框架

Xcode 6 1 是否可能因为我的 3 个单词应用程序名称而找不到我之前导入的框架我正在使用 Parse 从来没有遇到过任何问题但实际上当我在 Xcode 中打开我的项目时我收到一个错误提示框架未找到这是荒谬的因为它之前运行
预提交钩子 git 错误

我正在尝试在 python 中执行预提交 git hook 以检查文件的行长度是否小于 80 个字符但是我收到没有此类文件目录的错误我在 fedora 上并设置了 usr bin python help 将不胜感激 usr bin e
Javascript - 从 AWS s3 存储桶读取镶木地板数据（使用快速压缩）

In nodeJS 我正在尝试读取镶木地板文件压缩 snappy 但没有成功 I used https github com ironSource parquetjs https github com ironSource parquet

随机推荐

使两个元素等高，其中一个元素带有垂直滚动条

我试图使两个同级 div 元素具有相同的高度其中有一个溢出 y 和一个具有可变高度内容的滚动条主 div 的内容高度也可变具体取决于动态内容和浏览器宽度主要内容 div 应显示其所有内容左侧滚动面板的高度应与主要内容的高度相同无
SVG 甜甜圈切片作为路径元素（环形扇区）

好吧当然这不是一个错误但我对如何通过贝塞尔曲线在点之间获得完美的圆弧感到困惑我需要这样的形状所以我一直用下面的公式从中心点半径和角度计算四个角点 x y x d cos y d sin 这在我的咖啡脚本看起来像这样 x1 cen
如何解释和转换 Keras 分类器的预测值？

我正在训练我的 Keras 模型来预测使用提供的数据参数它是否会射击并且它将以 0 表示否 1 表示是的方式表示然而当我尝试预测它时我得到的是浮点值我尝试使用与训练数据完全相同的数据来获取 1 但它不起作用我使用下面的数据尝
在Emacs中，这个错误是什么意思？ “警告：运行时需要 cl 包”

我正在字节编译一个模块它给了我这个警告 Warning cl package required at runtime 为什么这是一个警告我很清楚我正在使用cl包裹事实上有一个 require cl 模块中的语句使用有什么问题吗cl
如何将Gradle项目中Kotlin的字节码版本设置为Java 8？

在 Kotlin 项目中什么是正确的 Gradle 脚本来确保我的类将被编译为字节码版本 52 Java 8 由于某种原因即使我设置了源和目标兼容性我的类也被编译为版本 50 Java 6 至少这是当我从目录打开文件时 Idea 向我
WPF/C# - 以编程方式创建和使用单选按钮的示例

有人可以指出如何在 C WPF 中以编程方式创建和使用单选按钮的示例吗所以基本上如何 a 以编程方式创建它们以及 b 如何在值更改时捕获触发器 c 如何在给定时间获取结果我们也有兴趣看看答案是否也基于使用绑定方法如果数据绑定是最简单
如何使用 VBA 循环遍历 MS Word 中的每个字母？

我有大约 100 个 Word 文档其中包括外国名字的音译这些文档的作者使用了一种特殊的字体称为e2它有大约十几个特殊音译字符所有这些字符都以 Microsoft Sans Serif 字体提供我想遍历文档中的每一个字母并且每当
将逗号分隔值拆分为行

如何将 SQL Server 中逗号分隔的字符串中的值获取到行中以便将它们插入到表中例如使用以下数据 Declare string as nvarchar max Declare substring as nvarchar 50 se
如何增强 Box.com API 请求限制

正如这里所写http blog programmableweb com 2013 01 11 opening up the box api http blog programmableweb com 2013 01 11 opening u
时间：2019-03-17 标签：c#dispatchqueueslikeobjectivec

我想在 C 中模仿 Objective C 调度队列的行为我看到有一个任务并行库但我真的不明白如何使用它并希望得到一些关于如何使用它的解释在目标 c 中我会做类似的事情 void doSomeLongRunningWorkAsync
无法找到类型 [Microsoft.TeamFoundation.Client.TfsTeamProjectCollectionFactory]

我正在尝试编写一个脚本来使用 powershell 连接到 TFS 但是我陷入了实际连接的部分 credentialProvider new object Microsoft TeamFoundation Client UICredenti
OpenCV：将 cvGoodFeaturesToTrack 与 C++ mat 变量结合使用

我正在尝试使用cvGoodFeatureToTrackVisual Studio 2010 中的函数图像类型为Mat 我见过的大多数例子都使用IplImage指针现在我有这个 int w h video frame size Mat g
类型错误：无法腌制 dict_items 对象

Why does pickle dumps items 失败与TypeError can t pickle dict items objects在 Python 3 5 2 中但不在 Python 2 7 12 中用酸洗字典 pick
ITMS-90909：Xamarin Forms 应用程序中不推荐使用 iOS 的 API

任何人都可以建议如何处理我将 Xamarin Forms 应用程序提交到 iOS 商店时收到的这条消息吗对可能的重复进行评论这个问题之前曾被问过但没有得到解答我认为不存在已答复的重复项这是一个已知问题最近由 Xamarin 团队
建立数据库连接 Amazon EC2 时出错 - 移动我的 WordPress 博客后

将我的 WordPress 博客移至 Amazon EC2 后我收到错误建立数据库连接时出错我已经检查了 wp config php 文件并且设置正常本地主机密码和用户名我已经阅读了这里的许多问题和答案但没有任何帮助我我有
在 Web API 中使用 ExceptionFilterAttribute

我正在尝试在创建的 Web API 中实现错误处理需要以 JSON 格式返回异常详细信息我创建了 BALExceptionFilterAttribute 像 public class BALExceptionFilterAttribut
我们可以在 PHP 的任何函数中传递数组作为参数吗？

我有一个向用户发送邮件的函数我想将其参数之一作为 id 数组传递这可以吗如果是的话该怎么办假设我们有一个函数 function sendemail id userid 在示例中 id应该是一个数组您可以传递一个数组作为参数它是
类型参数 T 使用 Eclipse 将类型 T 隐藏在 T[] toArray(T[] a) 中

将 eclipse 4 2 与 Java 7 一起使用并尝试实现 List 接口的以下方法时我收到了警告 public
访问 sails.js 的基础 http 服务器

您好有没有办法访问 sails 的基本 http 服务器上下文我想在我的应用程序中使用binaryJS 并且在 gettig 入门指南中他们正在谈论自己创建服务器如果您有一个现有的 Express 应用程序其中包含以下行 var
如何加快这段 Java 代码的速度？

我正在尝试测试 Java 执行一项简单任务的速度有多快将一个大文件读入内存然后对数据执行一些无意义的计算所有类型的优化都很重要无论是以不同的方式重写代码还是使用不同的 JVM 欺骗 JIT 输入文件是一个由逗号分隔的 5 亿长的 3

如何加快这段 Java 代码的速度？

如何加快这段 Java 代码的速度？ 的相关文章

随机推荐

热门标签

如何加快这段 Java 代码的速度？的相关文章