获取文件哈希性能/优化

2024-04-20

我正在尝试尽快获取文件的哈希值。我有一个程序，可以对大量数据（100GB+）进行哈希处理，这些数据由随机文件大小（每个文件从几KB到5GB+）组成，跨少量文件到数十万个文件。

该程序必须支持所有 Java 支持的算法（MD2、MD5、SHA-1、SHA-256、SHA-384、SHA-512）。

目前我使用：

/**
 * Gets Hash of file.
 * 
 * @param file String path + filename of file to get hash.
 * @param hashAlgo Hash algorithm to use. <br/>
 *     Supported algorithms are: <br/>
 *     MD2, MD5 <br/>
 *     SHA-1 <br/>
 *     SHA-256, SHA-384, SHA-512
 * @return String value of hash. (Variable length dependent on hash algorithm used)
 * @throws IOException If file is invalid.
 * @throws HashTypeException If no supported or valid hash algorithm was found.
 */
public String getHash(String file, String hashAlgo) throws IOException, HashTypeException {
    StringBuffer hexString = null;
    try {
        MessageDigest md = MessageDigest.getInstance(validateHashType(hashAlgo));
        FileInputStream fis = new FileInputStream(file);

        byte[] dataBytes = new byte[1024];

        int nread = 0;
        while ((nread = fis.read(dataBytes)) != -1) {
            md.update(dataBytes, 0, nread);
        }
        fis.close();
        byte[] mdbytes = md.digest();

        hexString = new StringBuffer();
        for (int i = 0; i < mdbytes.length; i++) {
            hexString.append(Integer.toHexString((0xFF & mdbytes[i])));
        }

        return hexString.toString();

    } catch (NoSuchAlgorithmException | HashTypeException e) {
        throw new HashTypeException("Unsuppored Hash Algorithm.", e);
    }
}

是否有更优化的方法来获取文件哈希？我正在寻找极致的性能，但不确定我是否已经采取了最好的方法。

我看到了许多潜在的性能改进。一是使用StringBuilder代替StringBuffer;它与源兼容，但性能更高，因为它是不同步的。第二个（更重要的）是使用FileChannel和java.nioAPI 代替FileInputStream——或者至少，包裹住FileInputStream in a BufferedInputStream优化 I/O。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Algorithm

file

Hash

获取文件哈希性能/优化的相关文章

Maven：在项目之间共享源

我有两个项目它们是一个共同父项目的子项目还有一个生成器项目和生成器对应的maven插件项目此外两个子项目都使用相同的输入文件该文件用于代码生成 parent pom child1 jar src main generator in
在 Ruby 中，哈希中标识符后面的冒号的含义是什么？

我正在了解 Factory Girl 我看到了这段代码 factory post do association author factory user last name Writely end why do factory and las
GWT 和 Web 服务 (wsdl)

谁能告诉我一种从 GWT 客户端访问 WSDL Web 服务的方法这可能吗 Thanks 智能网关 http www smartclient com product index jsp支持 WSDL 数据源除此之外您始终可以将 WSD
Java 中修剪字符串的可能前缀

I have String str 我想从中提取不包括可能的前缀的子字符串 abc 我想到的第一个解决方案是 if str startsWith abc return str substring abc length return str
我的代码中出现 ArrayIndexOutOfBoundsException 的原因是什么？

我正在 Java 中实现凸包的格雷厄姆扫描算法我在运行代码时收到此错误对于输入字符串 10 18 Exception in thread main java lang ArrayIndexOutOfBoundsException 0 a
无法在IntelliJ IDEA中编译和运行java代码

使用 IntelliJ IDEA 版本 12 1 6 我想运行 Horstmann Core Java 书中的示例 public class Welcome public static void main String args Strin
Swing 是否支持 Windows 7 风格的文件选择器？

我刚刚添加了一个标准打开文件与我正在编写的一个小型桌面应用程序的对话基于JFileChooserSwing 教程的入口 http download oracle com javase tutorial uiswing componen
如何将跨源资源共享与 Spring MVC 4.0.0 RESTful Webservice 集成

我有一个简单的 Web 服务返回JSON data The 用户等级 com bargadss SpringService Domain 是个POJO类包含用户 ID 名字姓氏电子邮件 The 用户服务类 com bargadss S
Selenium 2：中断页面加载

我在使用 FirefoxDriver 使用 Selenium 2 0b3 Java API 单击按钮时遇到问题单击该按钮会将表单发送到网络服务器然后浏览器会因表单提交而进入新页面当使用 element click 单击某个元素时 se
从壁纸中获取颜色？ - 安卓

如何找到当前壁纸的平均颜色并将该颜色设置为我的小部件上的布局我正在尝试做的一个例子这是 AccuWeather 上的设置您可以使用WallpaperManager getWallpaperColors https develope
如何配置jackson属性命名策略？

此代码不起作用 Configuration public class RepositoryRestMvcConfig extends RepositoryRestMvcConfiguration Bean Override public O
在 JSON 转换为 CSV 期间保持 JSON 键的顺序

我正在使用此处提供的 JSON 库http www json org java index html http www json org java index html为了将 json 字符串转换为 CSV 但我遇到的问题是转换后键的顺序
XmlAdapter 到 JAXB 绑定 Joda 的时间间隔？

我已经被 Web 服务的 JAXB 绑定问题困扰了几个小时为了准备一个必须返回 Joda Time 类实例即时持续时间间隔等的更大的 Web 服务我从一个只有一个返回 Interval 的方法的 Web 服务开始 package
将 XML 转换为 Java 对象 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
策略模式的现实示例

我一直在读关于OCP原理 http en wikipedia org wiki Open closed principle以及如何使用策略模式来实现这一目标我打算尝试向几个人解释这一点但我能想到的唯一例子是根据订单的状态使用不同的验
Java：如何复制对象数组？

现在我有一个 Point 对象数组我想制作一个COPY该数组的我尝试过以下方法 1 Point temp mypointarray 2 Point temp Point mypointarray clone 3 Point temp
OutputStream 到 DB2 数据库表的 BLOB 列

在 DB2 数据库中我有下表 CREATE TABLE MyTestTable MYPATH VARCHAR 512 NOT NULL MYDATA BLOB CONSTRAINT MYTESTTABLE PK PRIMARY KEY M
用 ruby 解决旅行商问题（50 多个位置）

我在一家快递公司工作目前我们手动解决了 50 多个地点的路线我一直在考虑使用 Google Maps API 来解决这个问题但我读到有 24 点的限制目前我们在服务器中使用 Rails 因此我正在考虑使用 ruby 脚本来获取
struts2中如何访问url参数

我正在做一个struts2项目我在项目中创建了 url 并使用标签传递了参数我的问题是如何读取操作中的参数另外如果执行相同的操作我将能够将参数视为查询字符串我问是因为我无法做到而且我在其中一个教程中看到了它通常您将通过使用
从 Web 服务器异步调用应用程序

我有一个用 Spring 制作的在 Tomcat 上运行的 Web 应用程序在同一台机器上有一个普通的 Java 应用程序我想通过从Web服务器调用Java应用程序来执行它但我想让应用程序不会使用服务器的资源它涉及分类器的训练因

随机推荐

从 Matlab 中的时钟图像获取时间 - 图像处理

时钟 http img710 imageshack us img710 2623 circlock jpg http img710 imageshack us img710 2623 circlock jpg 我不知道如何确定时钟指针的顶部
iOS >> ShareKit >> 选择所需的共享服务

我已经在我的应用程序中实现了 ShareKit 我同意它的默认工作方式但我希望控制可供用户选择的服务更具体地说我不想处理默认嵌入的所有服务而只想处理 Facebook Twitter 和 Mail 我在 ShareKit 文件中的哪
Git 格式补丁输出在单个文件中

如何将命令 format patch 的输出定向到单个文件 stdout gt 文件名
嵌入公共 Facebook 页面的活动源，无需强制用户登录/允许

这与之前多次提出的问题类似但无论我读什么我仍然很困惑我有一个公共 Facebook 页面例如 White Collar 我需要将其活动源嵌入到我的 Android 应用程序中我了解如何获取应用程序 ID 和应用程序秘密但我不了解
如何处理Junits中Maven和Intellij之间的相对路径

我有一个带有模块的 Maven 项目 myProject pom xml myModule pom xml foo bar txt 考虑一个 JunitmyModule需要打开哪个bar txt 对于 maven basedir 是模块目录
g++：找不到文件

我最近一直在开发一个程序该程序从 Java 程序编译并运行 C 程序我已经让一切基本正常工作或至少据我所知但后来我注意到一些东西被打印到错误流中 cdog5000 srv3 java Xmx50m jar main2 jar Run
Python 中首选 `if x:` 或 `if x != 0:` 哪一个？

假如说x是一个整数构造if x 功能上与if x 0 在Python中某些语言的风格指南明确禁止前者例如 ActionScript Flex 的风格指南指出您永远不应该为此类事情隐式地将 int 强制转换为 bool Python
持久感知 KieSession 在事务期间不使用悲观锁

我在用Drools with 春季启动2 3 我已经实现了持久意识KieSession 其中MySQL用于存储会话我已经成功集成了默认的EntityManagerFactorySpring Boot 与 Drools 的结合但我的问题是
限制数据帧中的小数位数 (R)

我想在导入数据框时限制小数位数我的 txt输入的列每行有 16 位小数Value 我的数据框如下所示 Value 0 202021561664556 0 202021561664556 0 202021561664556 0 202021
处理来自 Electron （或其他桌面平台）的 oauth2 重定向

这主要是缺乏对 oauth2 的理解并且可能不是特定于 Electron 的但是我试图理解某人如何处理来自桌面平台如 Electron 的 oauth2 重定向 url 假设应用程序中没有 Web 服务设置桌面应用程序如何提示用户输
如何使用 Selenium 测试 JQuery UI 可排序小部件？

我们有一个可排序的列表使用JQuery UI 可排序 http jqueryui com demos sortable 我们正在尝试使用 Selenium 实现自动化看起来dragAndDrop函数应该可以工作但是当我们调用它时 UI
如何从 Apache Beam 中的 HTTP 响应读取大文件？

Apache Beam 的 TextIO 可用于读取某些文件系统中的 JSON 文件但如何从 Java SDK 中的 HTTP 响应产生的大型 JSON InputStream 中创建 PCollection 我认为 Beam 目前没有通
你能用 Future.cancel(true) 中断 BufferedReader.readLine() 吗？

假设我启动了一个线程并且有这样的内容 initiate all the socket connection future executor submit new Runnable public void run while str in
如何直接使用栅格属性表对栅格进行图例并仅显示栅格中显示的类的图例？

我想使用栅格属性表信息来创建栅格的图例例如栅格1 https i stack imgur com tgC2P png并仅显示栅格中显示的类的图例我举了一个例子来解释我想要得到什么 1 构建光栅 r lt raster ncol 10 n
提交表单后保持单选按钮处于选中状态

我使用下面的代码在表单提交后保留单选按钮选择但在表单提交后它不断重置为最后一个按钮
如何在 Emacs 中强制绑定？

我正在尝试绑定
Gorilla mux，“捕获”响应代码的最佳方式

我所有的路由都使用 Gorilla mux 现在我的应用程序工作正常我想找到一种方法将我的所有响应代码记录到例如 statds 我找到了这个包 https godoc org github com gorilla handlers Lo
你能用c++加载一个网页，包括JS和动态html并获取渲染的DOM字符串吗？

是否可以用 C 加载网页并获取渲染的 DOM 不仅仅是 HTTP 响应还有 java 脚本运行后可能是让它运行一段时间后呈现的 DOM 特别是随着时间的推移可能发生变化的动态 HTML 有这个库吗或者如果不是 c 您是否知道可以用
为什么 Select-String 添加空行？

这是一个最小的重现示例预期结果 PS C gt a b a b PS C gt a b Select String b b PS C gt 实际结果 PS C gt a b a b PS C gt a b Select String b
获取文件哈希性能/优化

我正在尝试尽快获取文件的哈希值我有一个程序可以对大量数据 100GB 进行哈希处理这些数据由随机文件大小每个文件从几KB到5GB 组成跨少量文件到数十万个文件该程序必须支持所有 Java 支持的算法 MD2 MD5 SHA 1

获取文件哈希性能/优化

获取文件哈希性能/优化 的相关文章

随机推荐

热门标签

获取文件哈希性能/优化的相关文章