是否可以使用 GPU 来加速 Python 中的哈希？

2023-12-29

我最近读了 Jeff 的博客文章，标题为速度哈希 http://www.codinghorror.com/blog/2012/04/speed-hashing.html，其中他提到，您可以通过利用 GPU 的强大功能来非常快速地对事物进行哈希处理。

我想知道是否可以利用 GPU 的强大功能来对 Python 中的内容进行哈希处理（md5、sha-1 等）？

我对此很感兴趣，因为我想看看我能以多快的速度暴力破解事物（不是现实世界的东西，来自旧的泄漏数据转储）。

目前，我正在做这种事情（简化示例）：

from itertools import product
from hashlib import md5

hashes = ["some","hashes"]

chars = []
for i in range(97,123): # a-z only
    chars.append(chr(i))

for i in range(1,6): # all combos of a-z, 1-5 chars
    for c in product(chars,repeat=i):
       s = ''.join(c)
       if md5(s).hexdigest() in hashes:
           print "Found",s

但我想知道是否有办法使用 GPU 来加速？我猜我需要一个能够连续生成这样的哈希值的模块 - 有人知道吗？

有两个障碍：

编写一个在 GPU 上执行的程序。 AFAIK，目前没有可用的机制将 Python 程序转换为 GPU 执行的代码。因此，除非您能找到您需要的东西（这可能是可能的，因为它看起来像是一个相当常见的用例），否则您将必须使用一种 GPU 编程语言（CUDA、OpenCL、Haskell 等）来实现这一点。 .)
从Python调用GPU上运行的程序，并交换数据。有几个 Python+CUDA 项目可以完成这部分工作：
- http://mathema.tician.de/software/pycuda http://mathema.tician.de/software/pycuda
- http://code.google.com/p/pystream/ http://code.google.com/p/pystream/
- https://launchpad.net/python-cuda https://launchpad.net/python-cuda
通过适当的搜索，您可能会发现更多。

Also Python GPU 编程 https://stackoverflow.com/questions/5957554/python-gpu-programming看起来相关

然后，Python 程序将使用第 2 部分或同等技术之一加载并调用 GPU“内核”（使用本答案第 1 部分中的技术创建的程序）。

编辑您可以在 GPU 上生成整套“暴力”值和 md5 哈希值。然后只需使用 Python 检索结果即可。这可能比在 Python 中生成值、将它们传递到 GPU、然后返回 md5 更容易。

如果我理解的话，程序会生成所有 1 个字符、2、3、4、5 和 6 个小写字母字符串，并生成 md5 哈希，是吗？

Edit2 - 我之前的分析完全错误 - 我很抱歉

编辑3：略读维基百科 MD5 http://en.wikipedia.org/wiki/MD5看起来可以优化计算恒定长度字符串（例如 6 个 ASCII 字符）的 MD5。

根据维基百科的伪代码，它只有 64 个循环，每组 16 次循环迭代使用相同的算术。因此，如果密钥小于 55 字节，则计算的核心可以从以下位置“展开”：

for i from 0 to 63
    if 0 ≤ i ≤ 15 then
        f := (b and c) or ((not b) and d)
        g := i
    else if 16 ≤ i ≤ 31
        f := (d and b) or ((not d) and c)
        g := (5×i + 1) mod 16
    else if 32 ≤ i ≤ 47
        f := b xor c xor d
        g := (3×i + 5) mod 16
    else if 48 ≤ i ≤ 63
        f := c xor (b or (not d))
        g := (7×i) mod 16
    temp := d
    d := c
    c := b
    b := b + leftrotate((a + f + k[i] + w[g]) , r[i])
    a := temp
end for

to:

// i == 0
f := (b and c) or ((not b) and d)   // +4 ops
// g := i
temp := d
d := c
c := b
b := b + leftrotate((a + f + k[0] + w[0]) , r[0])  // 9 ops
a := temp
// i == 1
f := (b and c) or ((not b) and d)
// g := i
temp := d
d := c
c := b
b := b + leftrotate((a + f + k[1] + w[1]) , r[1])
a := temp

这种展开会导致某些数组索引保持不变，这应该允许良好的 GPU 编译器进行更恒定的传播。这可能会带来显着的改进。每个步骤大约有 9 个操作，编译器需要打乱 5 条数据，因此大约 14 个操作/步骤 * 64 个步骤，大约 1000 个操作。

Edit4:
Glerk!我阅读了更多关于 Wikipedia MD5 算法的内容 - MD5 比我想象的更容易攻击。每组 16 个，仅前两个循环directly使用6字节的可变密钥字符串，字符串的其余部分是常量。该算法的其余部分是改组和按位运算，这可能需要进行非常重要的进一步优化。每 16 个循环中只有 2 个涉及密钥，那么速度可能会快 8 倍，甚至可能超过 4 倍。

因此，与其说 1024 核 GPU、以 1GHz 运行、提供 1024 哈希/微秒，不如说 4096/微秒或 8096/us = 4-8 哈希/纳秒

大约有 27^6 个密钥 = 387,420,489 个密钥，因此有 md5 哈希值。

387,420,489 个键/4-8/纳秒大约 = 0.05 - 0.1 秒

主机和 GPU 之间的通信会相当慢，但不太可能超过 100%。

所以大约在 0.1 秒到 0.2 秒之间。

md5 哈希值是 16 个字节，因此如果要存储它，将消耗 6.2 GB。在两个现代 GPU 上，每个只需要 2 次传输，但这将是一个非常大的开销。如果哈希值保存到磁盘（即使使用 SSD）或通过 10Gbit 以太网移动，则哈希生成会被 I/O 时间淹没。

只有 94 个可打印 ASCII 字符，因此对于每个 ASCII 6 字符键：

94^6 = 689,869,781,056 个键 / 4-8/纳秒 = 86-172 秒

天啊！-（

长密钥，还有比 MD5 更好的东西！

也许尝试编写一个Python程序来生成最佳的GPU算法？

通过“展开”Python 程序中的循环来生成 GPU“内核”的文本，并打印直线计算的文本，并填充所有常量。

然后尝试找出计算每个密钥长度的 MD5 的最佳指令序列。使用展开的程序，尝试跟踪每个位的操作以及依赖性，然后尝试将这些位及其操作重新组装成连续的 32 位字和新的直线计算。（公平地说，也许 GPU 编译器无论如何都可以做一些这样的事情？找出答案可能很有趣）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

是否可以使用 GPU 来加速 Python 中的哈希？的相关文章

如何有效地从连续字符串中提取文字单词？ [复制]

这个问题在这里已经有答案了可能的重复如何将没有空格的文本拆分为单词列表 https stackoverflow com questions 8870261 how to split text without spaces into li
CVXPY 二次规划； ArpackNoConvergence 错误

我尝试使用 Python 包 CVXPY 来解决第一种形式的凸二次规划问题 https www cvxpy org examples basic quadratic program html https www cvxpy org exam
如何测试使用 XCom 的 Apache Airflow 任务

我正在尝试找出一种测试 DAG 的方法其中有几个任务使用 XCom 进行通信由于控制台命令只允许我从 DAG 运行任务有没有一种方法可以测试通信而无需通过 UI 运行 DAG Thanks 这是一种对我有用的方法尽管 Airflow
重新索引错误没有意义

I have DataFrames大小在 100k 到 2m 之间我正在处理这个问题的框架是如此之大但请注意我必须对其他框架执行相同的操作 gt gt gt len data 357451 现在这个文件是通过编译许多文件创建的所以它
如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
scipy.misc.imshow RuntimeError('无法执行图像视图')

我正在测试scipy misc imshow https docs scipy org doc scipy 0 15 1 reference generated scipy misc imshow html我得到了运行时错误无法执行图像查
如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
我应该为 MySQL 使用什么 python 3 库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案据我所知 MySQLdb 仍然没有移植到 Python 3 pypy 上似乎有另一个名为 PyMySQL
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
了解 asyncio 已经运行的永久循环和挂起的任务

我在理解如何将新任务挂起到已经运行的事件循环中时遇到问题这段代码 import asyncio import logging asyncio coroutine def blocking cmd while True logging in
生成（非常）大的非重复整数序列而不进行预洗牌

背景我编写了一个简单的媒体客户端服务器我想生成一个不明显的时间值随从客户端到服务器的每个命令一起发送时间戳中将包含相当多的数据纳秒分辨率即使它不是真正准确因为现代操作系统中计时器采样的限制等我想做的在 Linux 上
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
Python，多线程，获取网页，下载网页

我想在一个站点批量下载网页我的 urls txt 文件中有 5000000 个 url 链接大约有300M 如何让多线程链接这些网址并下载这些网页或者如何批量下载这些网页我的想法 with open urls txt r as f
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
如何在数据框中绘制包含三列的无向图，形成 3 种不同类型的节点（三方）？

我正在尝试使用三个不同的列表绘制网络的可视化这三个列表形成 3 种类型的节点下面的代码正在运行如图所示需要两个列表用户 ID 评分但是我希望我的图表是三部分的即 user userId review ratings prod
Python 队列 get()/task_done() 问题

我的消费者端队列 m queue get queue task done
如何保持 python 3 脚本 (Bot) 运行

不是母语英语抱歉英语可能很蹩脚我也是编程新手您好我正在尝试使用 QueryServer 连接到 TeamSpeak 服务器来创建机器人经过几天的努力它有效只有 1 个问题而我却被这个问题困扰了如果您需要检查这是我正在使
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
通过 ManyToManyField = Value 对 django 查询集进行排序

如果有一些模型例如 class Tag models Model name models CharField class Thing models Model title models CharField tags models Many

随机推荐

从 JSON 到 NSArray

我正在使用此处找到的 JSON 框架 http stig github com json framework http stig github com json framework在我的 iPhone 应用程序中我正在尝试将一些数据解析为
这是 Ruby 中 Array.fill 方法的错误吗？ [复制]

这个问题在这里已经有答案了应该是这种情况即我误解了还是一个错误 a Array new 3 Array new 3 a 1 fill g gt g g g g g g g g g 不应该导致 gt nil nil nil g g g
批处理文件从txt文件中删除前18个字符

我有一个 txt 文档其中包含超过 32 000 行带注释的机器代码它看起来像这样 Display menu window C0 000E E220 SEP 20 C0 0010 C210 REP 10 C0 0012 20640B J
HostnameVerifier 接口的不安全实现 - Android

Play 商店应用被拒绝的原因您的应用程序正在使用 HostnameVerifier 接口的不安全实现您可以在此找到有关如何解决该问题的更多信息Google 帮助中心文章 https support google com faqs an
grep 查找中间带有通配符的文本

我想 grep 类似的东西 gt sh lt 但这不起作用我可以 grep 一切 sh lt 但无法让通配符发挥作用这里有什么技巧呢你需要 grep 类似的东西 gt sh lt The 部分匹配任何长度的任何字符部分匹配一个点
gwt 自定义小部件包装方法

我的自定义小部件如下所示 public class CustomWidget extends Composite public static CustomWidget wrap com google gwt dom client Eleme
如何将 Lua 函数传递给 C 函数并多次执行 Lua 函数？

我想要做的是创建一个函数它将迭代一些对象并为每个函数调用一个函数我使用的是 BlitzMax 而不是 C 但这不是重点因为它具有 Lua 的 C 函数的完整包装 Lua有一个lua pushcfunction 命令但是lua pus
Python3 + Curses：如何按“q”立即结束程序？

当我运行以下示例代码并按 q 时它会正常结束但是如果我按任何其他字符例如许多中断和许多其他字符然后按 q 它不会退出我该如何解决这个问题 import curses time def main sc sc nodelay 1 wh
如何检查变量是否是数组？...或类似数组的东西

我想用一个foreach用一个变量循环但这个变量可以有很多不同的类型 NULL例如所以之前foreach我测试一下 if is array var foreach var as 但我意识到它也可以是一个实现的类Iterator界面也许
如何加载（或映射）文件部分最大大小，但适合 Windows 上的 RAM？

有大文件我需要快速排序我将按适合 RAM 的部分处理文件以避免程度使用页面文件下一步合并部分如何使用最大内存我的解决方案使用WinApi文件内存映射但我不知道如何获取文件最大大小的一部分但适合RAM 如何确定大小 Yo
Service-Fabric 绑定到多个端点

是否可以绑定服务结构应用程序来侦听多个端口基本上我试图拥有一个面向公众的服务它侦听 http 80 和 https 443 并将任何 http 请求重定向到 https 我创建了一个新的 ASP net Core 服务它单独工作正常
F# 联合类型列表

我想要一份报告清单报告可以是详细信息或部分类型 module Data type Section Header string Lines string list Total string type Detail State string
jQuery 复选框

我正在尝试编写一段 jQuery 代码如果所有复选框都未选中则所有 li 标签的类都为 disabled 但是如果选中一个复选框任何复选框则所有 li 标签都会失去 disabled 类别非常感谢 checkbox click
如何将字符串复制到剪贴板

在xcode中如何将文本复制到剪贴板目前我正在使用以下代码 UIPasteboard pasteboard UIPasteboard generalPasteboard pasteboard setString shareString
使用base64编码生成Oauth授权令牌

我正在尝试按照指南为 YAHOO DSP API 生成 Oauth 身份验证令牌 Base64 编码是一种将二进制数据编码为文本的方法以便可以轻松地在网络上传输而不会出现错误在此步骤中您将获取 YDN 控制台为您生成的客户端 ID 和
是否可以将 AWS CodePipeline 与 Lightsail 结合使用？

我工作了一整天却找不到答案所以我问你们是否可以将 AWS Pipeline 与 AWS Lightsail 结合使用我的目标是将代码存储在 CodeCommit 中并使用 CodeBuild CodeDeploy CodePipel
龙卷风 ioloop 和龙卷风的工作流程是什么？

我想了解tornado的内部工作流程并且已经看到本文 http golubenco org p 16 这很棒但我就是不明白在ioloop py中有这样一个函数 def add handler self fd handler even
Delphi 7 创建动画启动画面

当我的应用程序加载他的数据库时我试图制作一个动画闪屏我已经创建了一个闪屏但我想在数据库转换时使图像从左向右移动现在已经搜索了一段时间但我所能找到的只是进度条这是我的代码 SplashScreen TSplashScreen C
如何关闭 Firefox 的缓存？

在开发过程中我必须始终清除 Firefox 中的缓存以使其使用最新版本的 JavaScript 文件是否有某种设置 about config 可以完全关闭 JavaScript 文件的缓存或者如果不是则适用于所有文件在 Fi
是否可以使用 GPU 来加速 Python 中的哈希？

我最近读了 Jeff 的博客文章标题为速度哈希 http www codinghorror com blog 2012 04 speed hashing html 其中他提到您可以通过利用 GPU 的强大功能来非常快速地对事物进行哈希处

是否可以使用 GPU 来加速 Python 中的哈希？

是否可以使用 GPU 来加速 Python 中的哈希？ 的相关文章

随机推荐

热门标签

是否可以使用 GPU 来加速 Python 中的哈希？的相关文章