如何在 Clojure 中处理大型二进制数据？

2024-04-17

如何在 Clojure 中处理大型二进制数据文件？我们假设数据/文件大约为 50MB - 小到足以在内存中处理（但不是简单的实现）。

以下代码正确地从小文件中删除 ^M 但它会抛出OutOfMemoryError对于较大的文件（如 6MB）：

(defn read-bin-file [file]
  (to-byte-array (as-file file)))

(defn remove-cr-from-file [file]
  (let [dirty-bytes (read-bin-file file)
        clean-bytes (filter #(not (= 13 %)) dirty-bytes)
        changed?    (< (count clean-bytes) (alength dirty-bytes))]    ; OutOfMemoryError
    (if changed?
      (write-bin-file file clean-bytes))))    ; writing works fine

看起来Java字节数组不能被视为seq因为它的效率极低。

另一方面，解决方案aset, aget and areduce臃肿、丑陋且势在必行，因为您无法真正使用 Clojure 序列库。

我缺少什么？如何在 Clojure 中处理大型二进制数据文件？

我个人可能会在这里使用 aget / aset / areduce - 它们可能是必要的，但在处理数组时它们是有用的工具，而且我不认为它们特别难看。如果你想将它们包装在一个好的函数中，那么你当然可以:-)

如果您决定使用序列，那么您的问题将在于 seq 的构造和遍历，因为这将需要为数组中的每个字节创建和存储一个新的 seq 对象。每个数组字节可能约为 24 个字节……

因此，诀窍是让它惰性地工作，在这种情况下，在到达数组末尾之前，较早的对象将被垃圾收集。然而，为了使其工作，您必须避免在遍历序列时（例如使用 count）保留对 seq 头部的任何引用。

以下可能有效（未经测试），但取决于以惰性友好方式实现的 write-bin-file：

(defn remove-cr-from-file [file]
  (let [dirty-bytes (read-bin-file file)
        clean-bytes (filter #(not (= 13 %)) dirty-bytes)
        changed-bytes (count (filter #(not (= 13 %)) dirty-bytes))
        changed?    (< changed-bytes (alength dirty-bytes))]   
    (if changed?
      (write-bin-file file clean-bytes))))

请注意，这本质上与您的代码相同，但构造了一个单独的惰性序列来计算更改的字节数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Clojure

binarydata

如何在 Clojure 中处理大型二进制数据？的相关文章

Scala 相当于 F# 中的 |> 或 Clojure 中的 ->>

在 Scala 中当我有这个表达式时 f1 f2 f3 p 有没有一种方法可以让我使用类似的东西 F p gt f3 gt f2 gt f1 还是 Clojure gt gt p f3 f2 f1 Scala 中没有相当于 F 的管道运算
人们可以放心地忽略宏和内置宏之间的区别吗？

我从 Clojure 开始这也是我的第一个 lisp 显然有很多东西需要吸收为了减轻认知负担我尝试找到我可以安全地忽略的部分目前人们能否安全地以相同的方式处理带有宏的表单和带有内置函数的表单或者是否会出现以后出现的陷阱换句话说
Clojure 中的相互递归定义

如何在 Clojure 中进行相互递归定义下面是 Scala 中使用递归定义查找素数的代码 val odds Stream Int cons 3 odds map 2 val primes Stream Int cons 2 odds f
如何在 Clojure 中处理大型二进制数据？

如何在 Clojure 中处理大型二进制数据文件我们假设数据文件大约为 50MB 小到足以在内存中处理但不是简单的实现以下代码正确地从小文件中删除 M 但它会抛出OutOfMemoryError对于较大的文件如 6MB defn
Clojure：避免埃拉托斯特尼筛中的堆栈溢出？

这是我在 Clojure 中实现的埃拉托斯特尼筛法基于 SICP 流课程 defn nats from n iterate inc n defn divide p q zero rem q p defn sieve stream lazy
为什么我不能将 Clojure 的 :^const 与 Java 字节数组一起使用？

Using lein repl使用 Clojure 1 4 0 我可以定义一个 constJava 字节数组的但我不能用它做任何事情 user gt def x byte array map byte 0 1 2 3 user x use
Clojure：在特定命名空间中启动 repl

我安装了 boot clj 并且希望能够在外部编辑器中编辑 clj 文件并单独运行一个命令行 REPL 我可以从中调用我在 clj 文件中更改的函数不需要特殊的重新加载命令另一件事是我不想手动键入命令来包含命名空间我只想运行一个将我
无法使用 Leiningen 构建 jar

我正在尝试使用 Intellij 的 Cursive 中的 Leiningen 插件从我的基本 Clojure 项目中制作一个独立的 jar 为了创建项目我刚刚创建了 project clj 文件将其打开 Cursive 提出将其导入为
clojure 的 emacs slime-connect 版本不会查找 $CLASSPATH

我需要将 clojure 函数与 slime connect 一起使用我将所有库都放在 CLASSPATH 中据我了解这个问题 https stackoverflow com questions 3376840 clojure clas
如何将 CORS 添加到 compojure-api 应用程序？

如何将 CORS 添加到此代码片段 def app api swagger ui docs spec swagger json GET route a a GET route b b GET route c c 我想用https githu
从命令行将 clojure 源代码编译为类（AOT）（不使用 lein）

我正在尝试将 clojure 源代码编译成类文件并仅使用命令行运行它没有 lein 也没有可能回复我有 core cljsrc hello目录 src hello core clj 这是源代码 ns hello core defn
mysql CLI 工具是否提供了一种以控制台友好的方式显示二进制数据的方法？

我有一个 MySQL 数据库其中包含一个带有二进制类型列的表我希望能够投影该列而不必运行它例如 HEX 是否mysqlCLI 工具有一个配置选项或其他方式来显示二进制数据的表示形式而不会输出任意字节供我的控制台以搞笑烦人的方式解释
为什么leiningen启动时那么慢？

我在用着lein repl在控制台中执行 clojure repl 当我运行它时需要超过15秒当我跑步时java cp clojure 1 6 0 jar clojure main 只需几秒钟 Why is lein repl太慢了有
在 Light Table 中使用 Datomic 时出现“无读取器功能”错误

当我在 lighttable 中评估这段代码时 ns app core require datomic api refer q as d reload all defn add person conn id d transact conn
Emacs/Swank/Paredit for Clojure 的温和教程

我要转向 Emacs 来工作Clojure http en wikipedia org wiki Clojure Lisp 为了能够执行以下操作我需要在 Emacs 上设置哪些信息自动匹配生成相应的右括号自动缩进 Lisp Cloj
Java 将字节转换为二进制安全字符串

我有一些以字节为单位的数据我想将它们放入Redis中但是Redis只接受二进制安全字符串而我的数据有一些二进制非安全字节那么如何将这些字节转换为二进制安全字符串以便将它们保存到 Redis 中呢 Base64 对我有用但它使数据更
在 Clojure 和其他 Lisp 方言中，在函数名称末尾使用星号的约定是什么？

请注意我不是在谈论符号名称中的耳罩这个问题在Clojure 常量的约定样式和用法 https stackoverflow com questions 3579063 conventions style and usage for cl
clojure 要求语法原理

我很难理解因此记住此处描述的 clojure require 语法 http clojuredocs org clojure core 1 3 0 clojure core require http clojuredocs org cl
Python：结构体和数组与 ctypes 中的类似功能

Python 提供了以下三个处理 C 类型以及如何处理它们的模块 struct https docs python org 3 library struct html对于 C 结构体 array https docs python org
为什么我收到无法动态绑定非动态变量？

我正在尝试使用 clojure tools trace 命名空间的 dotrace 函数 dotrace my function my function 5 但我收到了这个错误 IllegalStateException 无法动态绑定非动态

随机推荐

JsonValueProviderFactory 抛出“请求太大”

我收到一个异常即 JSON 请求太大而无法反序列化它来自 JsonValueProviderFactory MVC 应用程序当前有一个使用 Json Net 的自定义模型绑定器它在反序列化 json 数据时没有问题但是我假设默认的
什么是 AsyncManager.OutstandingOperations？

感谢 MSDN 他们没有对此进行任何解释 http msdn microsoft com en us library system web mvc async asyncmanager outstandingoperations v vs
如何使用 JavaSound (Java, Java Sound) 从 .wave 文件读取信息

您好我需要从 wave 文件中读取采样率信号频率和幅度我怎样才能使用 JavaSound 做到这一点您可以通过获取句柄来获取采样率AudioFormat object AudioInputStream audioInputStrea
Phonegap + jQuery Mobile + 股票/折线图

我试图找到一个在phonegap应用程序中绘制折线股票图表的解决方案我尝试过很多库 amcharts JS highcharts 但没有一个能工作有人可以帮我完成这项任务吗欢迎任何解决方案平台 Android iOS 我有同样的问
通过电子邮件询问评级

在我的应用程序中我们将通过向用户发送电子邮件来获取反馈因此如果用户填写字段并提交那么我会将其存储在我的数据库中我准备了一封 html 邮件如下所示但这里的问题是我无法在邮件中显示评级星星这需要内联 css 但我无法将该 cs
AdMob 横幅不适用于移动数据

我最近开始开发 Android 应用程序当尝试在我的应用程序中加载横幅时我在 logcat 中收到以下错误 03 02 17 30 58 509 I Ads 12181 Use AdRequest Builder addTestDevi
给出源时，Django Rest Framework Serializer charfield 不更新

我有一个带有选择 charfield 的模型字段 class Vehicle models Model name models CharField max length 100 STATUS CHOICES N New U Used P J
如何在 Visual Studio Code 中更新 C# 版本？

我已经安装了 C 扩展我的 NET 框架已更新但我无法修复它我已经找到了修复方法希望这对将来的人有所帮助找你的 csproj file 将 LangVersion 属性更改为所需版本
AMD64 ABI 中的空类会发生什么情况？

我正在看AMD64 ABI http www cs tufts edu comp 40 readings amd64 abi pdf并且它似乎没有指定如何传递空类类型对于空类成员函数似乎this照常传递但对于空类 Clang 生成的代
RcppEigen - 从包中的内联函数到 .cpp 函数和“Map”

一切似乎都在我的包中工作但我想检查其步骤是否正确以及使用 Map 的内存使用情况这是一个简单的示例位于内联示例和fastLm 例子这是一个内联函数它取矩阵每一列的最大值 library Rcpp library inline li
如何将 long (currentTimeInMillis) 转换为 UTC 时间戳？

我的客户正在向我发送Long这可以被认为是 scala gt System currentTimeMillis res3 Long 1441056836609 scala gt 我如何将其转换为UTC时间戳在服务器上我们使用Java 8
Threejs + Vanilla JS 和 React-Three-Fiber + Create-React-App 之间的颜色差异

这已经困扰我一段时间了为什么 React Three Fiber 中的材质颜色看起来比 Threejs 中暗淡两种实现中的对象及其属性是相同的 Threejs 版本相同在新引导中实施 create react app 没有额外的依赖项
在 Eclipse 中编辑代码时如何禁用粗体字体？

我不希望 Eclipse 以粗体显示任何关键字我浏览了首选项窗口中的很多选项但找不到执行此操作的方法是否可以这取决于您正在编辑的文件类型例如在 Java 中窗口菜单 gt 首选项 gt Jave gt 编辑器 gt 语法着
Java反应式框架的比较[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我看到许多框架库声称它们可以帮助用 Java 构建响应式应用程序例如 Akka Vert x RxJava Reactor QBit 等他
如何将 activemq-core.xsd url 与 jar 文件中找到的 activemq.xsd 关联？

有人知道如何关联activemq core xsd网址与activemq xsd在 jar 文件 activemq core 5 2 0 jar 中找到我在互联网上找到了一些解决方案但没有成功我收到此错误 Caused by org
如何在 Rails 中保守 Secrets.yml 的秘密？

我对 Rails 还很陌生但我有一些 PHP 和其他语言编程经验我真的很喜欢 Rails 并且正在为我的公司开发一个应用程序但我仍然不完全理解 Secrets yml 文件如何与 git 和 heroku 配合使用我知道秘密用于身份
Swiper 在 Jquery Mobile 中不起作用

我在用idangero us 的 Swiper http www idangero us sliders swiper index php使用 Jquery 移动我在这里使用滚动容器滑动器对于内容滑块只是面临着将代码嵌入在一起的很多问题
rake db:rollback 为什么要回滚三步？

通常当我这样做时 rake db rollback 它会回滚一次迁移但现在反复多次已经回退了3步怎么会有这种行为呢我使用的是 Rails 3 2 13 您可以像这样指定步骤数 rake db rollback STEP 3 The
如何更改Cloud Functions部署中使用的bundler版本？

Context 从几天前开始云功能的部署一直失败 Gemfile source https rubygems org ruby gt 2 7 0 git source github repo name https github com r
如何在 Clojure 中处理大型二进制数据？

如何在 Clojure 中处理大型二进制数据文件我们假设数据文件大约为 50MB 小到足以在内存中处理但不是简单的实现以下代码正确地从小文件中删除 M 但它会抛出OutOfMemoryError对于较大的文件如 6MB defn

如何在 Clojure 中处理大型二进制数据？

如何在 Clojure 中处理大型二进制数据？ 的相关文章

随机推荐

热门标签

如何在 Clojure 中处理大型二进制数据？的相关文章