使用 ZipInputStreams 和 ZipOutpuStreams 时如何避免 Scala 中的可变变量？

2023-12-19

我正在尝试读取一个 zip 文件，检查它是否包含一些必需的文件，然后将所有有效文件写入另一个 zip 文件。这java.util.zip 的基本介绍 http://java.sun.com/developer/technicalArticles/Programming/compression/有很多 Java 主义，我很想让我的代码更加 Scala 原生。具体来说，我想避免使用vars。这是我所拥有的：

val fos = new FileOutputStream("new.zip");
val zipOut = new ZipOutputStream(new BufferedOutputStream(fos));

while (zipIn.available == 1) {
  val entry = zipIn.getNextEntry
  if (entryIsValid(entry)) {
    zipOut.putNewEntry(new ZipEntry("subdir/" + entry.getName())
    // read data into the data Array
    var data = Array[Byte](1024)
    var count = zipIn.read(data, 0, 1024)
    while (count != -1) {
      zipOut.write(data, 0, count)
      count = zipIn.read(data, 0, 1024)
    }
  }
  zipIn.close
}
zipOut.close

我应该补充一点，我正在使用 Scala 2.7.7。

我不认为使用 Java 类有什么特别的错误，这些类被设计为以命令式的方式按照它们设计的方式工作。惯用的 Scala 包括能够按照预期使用惯用的 Java，即使样式确实有点冲突。

但是，如果您想要（也许作为练习，或者也许因为它确实稍微澄清了逻辑）以更实用的无变量方式执行此操作，您可以这样做。在2.8中，它特别好，所以即使你使用2.7.7，我也会给出2.8的答案。

首先，我们需要设置问题，但你并没有完全解决这个问题，但让我们假设我们有这样的问题：

import java.io._
import java.util.zip._
import scala.collection.immutable.Stream

val fos = new FileOutputStream("new.zip")
val zipOut = new ZipOutputStream(new BufferedOutputStream(fos))
val zipIn = new ZipInputStream(new FileInputStream("old.zip"))
def entryIsValid(ze: ZipEntry) = !ze.isDirectory

现在，我们要复制 zip 文件。我们可以使用的技巧是continually中的方法collection.immutable.Stream。它的作用是为您执行一个延迟评估循环。然后，您可以获取并过滤结果以终止并处理您想要的内容。当您想要将某些东西作为迭代器但事实并非如此时，这是一种方便使用的模式。（如果该项目自行更新，您可以使用.iterate in Iterable or Iterator--这通常更好。）这是这种情况的应用程序，使用两次：一次用于获取条目，一次用于读取/写入数据块：

val buffer = new Array[Byte](1024)
Stream.continually(zipIn.getNextEntry).
  takeWhile(_ != null).filter(entryIsValid).
  foreach(entry => {
    zipOut.putNextEntry(new ZipEntry("subdir/"+entry.getName))
    Stream.continually(zipIn.read(buffer)).takeWhile(_ != -1).
      foreach(count => zipOut.write(buffer,0,count))
  })
}
zipIn.close
zipOut.close

密切关注.在某些行的末尾！我通常会把它写成一长行，但最好将其换行，这样您就可以在这里看到所有内容。

以防万一不清楚，让我们解开其中一个用途continually.

Stream.continually(zipIn.read(buffer))

这要求继续打电话zipIn.read(buffer)根据需要多次，存储结果的整数。

.takeWhile(_ != -1)

这指定了需要多少次，返回一个不定长度的流，但当它遇到一个时就会退出-1.

.foreach(count => zipOut.write(buffer,0,count))

这会处理流，依次获取每个项目（计数），并使用它来写入缓冲区。这以一种有点偷偷摸摸的方式工作，因为你依赖于这样一个事实：zipIn刚刚被调用以获取流的下一个元素 - 如果您尝试再次执行此操作，而不是在一次通过流中执行此操作，则会失败，因为buffer会被覆盖。但这里没关系。

所以，这就是：一个稍微更紧凑、可能更容易理解、可能不太容易理解但功能更强大的方法（尽管仍然存在大量副作用）。相比之下，在 2.7.7 中，我实际上会以 Java 方式执行此操作，因为Stream.continually不可用，并且构建自定义的开销Iterator对于这一个案例来说不值得。（但是，如果我要进行更多 zip 文件处理并且可以重用代码，那就值得了。）

编辑：寻找可用的归零方法对于检测 zip 文件的末尾有点不稳定。我认为“正确”的方法是等到你得到一个null从...回来getNextEntry。考虑到这一点，我编辑了之前的代码（有一个takeWhile(_ => zipIn.available==1)现在是一个takeWhile(_ != null)）并在下面提供了一个基于 2.7.7 迭代器的版本（请注意，一旦完成定义迭代器的工作，主循环有多小，这确实使用了 vars）：

val buffer = new Array[Byte](1024)
class ZipIter(zis: ZipInputStream) extends Iterator[ZipEntry] {
  private var entry:ZipEntry = zis.getNextEntry
  private var cached = true
  private def cache { if (entry != null && !cached) {
    cached = true; entry = zis.getNextEntry
  }}
  def hasNext = { cache; entry != null }
  def next = {
    if (!cached) cache
    cached = false
    entry
  }
}
class DataIter(is: InputStream, ab: Array[Byte]) extends Iterator[(Int,Array[Byte])] {
  private var count = 0
  private var waiting = false
  def hasNext = { 
    if (!waiting && count != -1) { count = is.read(ab); waiting=true }
    count != -1
  }
  def next = { waiting=false; (count,ab) }
}
(new ZipIter(zipIn)).filter(entryIsValid).foreach(entry => {
  zipOut.putNextEntry(new ZipEntry("subdir/"+entry.getName))
  (new DataIter(zipIn,buffer)).foreach(cb => zipOut.write(cb._2,0,cb._1))
})
zipIn.close
zipOut.close

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 ZipInputStreams 和 ZipOutpuStreams 时如何避免 Scala 中的可变变量？的相关文章

Haskell scala 互操作性

我是 Scala 初学者来自面向对象范式在了解 Scala 的函数式编程部分时我被引导到 Haskell 纯函数式编程语言探索 SO 问题答案我发现 Java Haskell 具有互操作性我很想知道 Scala Haskell
IntelliJ IDEA 13：新的 Scala SBT 项目尚未生成 src 目录结构

我按照 Jetbrains 网站上的入门视频设置 IntelliJ IDEA 13 1 Community Edition 以与 Scala 配合使用 Scala 插件 v0 36 431 已安装当我使用向导创建一个新的 Scala SB
Akka Stream Graph 恢复问题

我创建了一个图表来并行化具有相同输入的两个流这些流产生 Future Option Entity 如果 flowA 失败我想返回 Future None 但恢复似乎没有被调用 val graph Flow Input Future Op
HashPartitioner 是如何工作的？

我阅读了文档HashPartitioner http spark apache org docs 1 3 1 api java index html org apache spark HashPartitioner html 不幸的是除了
Spark SQL 失败，因为“常量池已超过 JVM 限制 0xFFFF”

我在 EMR 4 6 0 Spark 1 6 1 上运行此代码 val sqlContext SQLContext getOrCreate sc val inputRDD sqlContext read json input try inp
从 HList 获取元素

我尝试了 HList 并按预期进行了以下工作 val hl 1 foo HNil val i Int hl 0 val s String hl 1 但是我无法让以下代码正常工作让我们暂时假设对列表进行随机访问是一个聪明的主意 class
对两种类型之间的二元关系进行建模

有企业也有人用户可以对某个企业点赞或发表评论但效果是一样的can not发生在一个人身上当用户发布有关某个企业的内容或对其点赞时该企业就被称为target喜欢或帖子 trait TargetingRelation Targetin
规范化且不可变的数据模型

Haskell如何解决规范化不可变数据结构问题例如让我们考虑一个表示前女友男友的数据结构 data Man Man name String exes Woman data Woman Woman name String exes
Play框架：单属性案例类的JSON读取

我正在尝试为包含单个属性的案例类创建隐式 JSON Reads 但收到错误 Reads Nothing 不符合预期类型这是代码 import play api libs functional syntax import play api
Scala：什么是 CompactBuffer？

我试图弄清楚 CompactBuffer 的含义和迭代器一样吗请解释其中的差异根据 Spark 的文档它是 ArrayBuffer 的替代方案可以提供更好的性能因为它分配的内存更少以下是 CompactBuffer 类文档的摘
理解 Scala FP 库

只是为了让那些想要开始使用 Scala FP 库在纯 FP 方面变得更好的人快速清晰地了解有人能澄清猫和猫效应猫效应 IO 之间的区别关系吗最重要的是齐奥和莫尼克斯对此有何看法最后与 ScalaZ 7 8 有何关系到目前为
andThen 类型不匹配的 Scala 链接函数

我有一堆函数可以清理文本并将它们分成单词最小的例子 val txt Mary had a little nlamb val stopwords Seq a def clean text String String text replace
在 Scala 中将元素追加到列表末尾

我无法添加 type 元素T到一个列表中List T 我尝试过myList myElement但它似乎创建了一个奇怪的对象并访问myList last始终返回放入列表中的第一个元素我怎么解决这个问题 List 1 2 3 4 Result
scala中的反引号有什么用[重复]

这个问题在这里已经有答案了我在一本书上找到了以下代码 val list List 5 4 3 2 1 val result 0 list running total next element running total next elem
在scala 2.13中，为什么有时无法显式调用类型类？

这是 Shapeless 2 3 3 中的一个简单示例 val book author gt gt Benjamin Pierce title gt gt Types and Programming Languages id gt gt 2
Erlang：如何将原子转换为字符串？

我想从原子转换为字符串 Input hello world Output hello world 我该如何实现这一目标 Use atom to list http erlang org doc man erlang html atom to
如何执行仅匹配正则表达式的测试？

在 sbt 0 10 1 中我经常使用test only缩小我的测试数量 sbt gt test only com example MySpec 但是我想缩小范围以便只运行名称描述与正则表达式匹配的测试是否有一些语法可以实现这样的
Spark 2.2 无法将 df 写入 parquet

我正在构建一个聚类算法我需要存储模型以供将来加载我有一个具有以下架构的数据框 val schema new StructType add StructField uniqueId LongType add StructField tim
正确使用术语 Monoid

从下面的例子来看我认为这样的说法是正确的String在串联运算下定义了一个幺半群因为它是关联二元运算并且String碰巧有一个身份元素它是一个空字符串 scala gt Jane Doe Jane Doe res0 Boolean
如何关闭 Scala 中因方法重载而导致代码无法编译的特定隐式？

我正忙着尝试自己回答这个问题 Scala Play 2 4 x 通过 anorm MySQL 处理扩展字符到 Java Mail https stackoverflow com questions 31417718 scala play 2

随机推荐

快速从给定列表中查找字典中的所有键

我有一本可能很大字典和可能键的列表我想快速找到字典中哪些键具有匹配的值我发现很多讨论single字典值here https stackoverflow com questions 1602934 check if a given
R：如何删除行并将变量的值作为逗号分隔值添加到前一行？ [复制]

这个问题在这里已经有答案了我有一个数据集如下 col1 col2 a 1 a 2 b 1 b 3 c 4 我想要的输出如下 col1 col2 a 1 2 b 1 3 c 4 在 R 中怎么可能呢我们可以按 col1 分组paste c
HTML 电子邮件中的字体颜色 - Gmail

我知道我必须使用内联 CSS 来设置 HTML 电子邮件中任何内容的样式但我注意到 gmail 中发生了奇怪的覆盖我正在尝试更改表行中文本的颜色 tr style color 000 font size 14px font family
将 Voigt 函数拟合到 Python 中的数据

我最近运行了一个脚本将高斯拟合到我的吸收曲线中SO的帮助 https stackoverflow com questions 59047395 fitting gaussian to absorbtion line in python 我
为什么在安装了“registration redux”应用程序的新创建的 django 项目上运行“migrate”时会出现“auth_user 不存在”错误？

给定一个新创建的 django 项目其中安装了以下应用程序 INSTALLED APPS django contrib admin django contrib auth django contrib contenttypes djang
从二维变换矩阵中提取旋转、缩放值

如何从二维变换矩阵中提取旋转缩放和平移值我的意思是有一个二维变换 matrix 1 0 0 1 0 0 matrix rotate 45 180 PI matrix scale 3 4 matrix translate 50 100 m
使用 shell 选项将 bash 与 Node.js child_process 结合使用失败

The 子进程API https nodejs org api child process html可用于在node js中执行shell脚本我正在使用child process exec 命令选项回调功能作为一个选项 exec
JDK 8 支持 JasperReports 6 吗？

几天来我一直在努力让我的报告发挥作用但仍然没有成功我不知道依赖项是否有问题我之前问过这个问题 https stackoverflow com questions 28937750 a xml related exception occ
flutter/dart：如何在 Dart FFI 中使用异步回调？

我的应用程序的后端是用 C 编写的前端是用 Dart flutter 编写的我希望后端在数据准备就绪时通知前端这需要在 Dart 和 C 之间实现异步回调方案环境 flutter doctor v Flutter Channel s
SQL查询比存储过程运行得更快

我最近在生产服务器上修改了一个存储过程它开始表现不佳但当我独立运行查询时它运行良好时间上的差异很大即比较 5 秒和 10 分钟是令人震惊的我读了这篇文章SQL Server 查询速度快但过程慢 https stackoverf
从 /Library/Developer/ 中删除了 PrivateFrameworks Xcode 在启动时崩溃

有没有办法下载回这个 PrivateFrameworks 文件夹看起来这有使模拟器工作的框架我已经重新下载了xcode9 但它没有回来还尝试重新安装 xcode 命令行工具但此 PrivateFrameworks 似乎既不属于 Xc
JSON.stringify() 的替代方法

我想要 JSON stringify 的替代方法我正在使用 JSON stringify 并且收到类似循环对象值的错误我不知道如何消除这个错误所以我想知道是否有替代方法 DCSSPACE SaveAndOpenJSONWriter f
WPF 动画中的重复之间暂停

我已经应用了以下内容FadeIn FadeOut动画到Canvas in WPF var fadingInOutAnimation new DoubleAnimation From 1 To 0 Duration new Duration
保存 XML 数据的 PHP 对象

如何检查Object中是否有返回数据 twitter xml用于查询abc或者它是空的以下是代码 url http search twitter com search rss q abc twitter xml simplexml loa
应用内购买需要很长时间才能显示确认警报视图

我遇到了以下问题当我的应用程序在设备上运行并点击购买按钮时这会触发应用程序内购买机制最多需要十秒钟才能显示标准确认UIAlertView 上面写着你想买我以前从未见过这样的行为通常它会立即发生所以首先我认为这可能是由于互联
矩形嵌套 - 使用模拟退火收敛到最优解

我在用着模拟退火对于矩形嵌套问题我能够得到很好的结果但我得到的解决方案是离散的即使全局最优也并不总是获得问题描述客观的通过更改零件的放置顺序来最小化无限片材的长度宽度恒定我面临的问题我得到的输出结果是离散的只有 15 个
对文本 swift2 中的每个字母应用数字

我想比较一个中的两个条目UITextField给每个字母一个数字然后比较两个字段中字母相加的结果 Example a 1 b 2 c 3 d 4 e 5 f 6 文本字段1 cae文本字段2 fca 结果是文本字段1 9 和文本字段2
检查文本（短语）中的字符串（单词）列表

除了循环之外是否有一种优雅的方法来测试是否在短语中找到属于列表的单词我在想类似列表理解之一apply功能前任 words lt c word1 word2 word3 text lt This is a text made off o
Chrome 版本 18+：如何通过内容安全策略允许内联脚本？

Chrome 18 Dev Canary 刚刚发布并且content security policy http code google com chrome extensions trunk manifest html content s
使用 ZipInputStreams 和 ZipOutpuStreams 时如何避免 Scala 中的可变变量？

我正在尝试读取一个 zip 文件检查它是否包含一些必需的文件然后将所有有效文件写入另一个 zip 文件这java util zip 的基本介绍 http java sun com developer technicalArticles

使用 ZipInputStreams 和 ZipOutpuStreams 时如何避免 Scala 中的可变变量？

使用 ZipInputStreams 和 ZipOutpuStreams 时如何避免 Scala 中的可变变量？ 的相关文章

随机推荐

热门标签

使用 ZipInputStreams 和 ZipOutpuStreams 时如何避免 Scala 中的可变变量？的相关文章