Scala 集合如何能够从映射操作返回正确的集合类型？

2024-01-03

注意：这是一个常见问题解答，专门询问，以便我自己回答，因为这个问题似乎经常出现，我想将它放在一个可以（希望）通过搜索轻松找到的位置

正如我的评论所提示的在这里回答 https://stackoverflow.com/questions/5189984/why-cant-this-simple-scala-example-be-compiled/5190950#5190950

例如：

"abcde" map {_.toUpperCase} //returns a String
"abcde" map {_.toInt} // returns an IndexedSeq[Int]
BitSet(1,2,3,4) map {2*} // returns a BitSet
BitSet(1,2,3,4) map {_.toString} // returns a Set[String]

查看 scaladoc，所有这些都使用map操作继承自TraversableLike，那么为什么它总是能够返回最具体的有效集合呢？甚至String，它提供了map通过隐式转换。

Scala 集合是聪明的东西......

集合库的内部结构是 Scala 领域更高级的主题之一。它涉及更高种类的类型、推理、方差、隐式和CanBuildFrom机制 - 所有这些都是为了使其从面向用户的角度来看非常通用、易于使用且功能强大。对于初学者来说，从 API 设计者的角度理解它并不是一件轻松的任务。

另一方面，您实际上很少需要处理如此深度的集合。

那么让我们开始...

随着 Scala 2.8 的发布，集合库被完全重写以消除重复，大量方法被移动到一个地方，以便持续维护和添加新的集合方法会变得更加容易，但这也使层次结构变得更加困难去理解。

Take List例如，这继承自（依次）

LinearSeqOptimised
GenericTraversableTemplate
LinearSeq
Seq
SeqLike
Iterable
IterableLike
Traversable
TraversableLike
TraversableOnce

那可真是屈指可数啊！那么为什么会有这么深的层次结构呢？忽略XxxLike简而言之，该层次结构中的每一层都添加了一些功能，或者提供了继承功能的更优化版本（例如，通过索引来获取元素）Traversable需要组合drop and head操作，索引序列效率极低）。在可能的情况下，所有功能都尽可能地推向层次结构的最高层，从而最大限度地增加可以使用它的子类的数量并消除重复。

map只是这样的一个例子。该方法实现于TraversableLike（虽然XxxLike特征只真正存在于库设计者中，因此它通常被认为是一种方法Traversable对于大多数意图和目的 - 我很快就会谈到这一部分），并且被广泛继承。可以在某些子类中定义优化版本，但它仍然必须符合相同的签名。考虑以下用途map（正如问题中也提到的）：

"abcde" map {_.toUpperCase} //returns a String
"abcde" map {_.toInt} // returns an IndexedSeq[Int]
BitSet(1,2,3,4) map {2*} // returns a BitSet
BitSet(1,2,3,4) map {_.toString} // returns a Set[String]

在每种情况下，输出尽可能与输入具有相同的类型。当不可能时，将检查输入类型的超类，直到发现does提供有效的返回类型。要做到这一点需要做很多工作，尤其是当你考虑到这一点时String甚至不是一个集合，它只是隐式地转换为一个集合。

那么它是如何做到的呢？

谜题的一半是XxxLike特征（我did说我会去找他们...），其主要功能是采取Repr输入 param（“Representation”的缩写），以便他们知道实际正在操作的真正子类。所以例如TraversableLike是相同的Traversable，但抽象了Repr类型参数然后这个参数将被谜题的后半部分使用；这CanBuildFromtype 类，捕获源集合类型、目标元素类型和目标集合类型以供集合转换操作使用。

用例子来解释更容易！

BitSet 定义了一个隐式实例CanBuildFrom像这样：

implicit def canBuildFrom: CanBuildFrom[BitSet, Int, BitSet] = bitsetCanBuildFrom

编译时BitSet(1,2,3,4) map {2*}，编译器将尝试隐式查找CanBuildFrom[BitSet, Int, T]

这是聪明的部分......作用域中只有一个隐式与前两个类型参数匹配。第一个参数是Repr，由捕获XxxLike特征，第二个是元素类型，由当前集合特征捕获（例如Traversable). The map然后操作也用一个类型参数化，这个类型T是根据第三个类型参数推断出来的CanBuildFrom隐式定位的实例。BitSet在这种情况下。

所以前两个类型参数CanBuildFrom是输入，用于隐式查找，第三个参数是输出，用于推理。

CanBuildFrom in BitSet因此匹配两种类型BitSet and Int，因此查找将成功，并且推断的返回类型也将是BitSet.

编译时BitSet(1,2,3,4) map {_.toString}，编译器将尝试隐式查找CanBuildFrom[BitSet, String, T]。对于 BitSet 中的隐式，这将失败，因此编译器接下来将尝试其超类 -Set- 这包含隐含的：

implicit def canBuildFrom[A]: CanBuildFrom[Coll, A, Set[A]] = setCanBuildFrom[A]

哪个匹配，因为 Coll 是一个类型别名，初始化为BitSet when BitSet源自于Set. The A将匹配任何内容，如canBuildFrom用类型参数化A，在这种情况下，推断为String...从而产生返回类型Set[String].

所以要正确实现集合类型，你不仅需要提供正确的隐式类型CanBuildFrom，但您还需要确保该集合的具体类型作为Repr参数正确的父特征（例如，这将是MapLike在子类化的情况下Map).

String有点复杂，因为它提供了map通过隐式转换。隐式转换是StringOps，哪个子类StringLike[String]，最终得出TraversableLike[Char,String] - String是Repr类型参数

还有一个CanBuildFrom[String,Char,String]在范围内，以便编译器知道在映射 a 的元素时String to Chars，那么返回类型也应该是字符串。从此时开始，将使用相同的机制。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

Collections

Scala 集合如何能够从映射操作返回正确的集合类型？的相关文章

过滤字符串上的 Spark DataFrame 包含

我在用火花1 3 0 http spark apache org releases spark release 1 3 0 html and 火花阿夫罗1 0 0 https github com databricks spark avro
Spark日期格式问题

我在火花日期格式中观察到奇怪的行为实际上我需要转换日期yy to yyyy 日期转换后日期应为 20yy 我尝试过如下 2040年后失败 import org apache spark sql functions val df Seq
如何从命令行向 REPL 添加导入？

如何使 REPL 导入命令行中给出的包 Sample scala someMagicHere import sys error scala gt imports 1 import scala Predef 162 terms 78 are
FOREACH返回的对象顺序稳定吗？

是否可以安全地假设对同一集合的两次迭代将以相同的顺序返回对象显然假设集合没有被更改这取决于集合类型对于大多数集合来说答案是是然而这并不能得到保证集合类型的文档应该指定它是否这样做但正如大多数人所做的那样该细节通常被忽视
HashPartitioner 是如何工作的？

我阅读了文档HashPartitioner http spark apache org docs 1 3 1 api java index html org apache spark HashPartitioner html 不幸的是除了
高效序列化案例类

对于我正在工作的图书馆我需要提供一个高效便捷 typesafe序列化 scala 类的方法理想的情况是用户可以创建一个案例类并且只要所有成员都是可序列化的它似乎也应该如此我准确地知道序列化和反序列化阶段的类型因此不需要也不能
可选择将项目添加到 Scala 映射

我正在寻找这个问题的惯用解决方案我正在构建一个valScala 不可变 Map 并希望有选择地添加一项或多项 val aMap Map key1 gt value1 key2 gt value2 if condition key3 gt
在 Spark MLlib 上使用 Java 中的 Breeze

在尝试从Java使用MLlib时使用微风矩阵运算的正确方法是什么例如scala 中的乘法很简单 matrix vector 相应的功能在Java中是如何表达的有一些方法例如 colon times 可以通过正确的方式调用 breez
如何使用 Spark 2 屏蔽列？

我有一些表我需要屏蔽其中的一些列要屏蔽的列因表而异我正在读取这些列application conf file 例如对于员工表如下所示 id name age address 1 abcd 21 India 2 qazx 42 Ger
使用 net.liftweb.json 或 scala.util.parsing.json 解析大型 (30MB) JSON 文件会出现 OutOfMemoryException。有什么建议吗？

我有一个包含大量测试数据的 JSON 文件我想解析这些数据并推送我正在测试的算法它的大小约为 30MB 包含大约 60 000 个元素的列表我最初在 scala util parsing json 中尝试了简单的解析器如下所示 im
Spark：如何使用crossJoin

我有两个数据框 df1有 100000 行并且df2有 10000 行我想创建一个df3这是两者的交叉连接 val df3 df1 crossJoin df2 这将产生 10 亿行尝试在本地运行它但似乎需要很长时间您认为本地可以实现
Slick和bonecp：org.postgresql.util.PSQLException：FATAL：抱歉，太多客户端已经错误

当我在本地开发应用程序时我使用以下命令启动我的 play2 应用程序sbt run 我喜欢如何更改代码然后重新加载浏览器以查看我的更改在大约 10 次代码更改之后我收到 postgresql 太多连接错误见下文我的数据库连接使用
IntelliJ：线程“主”java.lang.NoClassDefFoundError中的异常：org/apache/spark/sql/types/DataType

附言有一个类似的问题here https stackoverflow com questions 40287289 java lang noclassdeffounderror org apache spark logging 但那是在
将集合绑定到自定义控件属性

我没有运气尝试将数据集合绑定到我的自定义控件的属性我已经实现了该控件的字符串属性的机制在此处提供了一些帮助并期望集合类型同样简单但是我无法让它再次工作这是我的自定义控件视图
如何在 sbt 控制台中加载 scala 文件？ [复制]

这个问题在这里已经有答案了可能的重复将 Scala 文件加载到解释器中以使用函数 https stackoverflow com questions 7383436 load scala file into interpreter to
将 Tuple2 的值部分（即映射）合并为按 Tuple2 的键分组的单个映射

我在 Scala 和 Spark 中这样做我有和Dataset of Tuple2 as Dataset String Map String String 下面是值的示例Dataset A 1 gt 100 2 gt 200 3 gt 1
Scala 使用的 Redis 客户端库建议

我正在计划使用 Scala 中的 Redis 实例进行一些工作并正在寻找有关使用哪些客户端库的建议理想情况下如果存在一个好的库我希望有一个为 Scala 而不是 Java 设计的库但如果现在这是更好的方法那么仅使用 Java 客
为什么这些类型参数不符合类型细化？

为什么此 Scala 代码无法进行类型检查 trait T type A trait GenFoo A0 S lt T type A A0 trait Foo S lt T extends GenFoo S A S 我不明白为什么类型参数
Spark scala 模拟 Spark.implicits 用于单元测试

当尝试使用 Spark 和 Scala 简化单元测试时我使用 scala test 和mockito scala 以及mockito Sugar 这只是让你做这样的事情 val sparkSessionMock mock SparkSes
使用 Shapeless 记录组合任意数量的状态更改函数

我正在尝试移植combineReducers从 Redux 到 Scala 这个想法是每个函数控制它的一小部分状态并且combineReducers创建一个控制整个状态的函数我无法找出应该像这样工作的函数所需的签名 sealed trai

随机推荐

Javascript：确定字符串中的所有字符是否唯一，如果不唯一，则删除重复字符

设置一个数组a letter occurences 但努力循环遍历这个数组以检查occurences gt 1并删除那些存在的 function charFreq s var i j var a new Array for j 0 j l
iOS 11 PDFKit 不更新注释位置

我正在构建一个在 iPad 上编辑 PDF 的应用程序我正在尝试使用添加到 PDFView 超级视图的 panGesture 识别器来实现注释的拖动问题是注释的新矩形边界已分配但更改并未反映在屏幕上这是我的代码 objc func
C# 中的通用列表和静态变量行为

我有一个简单的 C 应用程序当我运行代码时我没有得到预期的结果我得到 2 2 1 但我期待 1 2 3 using System using System Collections Generic using System Linq u
如何将数据从警报对话框传递到颤振中的同一页面

我想从警报对话框传递数据警报对话框包含文本字段因此无论用户在文本字段上输入什么内容文本都应该传递到主页屏幕下面是警报对话框的代码 Padding padding const EdgeInsets only left 42 0 ch
如何将 RDD[(String, String)] 转换为 RDD[Array[String]]？

我正在尝试将文件名附加到文件中的每个记录我想如果 RDD 是数组的话我会很容易做到对于转换 RDD 类型或解决此问题的一些帮助我们将不胜感激在字符串字符串类型中 scala gt myRDD first 1 scala gt
让孩子除以最高孩子的身高

我有两个孩子 div 父容器内的元素 div 如图所示 div class row div class item p Sup p div div class item p Sup p p Wish that other guy was th
使用 angular.element 通过 $ID 获取作用域对象

我需要将数据从角度应用程序传递到在角度之外运行的脚本因为我无权编辑角度应用程序的代码使用 Chrome 的 Angular Batarang 和 NG Inspector 扩展我可以看到需要从中提取的 JSON 对象但我不知道如何开
CaptchaMvc.Mvc5 不显示刷新按钮？

我想创建一个验证码来在我的网站上添加新用户为此我尝试使用CaptchaMvc Mvc5但它不显示用于更改验证码图像的刷新按钮看看 Chrome 的开发者检查它有一个例外Uncaught ReferenceError is not d
Azure AD 中使用 .net core API 的 Microsoft.AspNetCore 与 Microsoft.IdentityModel (ADAL)

Cheers 我正在寻找有关与 Azure AD 一起使用的身份验证库的一些说明特别是关于之间的差异微软AspNetCore and 微软身份模型为基础的图书馆我正在 net core 中实现一个 Api 其身份验证将使用 Azure
将数据从 MS Access 数据库导入到 PostgreSQL 数据库

我在 MS Access 数据库中有一个表我想将其导出到 PostgreSQL 数据库每隔两个月左右我想将所有记录从 Access 表移动到 Postgres 中的表中现在我使用 Access 中的导出到 ODBC 选项来执行此
当我点击 Android 谷歌地图上的标记时，如何隐藏“导航”和“GPS 指针”按钮

当我点击谷歌地图上的标记时会出现导航和 GPS 指针按钮如何在 Android 开发中以编程方式隐藏这两个导航按钮对于您用红色框出的按钮组您可以使用UISettings 中的 setMapToolbarEnabled 方法 h
Python os.path.expandvars 仅适用于某些变量

Running os path expandvars对于某些环境变量失败似乎太基础了不太真实 echo HOSTTYPE x86 64 echo HOME labhome eladw python c import os print o
有没有办法将用户定义的字段放入选择器中？

我有一位客户使用用户定义字段我发现这些值位于数据库的 KvExt 表中但我还没有找到通过 DAC 或 DAC 扩展直接访问这些值的方法有没有办法可以访问该字段并将其添加到 Acumatica 基本页面我的例子中的具体目标是 ARPa
如何在 Javascript 中将字符串数组保存到 JSON 文件？

如何将字符串数组保存到JSON文件输入Node js const alphabet a b c d e f g h 示例 json a b c d e f g h 在 Node js 中你可以这样做 const fs require fs
如何将地心惯性 (ECI) 坐标转换为地心地球固定 (ECEF) AstroPy？其他？

我在卫星轨道的地心惯性坐标 ECI 中具有位置 x y z 和速度 Vx Vy Vz 向量最终希望得到大地坐标纬度经度和高度根据这个其他堆栈溢出问题 https stackoverflow com questions 8233401
为什么 Google Docs 的运营转型会偏向删除？

今天尝试了这个实验为 Google 文档打开两个离线编辑器其中我将第一个词加粗第二次我把它删除了无论我首先打开哪个客户端该单词最终都会被删除首先为什么会出现这种情况我对运营转型的理解是排序很重要在两个人分别输入 a 和
asp.net core 中的 TryValidateModel 在执行单元测试时抛出空引用异常

我正在尝试为 Asp Net Core Web API 的 ModelState 验证编写单元测试我读到最好的方法是使用TryValidateModel功能但是每次运行单元测试时它都会抛出 NullReferenceExcepti
如何从 .csv 填充 IDataReader 以与 SqlBulkCopy.WriteToServer(IDataReader) 一起使用

今天有人提到使用 WriteToServer 的 IDataReader 版本注意数据存储在 csv 文件中比使用大型 csv 文件的数据表更快不幸的是我正在努力寻找有关其实际工作原理应如何实施的信息我找到的唯一链接如下 h
接口与抽象和继承

我已经了解了接口抽象类和继承的用法我看到每种都有其用途但我仍然有点困惑我知道一般一个类只能扩展另一个类虽然有些类可能支持多重继承但它可以实现多个接口这可能是使用接口的主要原因但是如果我是正确的这个课程也可以由另一个课程
Scala 集合如何能够从映射操作返回正确的集合类型？

注意这是一个常见问题解答专门询问以便我自己回答因为这个问题似乎经常出现我想将它放在一个可以希望通过搜索轻松找到的位置正如我的评论所提示的在这里回答 https stackoverflow com questions 5189

Scala 集合如何能够从映射操作返回正确的集合类型？

Scala 集合如何能够从映射操作返回正确的集合类型？ 的相关文章

随机推荐

热门标签

Scala 集合如何能够从映射操作返回正确的集合类型？的相关文章