如何有条件地从列中删除前两个字符

2024-02-15

我有一些电话记录的以下数据，我想从每条记录中删除前两个值，因为它们是国家/地区代码。我可以使用 Scala 执行此操作的方式是什么，Spark https://en.wikipedia.org/wiki/Apache_Spark, or Hive https://en.wikipedia.org/wiki/Apache_Hive?

phone
|917799423934|
|019331224595|
|  8981251522|
|917271767899|

我希望结果是：

phone
|7799423934|
|9331224595|
|8981251522|
|7271767899|

我们如何从每条记录或该列的每一行中删除前缀 91,01？

手机尺寸可以不同，可以使用这样的构造（Scala）：

df.withColumn("phone", expr("substring(phone,3,length(phone)-2)"))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

Hadoop

apachesparksql

hive

如何有条件地从列中删除前两个字符的相关文章

如何使用 Scala 从 Spark 更新 ORC Hive 表

我想更新 orc 格式的 hive 表我可以从 ambari hive 视图进行更新但无法从 sacla spark shell 运行相同的更新语句 objHiveContext sql select from table name 能
如何将 Dataframe 列名称与 Scala 案例类属性相匹配？

本示例中的 Spark sql 列名来自case class Person case class Person name String age Int val people RDD Person An RDD of case class o
将下划线分配给变量。下划线是做什么的？

最近我遇到了这样的代码 var myVariable variableKind 这似乎是一种分配方式null to myVariable 谁能解释一下背后的理由在这种情况下分配之间有什么区别 and null到一个变量它使用默认值初始
InvalidRequestException（为什么：empid 如果包含 Equal，则不能被多个关系限制）

这是关于我从 Apache Spark 查询 Cassandra 时遇到的问题 Spark 的正常查询工作正常没有任何问题但是当我使用关键条件进行查询时出现以下错误最初我尝试查询复合键列族它也给出了与下面相同的问题由以下原因引
Sqoop - 绑定到 YARN 队列

因此使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output
HDFS 中的文件数量与块数量

我正在运行单节点 hadoop 环境当我跑的时候 hadoop fsck user root mydatadir block 我真的对它给出的输出感到困惑 Status HEALTHY Total size 998562090 B Tot
ScalaTest v3：为什么需要实现convertToLegacyEqualizer

Using 斯卡拉测试3 0 0 http www scalatest org install环境 Scala 2 11 8 sbt 0 13 5 IntelliJ 14 1 4 build sbt 只有 NOTE not using or
更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
Spark 请求最大计数

我是 Spark 的初学者我尝试请求允许我检索最常访问的网页我的要求如下 mostPopularWebPageDF logDF groupBy webPage agg functions count webPage alias cntW
在泛型方法中返回原始集合类型

假设我们想要创建一个像这样的函数minBy返回集合中同等极简主义的所有元素 def multiMinBy A B Ordering xs Traversable A f A gt B val minVal f xs minBy f xs f
Scala 为了在 JVM 上运行做出了哪些妥协？

Scala 是一种很棒的语言但我想知道如果它有自己的运行时如何改进 IE 由于 JVM 的选择做出了哪些设计选择我所知道的两个最重要的妥协是类型擦除 http java sun com docs books tutorial ja
在 Scala 中扩展函数1

在几个例子中我看到一个对象或一个类扩展Function1 E g object Cash extends CashProduct gt String in Scala 的隐藏功能 https stackoverflow com quest
Hive：如何分解嵌入 CSV 文件中的 JSON 列？

从 CSV 文件带有标题和管道分隔符中我得到了以下两个内容其中包含一个 JSON 列内部有一个集合如下所示第一种情况使用没有名称的 JSON 集合 ProductId IngestTime ProductOrders 918
如何记录来自 Akka (Java) 的所有传入消息

在 Scala 中您可以使用 LoggingReceive 包装接收函数如何通过 Java API 实现相同的目标 def receive LoggingReceive case x do something Scala API 有Lo
Flume将数据从MySQL迁移到Hadoop

请分享您的想法需求是将MySQL db中的数据迁移到Hadoop HBase进行分析数据应该实时或接近实时地迁移 Flume可以支持这个吗有什么更好的方法据我了解 Flume 并不是为此而设计的 Flume 基本上用于读取日志如数
使用已知模式保存空 DataFrame (Spark 2.2.1)

是否可以使用已知模式保存一个空的 DataFrame 以便将该模式写入文件即使它有 0 条记录 def example spark SparkSession path String schema StructType val datafr
在 Windows 7 64 位中删除 Spark 临时目录时出现异常

我正在尝试在 Windows 7 64 位中运行 Spark 作业的单元测试我有 HADOOP HOME D winutils winutils path D winutils bin winutils exe 我运行了以下命令 winu
Java时间转正常格式

我有 Java 时间1380822000000 我想转换为我可以阅读的内容 import java util Date object Ws1 val a new Date 1380822000000 toString 导致异常 warnin
“为 Apache Hadoop 2.7 及更高版本预构建”是什么意思？

Apache Spark 下载页面上的 pre built for Apache Hadoop 2 7 and later 是什么意思这是否意味着spark中HDFS必须有库如果是这样其他存储系统例如 Cassandra s3 HB
如何跟踪hadoop中哪个数据块在哪个数据节点？

如果复制一个数据块会复制到哪个数据节点是否有任何工具可以显示复制块存在的位置如果您知道文件名则可以通过 DFS 浏览器查找转到您的 namenode Web 界面说浏览文件系统并导航到您感兴趣的文件在页面底部将列出文件中

随机推荐

取消设置 $_SESSION 不起作用

嗨我编写了一个与 facebook 连接并注册用户的代码然后它使用户登录一切都很好当他们登录时我设置 SESSION id 我的猜测是如果未设置此设置用户将从我的网站注销并且不会自动重新连接因为以前它就像一个循环每次我
将 get() 与替换函数一起使用

谁能向我解释为什么会出现以下示例 Create simple dataframe assign df data frame P runif 5 Q runif 5 R runif 5 Return the dataframe from th
无法加载文件或程序集“System.Web.Helpers，IIS 8 上出现错误”

我有一个 MVC4 Web 应用程序可以使用本地 IIS Express 服务器在 Visual Studio 2012 上正常运行当我将应用程序发布到在 Windows 2012 上运行的 IIS 8 Web 服务器时初始登录页面会
如何从 Microsoft Access 的附件字段查询附件数量？

我的一位用户有一个 Microsoft Access 数据库并且在表中他有一个附件字段在他的一个查询中他想要返回该字段包含的附件数量我试图让它发挥作用但没有成功我尝试创建一个 VBA 模块并将字段传递给它但它对我来说出错了
如何将 cmd python 从 anaconda 更改为默认 python？

windows powershell 或 cmd 使用 anaconda python 而不是默认的 windows 安装如何让他们使用默认的Python安装我的操作系统是Windows 8 1蟒蛇3 6蟒蛇蟒蛇3 6 在系统属性中设置默
如何在.net core中进行String.Copy？

在将 net Framework 应用程序移植到 net core 应用程序时有一些用途String Copy https msdn microsoft com en us library system string copy v vs
为什么蒙特卡罗树搜索会重置树

我有一个小但可能很愚蠢的问题蒙特卡罗树搜索 https en wikipedia org wiki Monte Carlo tree search 我理解其中的大部分内容但一直在研究一些实现并注意到在给定状态运行 MCTS 并返回最佳移
如何让 SwiftUI 视图在拖动时显示在其他视图前面？

我正在用新的更完整的代码更新这个问题以展示我如何尝试实现下面来自 HunterLion 的答案中的建议这是问题的原始陈述我正在使用 SwiftUI 实现 Pentominos 的一个版本当我将一个片段视图拖到板上时我希望它在
在 Angular 中处理 Accordion 的打开/折叠事件

如果我有这个代码
通过架构更改从暂存 > 生产中无缝 EF 迁移

我有一个简单的网络应用程序它由带有暂存槽和生产槽的 Azure Web 应用程序组成当不需要考虑数据库迁移时我可以通过以下方式轻松实现无缝更新将应用程序部署到暂存区交换暂存生产槽位当我要处理数据库迁移时这会变得更加棘手现在
使用 PHP 进行 CURL - 非常慢

All 我必须请求一个返回 JSON 请求的 URL 我正在使用 PHP 和 CURL 来执行此操作目前请求和响应大约需要 3 4 秒以下是curl代码 ch curl init devnull fopen tmp curlcooki
以Python方式创建列表的列表

我正在使用列表列表来存储 python 中的矩阵我尝试按如下方式初始化 2x3 零矩阵 mat 0 2 3 但是当我更改矩阵中一项的值时它会更改该条目的值every行因为每行的 idmat是一样的例如分配后 mat 0 0 1
使用spring security时如何在velocity宏中获取csrf令牌

我正在尝试为启用了 Spring Web Security 的应用程序创建自定义登录屏幕但我无法弄清楚如何将 csrf 令牌传递给velocity 不我目前无法使用 JSP 该模型看起来像这样 RequestMapping value
Fabric.JS 与 Node.JS - 导出为 PNG/JPEG

所以我只是在玩 Fabric JS适用于 Node JS 不适用于 Web 我已经成功制作了一个静态画布并在上面放置了一个矩形出口的时间到了这是我创建画布并添加矩形的代码 var canvas new fabric StaticCan
使用 C# 查找磁盘上所有 exe 文件的最有效方法？

使用 C 查找磁盘上所有 exe 文件的最有效方法是什么它将在程序的后台线程中完成因此磁盘使用量应尽可能小您提供的链接是 C 中最有效的方法使用 Net 4 0 Directory EnumerateFiles 方法 http ms
将字符串与其自身连接两次会导致分段错误

include
用于检查数字是否在特定范围内的位旋转

我发现了一些有趣的事情 source common unicode utf h ICU 库文件 Unicode 国际组件位旋转旨在检查数字是否在特定范围内 Is a code point in a range of U d800 U db
将 document() 参数传递给 XProc 管道中的 xslt

我已经建立了一个 XProc 管道其中我有一个
如何在 SQL Server 中批量更新插入？

我正在使用MERGE在 sql server 2008 数据库中更新插入行的语句然而我的存储过程是单行操作而实际上我更喜欢对这些操作进行批处理这是否可能如果可以我该怎么做您可以在您的过程中使用表值参数吗看看这里http ww
如何有条件地从列中删除前两个字符

我有一些电话记录的以下数据我想从每条记录中删除前两个值因为它们是国家地区代码我可以使用 Scala 执行此操作的方式是什么 Spark https en wikipedia org wiki Apache Spark or Hive

如何有条件地从列中删除前两个字符

如何有条件地从列中删除前两个字符 的相关文章

随机推荐

热门标签

如何有条件地从列中删除前两个字符的相关文章