如何有条件地从列中删除前两个字符

2024-02-15

我有一些电话记录的以下数据,我想从每条记录中删除前两个值,因为它们是国家/地区代码。我可以使用 Scala 执行此操作的方式是什么,Spark https://en.wikipedia.org/wiki/Apache_Spark, or Hive https://en.wikipedia.org/wiki/Apache_Hive?

phone
|917799423934|
|019331224595|
|  8981251522|
|917271767899|

我希望结果是:

phone
|7799423934|
|9331224595|
|8981251522|
|7271767899|

我们如何从每条记录或该列的每一行中删除前缀 91,01?


手机尺寸可以不同,可以使用这样的构造(Scala):

df.withColumn("phone", expr("substring(phone,3,length(phone)-2)"))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何有条件地从列中删除前两个字符 的相关文章

随机推荐