Pandas：随机化列中的字母

2023-12-28

我有一个如下所示的数据框：

id1           | id2
----------------------------
ab51c-ee-1a   | cga--=%abd21

我只想随机化字母：

id1           | id2
----------------------------
ge51r-eq-1b   | olp--=%cqw21

我想我可以做这样的事情：

newid1 = []
for index, row in df.iterrows():
    string = ''
    for i in row['id1']:
        if i.isalpha():
            string+=random.choice(string.letters)
        else:
            string+=i
    newcolumn.append(string)

但似乎效率不是很高。有没有更好的办法？

让我们使用apply，凭借str.replace使用正则表达式仅替换字母，即

import string 
import random

letters = list(string.ascii_lowercase)

def rand(stri):
    return random.choice(letters)

df.apply(lambda x : x.str.replace('[a-z]',rand))

Output :



           id1            id2
0  gp51e-id-1v      jvj--=%glw21

对于某一特定列的用途

df['id1'].str.replace('[a-z]',rand)

添加者@antonvbr https://stackoverflow.com/users/7386332/anton-vbr：供将来参考，如果我们想更改大小写，我们可以这样做：

letters = dict(u=list(string.ascii_uppercase),l=list(string.ascii_lowercase))

(df['id1'].str.replace('[a-z]',lambda x: random.choice(letters['l']))
          .str.replace('[A-Z]',lambda x: random.choice(letters['u'])))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas：随机化列中的字母的相关文章

如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
pip 安装失败，SSL 证书验证失败 (_ssl.c:833)

我无法通过 pip install 安装任何外部 python 模块我已经正确安装了 python 但如果我使用 pip install 它会显示此错误这是我运行后的代码pip install pytesseract C Users 1
在 Python 中绘制分类数据的三个维度

我的数据包含三个我试图可视化的分类变量城市五个之一职业四种之一血型四种之一到目前为止我已经成功地以一种我认为易于使用的方式对数据进行了分组 import numpy as np pandas as pd Make data
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
Windows Defender 检测 Python EXE 为木马

我制作了一个 Python 脚本将 Windows 目录以 zip 形式邮寄给我我使用 sched 模块添加了一个调度程序每小时重复一次我试图制作一个简单的同步应用程序供个人使用在 Windows 启动时启动我使用将其转换为 e
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
在Python中从CSV文件中获取随机行并找到相应的单词，就像测验一样

抱歉标题含糊不清想不出更好的表达方式我有一个包含德语英语单词的 CSV 文件如下所示 Ja Yes Nein No Katze Cat 我希望我的 python 脚本从 CSV 文件中打印一个随机的德语单词并要求他们输入英语单词
Python matplotlib 在鼠标悬停时不显示完整日期

我有一个数据框日期索引 and 温度值 Date Temperature 2015 10 21 9 118 2015 10 22 9 099 2015 10 23 8 945 2015 10 26 8 848 2015 10 27 8 84
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

使用Scala对象作为key的reduceByKey

我正在将 Spark 与 scala 一起使用并且我有一个充满 tuple2 的 RDD 其中包含一个复杂对象作为键和一个 double 目的是如果对象相同则加倍频率为此我将我的对象定义如下 case class SimpleCo
R 中的分组依据和条件

我有一个具有相似名称课程课程和完成情况的数据框 name lt c John John John Sam Sam course lt c Driving Driving Driving Cycling Cycling lesson lt
指定的子项已经有父项。您必须首先对孩子的父母调用removeView()

我正在做一个关于输入你的名字的应用程序的小练习它返回你好你输入的名字但是在我按下按钮后我收到错误指定的子项已经有父项您必须首先在子项的父项上调用removeView MainActivity java package com
Spring Boot 中未调用 ClientHttpRequestInterceptor

我正在尝试使用 ClientHttpRequestInterceptor 将日志记录添加到我的应用程序我的拦截器没有被调用不知道这里出了什么问题这是我的代码 Component Slf4j public final class Res
SQL 模式匹配

我有一个与 SQL 相关的问题我想匹配两个字段的相似性并返回相似程度的百分比例如如果我有一个名为 doc 的字段其中包含以下内容 This is my first assignment in SQL 在另一个领域我有类似的东西 My
Hibernate：复杂对象的初始化

我在合理的时间内从数据库完全加载非常复杂的对象并使用合理的查询数量时遇到问题我的对象有很多嵌入实体每个实体都引用另一个实体另一个实体引用另一个实体依此类推因此嵌套级别为 6 因此我创建了示例来演示我想要的内容 https gi
无法使用 Node.js 处理 PHP 文件

我有一个在 Heroku 服务器上运行的 Node js Web 应用程序我的 javascript 中有一个 AJAX 请求它将 GET 请求发送到服务器上的 PHP 文件该请求工作正常事实上如果我在没有任何 Node js 而
Lumen (Laravel) Eloquent php artisan make：模型未定义

我将 Lumen 1 0 用于 API 项目我已经通过取消注释以下行来启用 Eloquent引导程序 app php file app gt withEloquent 但是当我想通过迁移创建第一个模型时它失败了 php artisan
在 SQLite android 中存储图像

我有一个 SQLite 数据库我使用此代码将图像存储为 BLOB URL url new URL http t0 gstatic com images q tbn ANd9GcRsaLl3TGB4W2hJFN Wh0DNVPQEYGtwe
GNU 排序命令的行为（使用非字母 ASCII 字符，例如点或分号）

我想要sort命令平等对待所有字符例如当我这样做时 echo e TEST b nTESTa nTESTc sort TESTa TEST b TESTc 该点被忽略我想得到TEST b在最后或第一个位置但是我在手册页中找不到正确
UNIX：同一路径上的两个同名目录？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案当我浏览 UNIX 系统时当我执行以下操作时我发现同一个路径上列出了五个具有相同名称的目录ls Dl 这是观点为什么我说五个两个同
获取可用的 clojure 命名空间

有没有一种惯用的方法来获取可以使用的可用名称空间 all ns 仅返回已使用的名称空间 Package getPackages 返回所有可用的 Java 包import 但仅限那些已使用的 Clojure 命名空间然后我偶然发现这个帖子
使用 ACL 调用 upload_file 时，Ruby S3“访问被拒绝”错误

我正在尝试编写一个 Ruby 脚本将文件上传到 AWS 并使该文件公开可用我做了以下事情 s3 Aws S3 Resource new credentials Aws Credentials new KEY SECRET region
当主键为 varchar 时，无法从 Laravel 的 Eloquent 检索列值

我遇到了一个问题我的 Laravel 的 Eloquent 模型没有给我名为 id 的列的值它只是变成整数 0 而不是字符串我虽然该列受到某种保护但在 id 是整数的其他模型中它返回的值很好问题我不能使用 VARCHAR 作为
使用 jQuery 的 $().on('mouseenter',function(){}) 比 $().mouseenter(function(){}) 有优势吗？

我经常看到这样的代码 thing on mouseenter function Do stuff 就我个人而言我几乎总是这样写 thing mouseenter function Do stuff 同样我也经常写 thing click
.NET 平台扩展 7 中的 Host.CreateDefaultBuilder 与 Host.CreateApplicationBuilder

我们一般使用以下方式创建主机Host CreateDefaultBuilder 方法这Host CreateDefaultBuilder返回一个IHostBuilder The IHostBuilder有一些扩展方法我们可以通过它们配置
阅读动画 GIF SDL 2

我希望能够加载 GIF 动画而不是在我正在开发的游戏中使用精灵表和网格我相信这会让我做的事情比现在容易得多我在 Google 上查了一下但我发现的只是一个使用 Win32 调用的库因此仅限于 Windows 我相信如果我弄清楚如
在Excel VBA中提取json数组的最大值而不进行迭代

我有 JSON 数据字符串我尝试从中提取 id 的最高值而不进行迭代这是 JSON 数据字符串 ball coordinates id 3938706 fixture id 18795544 period id 4644037 time
基于同一元素多个属性值的Marklogic查询

我有以下 xml 样本1 xml
Pandas：随机化列中的字母

我有一个如下所示的数据框 id1 id2 ab51c ee 1a cga abd21 我只想随机化字母 id1 id2 ge51r eq 1b olp cqw21 我想我可以做这样的事情 newid1 for index row in df

Pandas：随机化列中的字母

Pandas：随机化列中的字母 的相关文章

随机推荐

热门标签

Pandas：随机化列中的字母的相关文章