根据python中的条件添加前导零

2024-01-31

我有一个包含 500 万行的数据框。假设数据框如下所示:

>>> df = pd.DataFrame(data={"Random": "86 7639103627 96 32 1469476501".split()})
>>> df
       Random
0          86
1  7639103627
2          96
3          32
4  1469476501

请注意,Random列存储为字符串。

如果 Random 列中的数字少于 9 位,我想添加前导零以使其成为 9 位。如果数字有 9 位或更多位,我想添加前导零以使其成为 20 位。

我所做的是这样的:

for i in range(0,len(df['Random'])):
      if len(df['Random'][i]) < 9:
          df['Random'][i]=df['Random'][i].zfill(9)
      else:
           df['Random'][i]=df['Random'][i].zfill(20)

由于行数超过 500 万,这个过程需要很多时间! (性能为 5it/秒。使用 tqdm 进行测试,预计完成时间以天为单位!)。

有没有更简单、更快的方法来执行此任务?


让我们做np.where结合zfill,您可以检查替代方案str.pad

df.Random=np.where(df.Random.str.len()<9,df.Random.str.zfill(9),df.Random.str.zfill(20))
df
Out[9]: 
                 Random
0             000000086
1  00000000007639103627
2             000000096
3             000000032
4  00000000001469476501
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

根据python中的条件添加前导零 的相关文章

  • 如何在 django-admin 中显示外键的选择?

    我有与 django admin 面板相关的小问题 我有 2 个型号 from django db import models class Subject models Model subject models CharField max
  • 如何使用 msilib 从 python 模块创建 .msi 文件的示例

    谁能给我一个如何使用 python 的例子msilib http docs python org library msilib html标准库模块从自定义 python 模块创建 msi 文件 例如 假设我有一个名为 Cool py 的自定
  • 使用欧元符号分隔符将 pandas 写入 csv 时出错

    我正在尝试将 Pandas 数据框写入 csv 并以 作为分隔符 data to csv file path sep 但是 我收到错误 TypeError delimiter must be an 1 character string 我怎
  • 如何在 GTK3 下将文本域绑定到本地文件夹以用于 gettext

    With gettext您可以使用默认的系统范围区域设置目录 也可以使用以下命令自己指定一个bindtextdomain 当编译的 mo 翻译文件在系统的默认位置不可用时 直接从源代码运行程序时 这非常有用 在 Python 中你可以这样做
  • 如何命名 HDF5 数据集中的列?

    我在h5py中制作了一个数据集 f h5py File experimentReadings hdf5 w dset f create dataset physics 5 4 dtype f 我有一个变量名称列表 namesList hei
  • Python postgreSQL sqlalchemy 查询 DATERANGE 列

    我有一个预订系统 并将预订日期范围保存在 日期范围 列中 booked date Column DATERANGE nullable False 我已经知道我可以通过以下方式访问实际日期booked date lower or booked
  • 如何将一串空格分隔的数字拆分为整数?

    我有一根绳子 42 0 例如 并且需要获取两个整数的数组 我可以做一个 split在一个空间上 The obvious approach to this problem is a common combination of simple t
  • Python:脚本的目录

    我一直在寻找解决方案 但尚未找到我需要的 脚本路径 dir to script script py or C dir script py 异常结果 script py output dir to script cd script scrip
  • 如何使用 pip 安装 Openpyxl

    我有 Windows 10 64 位 我想利用Openpyxl包开始学习如何与 Excel 和其他电子表格交互 我安装了Python windowsx86 64web basedinstaller 我有 64 位操作系统 尝试安装此版本时我
  • setup.py是什么?

    What is setup py以及如何配置或使用它 setup py是一个 python 文件 它的存在表明您要安装的模块 包可能已使用 Distutils 打包和分发 Distutils 是分发 Python 模块的标准 这使您可以轻松
  • 运行子进程并将输出打印到日志记录

    我正在寻找从 python 调用 shell 脚本并使用日志记录将其 stdout 和 stderr 写入文件的方法 这是我的代码 import logging import tempfile import shlex import os
  • 为什么反斜杠出现两次?

    当我创建包含反斜杠的字符串时 它们会重复 gt gt gt my string why does it happen gt gt gt my string why does it happen Why 你所看到的是表示 of my stri
  • 如何订阅所有进程的PROCESS_STATE_RUNNING事件

    我在用着主管的事件框架 http supervisord org events html订阅由 Supervisor 管理的进程的事件 我的事件监听器 processlistener py 看起来像这样 import sys from su
  • Azure Cosmos DB,删除 IDS(肯定存在)

    这可能是一个非常简单和愚蠢的错误 但我不确定这是如何失败的 我已经用过https github com Azure azure cosmos python insert data https github com Azure azure c
  • 如何读取Flask函数中隐藏的表单数据[重复]

    这个问题在这里已经有答案了 我正在为 Flask 应用程序做一个作业 该应用程序的函数根据 index html 页面上表单中隐藏字段的值执行不同的操作 我只有两条路线 index html 和 process 对index html执行操
  • 使用张量流 tf-transform 进行数据标准化

    我正在使用 Tensorflow 对我自己的数据集进行神经网络预测 我做的第一个模型是与我计算机中的小数据集一起使用的模型 之后 我稍微更改了代码 以便使用具有更大数据集的 Google Cloud ML Engine 在 ML Engin
  • Python:pip 找不到 setup.py

    我怎样才能直接pip找到setup py My setup py文件位于 setuptools 3 5 1 I ran dustin dustin python setuptools 3 5 1 setup py egg info runn
  • Python - 比较2个文件并输出差异

    我的目标是编写一个脚本来比较文件中的每一行 并根据此比较创建一个新文件 其中包含第二个文件中不存在的文本行 例如 File 1 Bob 20 Dan 50 Brad 34 Emma 32 Anne 43 File 2 Dan 50 Emma
  • 如何跳过要求输入密码的 Fabric 连接?

    我正在迭代数百个 EC2 实例 但只能访问其中约 80 我想跳过任何拒绝我的 SSH 密钥并要求输入密码的实例 如果主机无法访问 则可以使用 skip bad hosts选项 否则 看起来您可以使用设置上下文管理器并在该上下文管理器中尝试
  • “ImageDataGenerator”对象没有属性“flow_from_dataframe”

    我正在尝试为癌症检测 Kaggle 挑战赛构建一个图像分类器 这是我正在使用的代码 train datagen ImageDataGenerator rescale 1 255 validation split 0 15 test data

随机推荐