如果缺少列值，则替换为 pandas 数据框中的增量值

2024-04-20

输入数据框：

max_value = 16
x_max = max_value
data = {

's_id' :['G1','','','','G2','G3','G3','G4','','','']    

}
df2 = pd.DataFrame.from_dict(data)
df2
Out[365]: 
   s_id
0    G1
1      
2      
3      
4    G2
5    G3
6    G3
7    G4
8      
9      
10

输出数据帧：

    data = {

's_id' :['G1','G17','G18','G19','G2','G3','G3','G4','G20','G21','G22']    

}
df3 = pd.DataFrame.from_dict(data)
df3

Out[366]: 
   s_id
0    G1
1   G17
2   G18
3   G19
4    G2
5    G3
6    G3
7    G4
8   G20
9   G21
10  G22

我尝试了以下方法： df2['s_id'] = df2['s_id'].mask(df2['s_id'].eq(''))

s = df2[df2['s_id'].isna()].drop_duplicates()

类型错误：不可散列的类型：“列表”

d = {v: f'G{k}' for k, v in enumerate(s, x_max + 1)}
print (d)

如何实现输出数据帧，如果 S_ID 为空，则将其替换为外部变量的最大值。检查 s_id 列的值是否替换为外部变量的增量值。例如：在 G1 之后的 s_id 列中，它必须是 G17，即 max_value +1，

想法就是创造list大小与空值数量相同range并通过掩码将值设置为列DataFrame.loc http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.loc.html:

df2 = pd.DataFrame.from_dict(data)

m = df2['s_id'].eq('')
v = [f'G{x}' for x in range(x_max+1, x_max + m.sum()+1)]
print (v)
['G17', 'G18', 'G19', 'G20', 'G21', 'G22']

df2.loc[m, 's_id'] = v
print (df2)
   s_id
0    G1
1   G17
2   G18
3   G19
4    G2
5    G3
6    G3
7    G4
8   G20
9   G21
10  G22

来自@Jon Clements 的解决方案，谢谢：

df2['s_id'] = df2['s_id'].apply(lambda v, c=itertools.count(x_max + 1): v or f'G{next(c)}')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

如果缺少列值，则替换为 pandas 数据框中的增量值的相关文章

Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
为什么从 Pandas 1.0 中删除了日期时间？

我在 pandas 中处理大量数据分析并每天使用 pandas datetime 最近我收到警告 FutureWarning pandas datetime 类已弃用并将在未来版本中从 pandas 中删除改为从 datetime 模块
从节点列表中提取边和社区

我的数据集有超过 50k 个节点我试图从中提取可能的边缘和社区我确实尝试使用一些图形工具如 gephi cytoscape socnet nodexl 等来可视化和识别边缘和社区但节点列表对于这些工具来说太大了因此我正在尝试编写
Pandas dataframe.hist() 更改子图上的标题大小？

我正在使用 pandas Python 操作 DataFrame 我的数据是 10000 行 X 20 列我正在将其可视化如下所示 df hist figsize 150 150 但是如果我将 Figsize 增大每个子图的标题即
Pandas - 使用 .isnull()、notnull()、dropna() 删除丢失数据的行不起作用

这实在是太奇怪了我尝试了几种从 pandas 数据框中删除丢失数据的行的方法但它们似乎都不起作用这是代码我只是取消注释所使用的方法之一但这些是我在不同修改中使用的三种方法这是最新的 import pandas as pd Tes
使用 dtypes read_csv 但列中没有值[重复]

这个问题在这里已经有答案了我使用以下代码来读取 csv 通过指定每个列的类型 clean pdf type pd read csv table updated csv usecols col names dtype col types 但
如何（重新）命名 pandas 数据框中的空列标题而不导出到 csv

我有一个熊猫数据框df1带有一个索引列和一系列未命名的值我想为未命名的系列指定一个名称到目前为止我知道的唯一方法是导出到df1 csv using df1 to csv df1 csv header Signal 然后使用以下命令重新
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
pandas.read_fwf 忽略提供的数据类型

我正在从文本文件导入数据框我想指定列的数据类型但 pandas 似乎忽略了dtype input 一个工作示例 from io import StringIO import pandas as pd string USAF WBAN S
如何在两个 pandas 数据框之间应用函数

如何将自定义函数应用于两个数据框这 apply方法 https pandas pydata org pandas docs version 0 24 2 reference api pandas DataFrame apply html似
Pandas 多索引数据框中组之间的计算

假设我生成一个多索引数据框如下 arrays np array bar bar baz baz foo foo qux qux np array one two one two one two one two df pd DataFrame
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
根据 pandas 列中的字符串值从 DataFrame 中选择行

如何根据pandas列中的字符串值从DataFrame中选择行我只想显示全部大写的状态各州拥有城市总数 import pandas as pd import matplotlib pyplot as plt pylab inline d
pandas DataFrame 连接/更新（“upsert”）？

我正在寻找一种优雅的方法将一个 DataFrame 中的所有行附加到另一个 DataFrame 两个 DataFrame 具有相同的索引和列结构但如果两个 DataFrame 中出现相同的索引值请使用第二个数据中的行框架因此举例来说
如何在Python中流式传输和操作大数据文件

我有一个相对较大 1 GB 的文本文件我想通过跨类别求和来减小其大小 Geography AgeGroup Gender Race Count County1 1 M 1 12 County1 2 M 1 3 County1 2 M 2
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
动态过滤 pandas 数据框

我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que

随机推荐

Code::Blocks 中的 wxWidgets 字体错误“GetWeightClosestToNumericValue() 中断言“numWeight > 0”失败”

最近每当我使用 Code Blocks 时都会不断弹出错误对话框它显示此应用程序中的调试错误已失败和 include wx font h 282 在 GetWeightClosestToNumericValue 中断言 numWe
使用 com.zaxxer.hikari.HikariDataSource 时出错

我在将 HikariCP 与 Spring 的 JdbcTemplate 集成时遇到错误我正在使用 Spring 3 2 2 HikariCP 2 3 8 和 sybase jconn4 版本 7 0 0 弹簧配置
为什么 cppreference 将 type_traits xxx_v 快捷方式定义为内联 constexpr 而不仅仅是 constexpr？

为什么 cppreference 将 type traits xxx v 快捷方式定义为inline constexpr不仅仅是constexpr 例如参见is integral v http en cppreference com w
在 shell 中用字符串替换变量

我将一个字符串作为参数传递给 shell 脚本 shell 脚本应该告诉我传递的参数是否是变量像这样的东西 if z 1 then echo yes 1 is a variable and its value is 1 fi 但这给了我严
python子进程在引号前发送反斜杠

我有一个字符串它是一个应该在命令行中执行的框架命令 cmdToExecute TRAPTOOL a 字符串 ABC o 字符串 XYZ 我正在考虑该字符串具有应从命令提示符触发的整个命令如果仔细查看字符串 cmdToExecute 您可
MySQL表不存在错误，但它确实存在

有谁知道什么条件下可以收到1146 Table
如何覆盖 sbt 中对某些任务的依赖

我想在某些任务中覆盖对项目的依赖我有一个使用 Spark 的 sbt 多项目 lazy val core Some Project val sparkLibs Seq org apache spark spark core 1 6 1 v
实体框架中的集合值参数？

在我的上一个项目中我决定使用实体框架一切都很顺利直到我尝试使用在哪里我收到一个错误经过一番小小的搜索后我想出了这个帖子 https stackoverflow com questions 110314 linq to entit
调用 Pyramid 中的另一个视图

我的目标在 Pyramid 中调用另一个可调用视图并获得一个Response在不知道有关该视图可调用的任何详细信息的情况下拒绝返回在我的 Pyramid 应用程序中假设我有一个使用 view config 装饰器定义的视图 foo
Azure 函数中的内存缓存

需要缓存对象以提高我的 Azure 函数的性能我尝试了 NET ObjectCache System Runtime Caching 它在我的测试中运行良好测试的缓存保留期长达 10 分钟为了推进这个解决方案我有几个简单的问题 Az
如何为网页上的文本绘制添加动画效果？

我想要一个网页其中有一个居中的单词我希望用动画绘制这个单词以便页面以与我们相同的方式写出该单词即它从一个点开始随着时间的推移绘制直线和曲线以便最终结果是一个字形我不在乎这是否完成
断言列表时，assertEquals 到底检查什么？

在我的测试中我断言我返回的列表是我刚刚创建的列表按字母顺序排列的列表 assertEquals 到底检查什么它检查列表的顺序还是仅检查其内容因此如果我有一个 Fred Bob Anna 列表那么列表中的 2 个 Anna Bob
JavaScript 中 FileReader 的异步/等待问题

我在 Vue js 项目中使用 FileReader 并且此代码有问题 async uploadDocuments files for let file of files let fileName file name let fileCon
显式调用构造函数

我知道我们可以调用构造函数的概念Explicitly and Implicitly 我已经测试了这两种情况通常到目前为止我的所有目的都通过调用构造函数来实现Implicitly 但我想知道每当我们创建时构造函数都会被隐式调用object
Mathematica 中的输入/输出单元标签是由什么生成的以及如何向它们添加自动计时？

当 Mathematica 计算单元格时它会为输入单元格和输出单元格提供细胞标签 http reference wolfram com mathematica ref CellLabel htmls In Line and Out Lin
回形针是否需要全部 4 列（_file_name、_content_type 等）？

我想知道 Paperclip 是否需要数据库中的所有四列 add column users avatar file name string add column users avatar content type string add co
如何更改 VS Code 远程容器中的默认卷挂载？

如何更改容器中打开的文件夹的默认卷装载我已经尝试过在我的Dockerfile RUN mkdir root myproject WORKDIR root myproject 以及我的 devcontainer json name My P
当 defer func 评估其参数时

我正在学习 defer 在 golang 中的行为方式并想用它来处理函数返回时的错误代码如下 package main import fmt import errors func main a func a var err error
Core Plot 1.0如何实现reloadData方法？

我昨天问了这个问题并得到了 Eric Skroch 的大力帮助然而在查看了 Core Plot 网站上的所有文档以及一些示例后我仍然有点困惑因此我将发布迄今为止的代码看看是否有人可以帮助我更多也许埃里克也能更容易提供帮助我
如果缺少列值，则替换为 pandas 数据框中的增量值

输入数据框 max value 16 x max max value data s id G1 G2 G3 G3 G4 df2 pd DataFrame from dict data df2 Out 365 s id 0 G1 1 2 3

如果缺少列值，则替换为 pandas 数据框中的增量值

如果缺少列值，则替换为 pandas 数据框中的增量值 的相关文章

随机推荐

热门标签

如果缺少列值，则替换为 pandas 数据框中的增量值的相关文章