pandas 在构造特定数据类型的数据框时是否有默认填充值？

2024-03-27

考虑字典d:

d = {'A': {'x': 1, 'y': 1}, 'B': {'y': 1, 'z': 1}}

当我把这个传递给pandas.DataFrame http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html构造函数，我知道 x 行、B 列和 z 行、A 列缺少值。

df = pd.DataFrame(d)
df

     A    B
x  1.0  NaN
y  1.0  1.0
z  NaN  1.0

我想要那些NaN需填写0。我当然知道我可以填写。

df.fillna(0)

但现在它们都变成了花车

     A    B
x  1.0  0.0
y  1.0  1.0
z  0.0  1.0

是的！我可以强迫它们为整数

df.fillna(0).astype(int)

   A  B
x  1  0
y  1  1
z  0  1

或者！我可以通过巧妙的字典理解构建一个系列，并使用 fill_value 参数进行堆叠

pd.Series(
    {(i, j): v for j, d_ in d.items() for i, v in d_.items()}
).unstack(fill_value=0)

但如果有一种直接的方法从一开始就用默认值填充缺失值，那么所有这一切都会容易得多。我期待类似的东西

pd.DataFrame(d, dtype=int, fill_value=0)

我知道这是不可用的，但是我还错过了什么吗？

Since 熊猫0.24 https://pandas.pydata.org/pandas-docs/version/0.24/whatsnew/v0.24.0.html#optional-integer-na-support您可以使用 Int64 数据类型：

import pandas as pd    
d = {'A': {'x': 1, 'y': 1}, 'B': {'y': 1, 'z': 1}}    
pd.DataFrame(d, dtype='Int64').fillna(0)

Output:

留意首都I in 'INT64'。如果你用较低的“i”（即“int64”）编写它，你将得到浮点数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas 在构造特定数据类型的数据框时是否有默认填充值？的相关文章

如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

这个问题在这里已经有答案了这是我的简单示例我的实际数据集中的 json 字段非常嵌套因此我一次解压一层我需要在 json normalize 之后保留数据集上的某些列 https pandas pydata org docs ref
如何有条件地组合两个相同形状的 numpy 数组

这听起来很简单但我想我把它想得太复杂了我想创建一个数组其元素是从两个形状相同的源数组生成的具体取决于源数组中哪个元素更大为了显示 import numpy as np array1 np array 2 3 0 array2 np
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
使用 Python 抓取维基百科数据

我正在尝试从以下内容中检索 3 列 NFL 球队球员姓名大学球队维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手一直在尝试使用 beautifulsoup 来
使用 Python 解析 XML，解析外部 ENTITY 引用

在我的 S1000D xml 中它指定了一个带有对公共 URL 的引用的 DOCTYPE 该 URL 包含对包含所有有效字符实体的许多其他文件的引用我使用 xml etree ElementTree 和 lxml 尝试解析它并得到解析错
以编程方式将列名称添加到 numpy ndarray

我正在尝试将列名称添加到 numpy ndarray 然后按名称选择列但这不起作用我无法判断问题是在添加名称时出现还是在稍后尝试调用它们时出现这是我的代码 data np genfromtxt csv file delimiter
如何将同步函数包装在异步协程中？

我在用着aiohttp https github com aio libs aiohttp构建一个 API 服务器将 TCP 请求发送到单独的服务器发送 TCP 请求的模块是同步的对于我来说是一个黑匣子所以我的问题是这些请求阻塞了整
如何获取 Matplotlib 生成的散点图的像素坐标？

我使用 Matplotlib 生成散点图的 PNG 文件现在对于每个散点图除了 PNG 文件之外我还会also就像生成散点图中各个点的像素坐标列表一样我用来生成散点图 PNG 文件的代码基本上是这样的 from matplotli
在 Python 中，如何获取特定文件中定义的类列表？

如果一个文件myfile py包含 class A object Some implementation class B object Some implementation 我如何定义一个方法以便在给定的情况下myfile py 它返回
与函数复合 UniqueConstraint

一个快速的 SQLAlchemy 问题我有一个文档类其属性为数字和日期我需要确保没有重复的号码同年是有没有办法对数字年份日期进行UniqueConstraint 我应该使用唯一索引吗我如何声明功能部分 SQLA
将参数传递给 __enter__

刚刚学习 with 语句尤其是这篇文章 http effbot org zone python with statement htm 问题是我可以传递一个参数给 enter 我有这样的代码 class clippy runner def
向伪 shell (pty) 发出命令

我尝试使用 subprocess popen os spawn 来运行进程但似乎需要伪终端 import pty master slave pty openpty os write master ls l 应该发送 ls l 到从属终端
python csv按列转换为字典

是否可以将 csv 文件中的数据读取到字典中使得列的第一行是键同一列的其余行构成列表的值例如我有一个 csv 文件 strings numbers colors string1 1 blue string2 2 red string
本地设置的 Cython 编译器指令是否影响一个或所有函数？

我正在努力使用 Cython 加速一些 Python Numpy 代码并且对本地设置如定义的here http docs cython org en latest src reference compilation html在文档中
Pandas DataFrame：如何计算组中第一行和最后一行的差异？

这是我的熊猫数据框 import pandas as pd import numpy as np data column1 338 519 871 1731 2693 2963 3379 3789 3910 4109 4307 4800 4
Melt() 函数复制数据集

我有一个这样的表 id name doggo floofer puppo pupper 1 rowa NaN NaN NaN NaN 2 ray NaN NaN NaN NaN 3 emma NaN NaN NaN pupper 4 sop
获取运行云功能的运行时服务帐户

有没有办法以编程方式从云功能获取运行时服务帐户的电子邮件我知道我可以猜测默认的 App Engine 帐户因为它始终是 appspot gserviceaccount com 但这不是我想要的我本来期待有一些环境变量 https
bool() 和operator.truth() 有什么区别？

bool https docs python org 3 library functions html bool and operator truth https docs python org 3 library operator htm
如何抑制 Pandas Future 警告？

当我运行该程序时 Pandas 每次都会给出如下所示的未来警告 D Python lib site packages pandas core frame py 3581 FutureWarning rename with inplace
从 Flask 中的 S3 返回 PDF

我正在尝试在 Flask 应用程序的浏览器中返回 PDF 我使用 AWS S3 来存储文件并使用 boto3 作为与 S3 交互的 SDK 到目前为止我的代码是 s3 boto3 resource s3 aws access key id

随机推荐

如何从直播视频网址获取视频缩略图（帧）

我已将视频上传到服务器上这是电影的预告片我可以借助实时网址直接在我的 videoView 上播放该视频我的问题 android 中有没有任何方法可以帮助我从 url 获取视频帧而不需要download视频到本地存储我知道一种方法名称
C# Java HashMap 等效项

从 Java 世界进入 C 世界是否有一个 HashMap 等价物如果不是你会推荐什么 Dictionary https learn microsoft com en us dotnet api system collections g
将单位类型附加到 Sass 中的计算结果

我最近一直在将 CSS 重构为 SASS 样式表我正在使用Mindscape Web 工作台扩展 http visualstudiogallery msdn microsoft com 2b96d16a c986 4501 8f97 80
使用内部 SecurityException 抛出异常仅显示 ASP.NET MVC 中的内部异常

如果我将以下行添加到 ASP NET MVC 操作方法 throw new Exception outer new SecurityException inner 死机黄屏上实际显示的错误是内部SecurityException 完全没有提
您可以使用 masterdetailpage 图标/文本创建一个点击事件吗？

我有一个带有菜单页用作我的主详细信息页和我的内容页的根页面当我单击菜单页图标文本时我希望菜单页 mdp 在单击图标文本时初始化其组件是否可以这是我目前拥有的代码 public RootPage NavigationPage
Postgres 错误：无法打开文件进行读取：权限被拒绝

计算机 Mac OS X 版本 10 8 数据库 Postgres 尝试将 csv 文件导入 postgres pg gt copy items ordered from users darchcruise desktop items or
用INSERT覆盖cassandra中的行，会导致墓碑吗？

由于数据量和速度的原因在我们的例子中将数据写入 Cassandra 而不导致其创建逻辑删除至关重要目前我们只写了一次行然后就不需要再次更新该行只需再次获取数据现在有一种情况我们实际上需要写入数据然后用更多的数据来完成过一段
awk unix - 匹配正则表达式 - 正则表达式字符串大小限制想法？

以下代码作为一个最小示例它搜索文本后来是一个大型 DNA 文件中存在一个不匹配的正则表达式 awk BEGIN print match CTGGGTCATTAAATCGTTAGC ATC A TC AA C AAT 后来我对找到正则表
是否可以在 R闪亮中运行Python脚本

我有一些格式奇怪的数据集并编写了一些 python 脚本来转换为 csv 格式以在 R 中使用是否可以在 R 闪亮应用程序中调用 python 脚本这是一个最小的 Shiny 应用程序它使用rPython执行 python 调用 l
HTTP 413 请求实体太大

我目前无法在 drupal 7 7 15 中的自定义文件字段上使用 Drupal FileField Source 远程 url 选项发布非常大的文件文件已成功上传到 tmp 目录但在尝试发布时失败文件大小为870Mb A 510m
如何在yml映射的实体中配置VichUploader？

我有一个名为杂志的实体从 yml 文件映射 Acme DemoBundle Entity Magazine type entity table magazine id id type integer generator strateg
为什么参数依赖查找不适用于函数模板dynamic_pointer_cast

考虑以下 C 程序 include
jQuery 获取选中复选框的标签

在下面的代码中当我检查墨西哥时我不断收到 MexicoMexico 作为标签文本返回对于所有其他字段我没有得到这个重复的结果它仅适用于这一字段该问题在第一次分配countryvalues i 后立即发生我不明白为什么 di
NHibernate SchemaUpdate 在生产代码中安全吗？

为了简单起见我在运行时将 Fluent NHibernate 的 Automapping 与 NHibernate 的 SchemaUpdate 结合使用每次运行时 Automapper 都会为所有实体类创建映射而 SchemaUpd
Swagger / Open API 2.0 我可以声明通用响应标头吗？

是否可以声明一个自定义响应标头该标头将出现在所有响应中而无需将其复制到每个响应结构中这在 OpenAPI 3 0 中有所改进您现在可以在全局中定义通用标头components headers部分然后 ref这些定义而不是重复内联定义
HTTP 标头中 CRLF 序列的不正确中和

我在我的项目上运行了 Veracode 扫描它在 HTTP 响应拆分下给了我 CWE ID 113 问题我尝试根据建议解决该问题但没有成功例如 try String selNhid req getParameter selNhid
使用 JWT 刷新令牌如何安全？

据我了解您可以缩短 JWT 访问令牌的生命周期这样如果有人可以访问它它就不会长期工作但是我们不会对 JWT 刷新令牌执行相同的操作来增强用户体验但现在如果有人可以访问我的 JWT 刷新令牌这将授予他们访问受保护资源的权限那
Haskell 二级多态编译错误

给出以下定义 import Control Monad ST import Data STRef fourty two do x lt newSTRef 42 Int readSTRef x 在 GHC 下编译如下 main print r
dplyr left_join 按小于、大于条件

这个问题与问题有些相关根据不平凡的标准有效合并两个数据帧 https stackoverflow com questions 18840410 efficiently merging two data frames on a non tri
pandas 在构造特定数据类型的数据框时是否有默认填充值？

考虑字典d d A x 1 y 1 B y 1 z 1 当我把这个传递给pandas DataFrame http pandas pydata org pandas docs stable generated pandas DataFram

pandas 在构造特定数据类型的数据框时是否有默认填充值？

pandas 在构造特定数据类型的数据框时是否有默认填充值？ 的相关文章

随机推荐

热门标签

pandas 在构造特定数据类型的数据框时是否有默认填充值？的相关文章