NumPy 或 Pandas：在具有 NaN 值的同时将数组类型保持为整数

2023-11-26

是否有一种首选方法来保留 a 的数据类型numpy数组固定为int (or int64或其他），同时仍然有一个元素被列为numpy.NaN?

特别是，我正在将内部数据结构转换为 Pandas DataFrame。在我们的结构中，我们有仍然具有 NaN 的整数类型列（但列的数据类型是 int）。如果我们将其设为 DataFrame，似乎会将所有内容重新转换为浮点数，但我们真的很想成为int.

想法？

尝试过的事情：

我尝试使用from_records()pandas.DataFrame 下的函数，其中coerce_float=False但这并没有帮助。我还尝试使用 NumPy 掩码数组和 NaN fill_value，但这也不起作用。所有这些导致列数据类型变成浮点型。

NaN不能存储在整数数组中。这是目前 pandas 的一个已知限制；我一直在等待 NumPy 中的 NA 值（类似于 R 中的 NA）取得进展，但 NumPy 获得这些功能至少需要 6 个月到一年的时间，看来：

http://pandas.pydata.org/pandas-docs/stable/gotchas.html#support-for-integer-na

（此功能已从 pandas 0.24 版本开始添加，但请注意，它需要使用扩展 dtype Int64（大写），而不是默认的 dtype int64（小写）：https://pandas.pydata.org/pandas-docs/version/0.24/whatsnew/v0.24.0.html#optional-integer-na-support )

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NumPy 或 Pandas：在具有 NaN 值的同时将数组类型保持为整数的相关文章

如何在不破坏默认行为的情况下覆盖 __getattr__ ？

我如何覆盖 getattr https docs python org 3 reference datamodel html object getattr 类的方法而不破坏默认行为压倒一切 getattr 应该没事 getattr 仅作为
Python pandas：删除字符串中分隔符之后的所有内容

我有数据框其中包含例如 vendor a ProductA vendor b ProductA vendor a Productb 我需要删除所有内容包括两个以便我最终得到 vendor a vendor b vendor a 我尝
Python 列表理解不适用于 itertools.groupby 解码

我正在尝试解码结果itertools groupby到一个值列表中我的来源是 x 1 2 2 1 6 3 6 5 1 3 最初的方法是使用 for 语句来实现如下所示 keyfunc itemgetter 0 groups unique
如何充分释放函数中使用的GPU内存

我在用着cupy在接收一个函数numpy数组将其推到 GPU 上对其进行一些操作并返回cp asnumpy它的副本问题函数执行后内存没有被释放如ndidia smi 我知道内存的缓存和重用cupy 但是这似乎仅适用于每个用户当
__getitem__、__setitem__ 如何处理切片？

我正在运行 Python 2 7 10 我需要拦截列表中的更改我所说的更改是指在浅层意义上修改列表的任何内容如果列表由相同顺序的相同对象组成则列表不会更改无论这些对象的状态如何否则它会更改我不需要找出来how列表已经改变
使用Python进行图像识别[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个想法就是我想识别图像中的字母可能是 bmp或 jpg 例如这是一个包含字母 S 的 bmp 图像我想做的是使用Pyth
将分布拟合到直方图

I want to know the distribution of my data points so first I plotted the histogram of my data My histogram looks like th
来自数据框 groupby 的条形图

import pandas as pd import numpy as np import matplotlib pyplot as plt df pd read csv arrests csv df df replace np nan 0
使用 python-docx 在 docx 文件中查找所有“正常”样式且字体大小不是 11 的文本

到目前为止我的实现 from docx api import Document import pandas as pd from docx shared import Pt texts sizes document Document new
如何将一串Python代码编译成一个可以调用函数的模块？

在 Python 中我有一串 Python 源代码其中包含以下函数 mySrc def foo print foo def bar print bar 我想将这个字符串编译成某种形式类似模块的对象这样我就可以调用代码中包含的函数这是我
直接打开Spyder还是通过Pythonxy打开？

之前我一直在运行PythonSpyder 我总是开始Spyder直接双击其图标今天突然发现我还有一个东西叫Python x y 我注意到我也可以开始Spyder通过它这两种方法有什么区别吗如果不是的话有什么意义Python x y
将 for 循环替换为 pyspark 中的并行进程

我在脚本中使用 for 循环来为 size DF 数据帧的每个元素调用函数但这需要很多时间我尝试通过地图删除 for 循环但没有得到任何输出 size DF 是我从表中获取的大约 300 个元素的列表用于 import call
Numpy 通过一个数组的值总结另一个数组

我正在尝试找到一种矢量化方法来完成以下任务假设我有一个 x 和 y 值的数组请注意 x 值并不总是整数并且可以为负数 import numpy as np x np array 1 1 1 3 2 2 2 5 4 4 dtype flo
Python：使用for循环更改变量后缀

我知道这个问题被问了很多但到目前为止我无法使用理解答案我想改变for循环中变量的后缀我尝试了 stackoverflow 搜索提供的所有答案但很难理解提问者经常提出的具体代码因此为了清楚起见我使用一个简单的示例这并不意味着
如何让 Python 找到 ffprobe？

I have ffmpeg and ffprobe安装在我的 mac macOS Sierra 上并且我已将它们的路径添加到 PATH 中我可以从终端运行它们我正在尝试使用ffprobe使用以下代码获取视频文件的宽度和高度 impor
在Python中打开网站框架或图像

所以我对 python 相当熟练并且经常使用 urllib2 和 Cookies 来实现网站自动化我刚刚偶然发现了 webbrowser 模块它可以在默认浏览器中打开一个网址我想知道是否可以从该 url 中仅选择一个对象并打开它具
如何有效地计算另一列中每个元素的较大元素的数量？

我有以下内容df name created utc 0 t1 cqug90j 1430438400 1 t1 cqug90k 1430438400 2 t1 cqug90z 1430438400 3 t1 cqug91c 143043840
Python模糊字符串匹配作为相关样式表/矩阵

我有一个文件其中包含 x 个字符串名称及其关联的 ID 本质上是两列数据我想要的是一个格式为 x by x 的相关样式表将相关数据作为 x 轴和 y 轴但我想要 fuzzywuzzy 库的函数 fuzz ratio x y 作为输出
使用Python的线程模块调用ctypes函数比使用多处理更快？

我一生都无法找出这个问题的答案我编写了一个可以执行数百次繁重计算的脚本我有一个绝妙的主意将这些计算任务编写为 C 然后使用 Python 的 ctypes 与它们交互我心想我什至可以使用并行性进一步优化它我最初的方法是使用线程
Pandas DataFrame 自定义 agg 函数奇怪的行为

我想使用自定义函数沿轴聚合 Pandas DataFrame 但我无法弄清楚该函数应返回什么 df pd DataFrame np arange 50 reshape 10 5 您可以将 numpy 函数传递给DataFrame agg C

随机推荐

何时使用 scala 三重插入符 (^^^) 与双插入符 (^^) 和 into 方法 (>>)

有人可以解释在设计 scala 解析器组合器时如何以及何时使用三重插入符与双插入符吗以及何时如何使用 parser into 方法 gt gt 我将从一个使用 Scala 的示例开始Option类型在一些重要方面类似于Parser
BeanUtils 不适用于链设置器

e g class tester Test public void testBeanUtils throws InvocationTargetException IllegalAccessException NoSuchMethodExce
Tensorflow 汇总合并错误：形状 [-1,784] 具有负尺寸

我试图总结下面神经网络的训练过程 import tensorflow as tf import numpy as np from tensorflow examples tutorials mnist import input data m
在函数外部声明的变量

我只是想看看变量作用域是如何工作的并遇到了以下情况全部从终端运行 x 1 def inc x 5 inc Traceback most recent call last File
go install 总是尝试使用 GOROOT 并且 GOPATH 未在 go env 下列出

我遇到了一个非常令人沮丧的问题GOPATH 尽管设置在 profile 调用时没有出现go env 并且似乎没有影响go install目标位置我正在尝试使用go install安装软件包并收到此错误这清楚地表明它正在尝试安装 usr
提交具有自定义功能的加载项（更新？）

I asked 关于提交具有自定义功能的加载项的问题6个月前目前的结论是an add in that uses custom functions cannot currently be published to the Office St
如何在服务器端处理多个提交

我们都知道古老的禁用提交按钮技巧但是服务器端处理多个提交的最佳方法是什么我有一个应用程序它绝对是critical表格仅发送一次它处理信用卡我没有写出现在的情况但作为一个快速修复我使用了禁用提交技术但是一些禁用了 java
在 Android 上将值从 Dialog 传递回 Activity 的可靠方法？

这个问题已经出现好几次了我已经阅读了所有答案但我还没有看到真正可靠的方法来处理这个问题在我的解决方案中我使用来自调用的侦听器Activity to the AlertDialog像这样 public class MyDialogFr
在推送通知上打开浏览器

当用户单击推送通知时我尝试使用 url 打开浏览器我在 stackoverflow 中搜索找到了这个 Intent browserIntent new Intent Intent ACTION VIEW Uri parse url s
查找并复制文件

为什么以下不将文件复制到目标文件夹 find home shantanu processed name 2011 xml exec cp home shantanu tosend cp omitting directory home sha
PHP：查询结果如何存储在mysqli_result中

当我对数据库进行查询并在 mysqli result 中检索结果时内存使用量非常小但是当我将查询结果中的所有行提取到关联数组中时内存使用率变得非常高
如何限制 Neo4j 中两个节点之间只有一种关系？

我有以下图表目前我正在使用此查询来添加两个节点之间的关系 MATCH a Service b Service WHERE a service id cs2322 and b service id ab3232 CREATE a r DEP
当 DataGrid 接收键盘焦点时，聚焦于 SelectedItem 的 DataGrid 单元格

我有一个DataGrid哪里的SelectedItem绑定到 VM Selected 属性我有一个搜索控件可以进行查找并且SelectedItem of the DataGrid更改并滚动到视图中 WPF 4 0 和DataGrid
如何避免在 Angular 2 中使用很长的相对路径进行导入？

我怎样才能介绍类似的东西 my app name services 以避免像下面这样的导入行 import XyService from services validation xy service 打字稿 2 0 在 TypeScript
由使用本地系统帐户的 Windows 服务启动的可执行文件无法访问网络共享

我有一个由 Windows 服务启动的可执行文件该程序将在客户计算机上运行并且需要连接到远程共享才能执行特定任务该共享由客户通过 UI 指定因此我们事先不知道这一点这意味着它不能硬编码也不能提前映射共享以前我们要求客户登录到
将 IPython 笔记本导出到 Reveal.js 时如何分隔幻灯片？

当我使用 IPython 笔记本执行 Reveal js 演示文稿时 ipython nbconvert mynotebook ipynb to slides post serve 我将所有内容作为一张幻灯片来获取如何将我的内容分成几张幻
如何在 SQL Server 数据库中设计用户/角色架构？

我想设计一个用户角色系统用户有一个名称和一个密码然后用户可以有多个角色例如Admin 为此我创建了一个如下的架构 Users CREATE TABLE dbo Users id int NOT NULL name nvarchar
如何easy_install Egg插件并在不重新启动应用程序的情况下加载它？

我正在创建一个下载并安装自己的 Egg 插件的应用程序但在 easy install 将 Egg 提取到位后加载 Egg 时遇到问题现在是这样的应用程序将egg下载到临时文件夹中使用 setuptools command easy
EPERM，操作不允许错误，配置存储

我知道这是一个常见错误node但我所有的故障排除技术似乎都失败了 Windows 7 32 位电子邮件受保护电子邮件受保护当尝试运行诸如以下的包命令时会出现此问题bower and yo 自耕农为了保持理智在执行这些命令时我处于
NumPy 或 Pandas：在具有 NaN 值的同时将数组类型保持为整数

是否有一种首选方法来保留 a 的数据类型numpy数组固定为int or int64或其他同时仍然有一个元素被列为numpy NaN 特别是我正在将内部数据结构转换为 Pandas DataFrame 在我们的结构中我们有仍然具有 N

NumPy 或 Pandas：在具有 NaN 值的同时将数组类型保持为整数

NumPy 或 Pandas：在具有 NaN 值的同时将数组类型保持为整数 的相关文章

随机推荐

热门标签

NumPy 或 Pandas：在具有 NaN 值的同时将数组类型保持为整数的相关文章