将随机森林预测作为列添加到测试文件中

2023-12-01

我在 python 中工作pandas (in a Jupyter笔记本），我在其中为泰坦尼克号数据集创建了一个随机森林模型。https://www.kaggle.com/c/titanic/data

我读入测试和训练数据，然后清理它并添加新列（两者相同的列）。

在拟合和重新拟合模型并尝试增强等之后；我决定使用一种模型：

 X2 = train_data[['Pclass','Sex','Age','richness']] 
 rfc_model_3 = RandomForestClassifier(n_estimators=200)
 %time cross_val_score(rfc_model_3, X2, Y_target).mean()
 rfc_model_3.fit(X2, Y_target)

然后我预测，是否有人幸存

 X_test = test_data[['Pclass','Sex','Age','richness']]
 predictions = rfc_model_3.predict(X_test)
 preds = pd.DataFrame(predictions, columns=['Survived'])

有没有办法让我将预测添加为column进入测试文件？

Since

rfc_model_3 = RandomForestClassifier(n_estimators=200)
rfc_model_3.predict(X_test)

returns y : array of shape = [n_samples] (see docs），您应该能够将模型输出直接添加到X_test无需创建中间体DataFrame:

X_test['survived'] = rfc_model_3.predict(X_test)

如果您无论如何都想要中间结果，@EdChum 在评论中的建议会很好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

machinelearning

RandomForest

将随机森林预测作为列添加到测试文件中的相关文章

Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
如何从 Dockerfile 安装 Python 3.7 和 Pip

我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本这样就可以使用python代替pytho
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
无法打开 Python。错误 0xc000007b

我最近一直在学习 Python 3 我在我的上网本 32 位 Windows 7 上创建简单的小程序没有任何问题当我将它安装在我的上网本上时我没有遇到任何问题但现在我已经开始使用它了我想将它安装在我的台式机上并且我有一个我的桌面
创建一个类似于 Tkinter 的表

我希望创建类似于 Tkinter 中的表格的东西但它不一定是这样的例如我想创建标题 Name1 Name2 Value 并在每个标题下面有几个空白行然后我希望稍后用我计算的值或名称的字符串值填充这些行因此是标签对于 Name2
如何通过双击在浏览器中打开 ipynb 文件

以前我安装了 Canopy 当时我只需双击 ipynb 文件并在浏览器中打开它们即可但是后来我需要Anaconda 一旦我安装了它这个功能就没有了现在我只希望能够简单地双击 ipynb 文件然后该文件就会在 Firefox 中
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
spacy 如何使用词嵌入进行命名实体识别 (NER)？

我正在尝试使用以下方法训练 NER 模型spaCy识别位置人名和组织我试图理解如何spaCy识别文本中的实体但我无法找到答案从这个问题 https github com explosion spaCy issues 491在 Gi
Python：计算数据帧列中所有行中特定字符的实例数

我有一个包含列 toaddress ccaddress body 的数据框 df 我想迭代数据帧的索引以获取 toaddress 和 ccaddress 字段中电子邮件地址的最小最大和平均数量这是通过计算这两列中每个字段中的和的实
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
Pandas Dataframe：将包含列表的行扩展到多行，并为所有列提供所需的索引

我在 pandas 数据框中有时间序列数据索引为测量开始时的时间列中包含以固定采样率记录的值列表连续索引列表中元素数量的差异这是它的样子 Time A B Z 0 1 2 3 4 1 2 3 4 2 5 6 7 8 5 6 7 8
Python - 如何查询定义方法的类？

我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

ggplot 将不会绘制缺失的类别

我正在与 ggplot 作斗争我总是这样做有许多very关于强制 ggplot 在图例中包含零值类别的类似问题 here and here 例如但是我 think I 有一个稍微不同的要求我对scale x discrete和sca
VHDL：对固定信号值进行零扩展

如何对固定信号值进行零扩展我有以下信号 signal shamt std logic vector 4 downto 0 在将其分配给另一个大小为 31 到 0 的变量之前我必须将 shamt 归零我有以下代码但我不确定它是否正确
如何查找 PCSC 读卡器的设备实例 ID

仅具有 PCSC 读取器的句柄和上下文使用winscard在 Windows gt XP 上有什么方法可以获取其设备实例 ID 或其他可以在SetupDi 用于查明为所述阅读器加载了哪个驱动程序的 API SCardGetReaderD
VS 2013 SDK：如何仅为代码窗口编辑器绑定热键？

In C 要不然VB Net 使用 Visual StudioPackage 我想为CommandBarButton 例如Ctrl E R 然后当按下时关联的CommandBarButton应该调用它的Execute方法我想是这样我
从unity上传图片到facebook

我正在开发一个 Unity 游戏你可以在其中拍照并将这张照片连同一些标签和东西很像 Friendsmash 从 Unity 上传到 Facebook 问题是我没有可以放置屏幕截图的网络服务器并且 Fb Feeb picture 属性只
WooCommerce：将产品添加到购物车并覆盖价格？

replace order new WC Cart replace order gt empty cart true replace order gt add to cart 256 1 以上代码添加产品256到购物车1时间但我遇到的问题
AngularAMD + ui-router + 动态控制器名称？

我试图在我的应用程序中编写通用路由并根据路由参数动态解析视图和控制器名称我有以下有效的代码 stateProvider state default angularAMD route url module action id templa
带有 JWT 令牌的 Google 云存储 JSON API

我正在尝试使用 Google Cloud Storage 的 JSON API 从 Google Cloud Storage 检索文件我不被允许使用 SDK 是否可以从 ServiceAccount json 文件创建 JWT 并使用 J
CodeIgniter index.php URL 重写 OVH

我读了很多关于这个主题的主题但没有人起作用首先我分享我的配置虚拟主机文件
bash 中的转义字符（对于 JSON）

我使用 git 然后将提交消息和其他位作为 JSON 有效负载发布到服务器目前我有 MSG git log n 1 format oneline grep o 它将 MSG 设置为如下所示 Calendar can t go back p
在ios中的谷歌地图上添加多个图钉

我想在加载谷歌地图时在谷歌地图上添加多个图钉我有附近位置的纬度和经度值的列表我怎样才能用图钉在地图上显示所有这些位置我正在使用适用于 iOS 的 Google SDK 我正在使用以下代码但它对我不起作用 NSMutableArray
如何独立管理和重新加载多个 QuickFIX/J 会话？

我可以在一个 QuickFIX J 设置文件中配置多个会话然后使用一个SocketInitiator 但我希望能够修改一个或多个会话的配置然后仅重新启动这些会话而不影响任何其他会话我可以通过拥有多个设置文件并使用一个来做到这一点Soc
自定义 TensorFlow 指标：给定假阳性率下的真阳性率

我有一个二元分类问题类别背景 bg 0 信号 sig 1 我正在为此训练神经网络出于监控目的我尝试在 Keras 中使用 TensorFlow 后端实现自定义指标该指标执行以下操作 1 计算我的 NN 输出的阈值这将导致 X 的误
像 gitolite 这样的程序如何工作？

我很好奇 gitolite 等程序是如何工作的特别是它们如何与 SSH 协议交互以提供定制的体验有人可以提供一个例子来说明我如何完成类似以下的事情以及我可以在哪里了解有关该主题的更多信息吗 ssh email protected PTY
准备好的陈述有简写吗？

最近我开始使用准备好的语句但是我觉得我的代码变得有点过于混乱包含所有临时变量和仅进行单个查询所需的额外行到目前为止我的代码如下所示 stmt conn gt prepare SELECT FROM locations WHERE
无需本地信任库的客户端证书身份验证

好吧一开始这可能听起来很奇怪所以请耐心听我说我需要解决的问题是这样的我需要以某种方式在 Spring Boot 应用程序中启用客户端身份验证允许客户端自己创建证书 without服务器需要使用服务器私钥对 CSR 进行签名我怎样
防止任务管理器中的进程被关闭

我正在开发一个小程序来提高工作效率它应该在预设的分钟数后断开用户与互联网的连接或关闭您的计算机不应使用任务管理器关闭该程序我可以编译该程序并运行它但我可以使用任务管理器关闭它我的灵感来自于这一页 include
如何用 sed、awk 等 shell 命令的输出替换子字符串？

我想用sed或任何命令行工具用 shell 命令的输出替换部分行例如通过调用将 linux 纪元替换为人类可读的时间戳date 通过调用内部解码器将特定协议数据包的十六进制转储替换为其解码后的对应数据包 sed似乎最合适因为它也允
Div 在 IE8 中不会浮动

这将是主要标记 div class mancha div class logo div div class espacio div class eltitular HEADER div div class lacarta LEFT CONT
将随机森林预测作为列添加到测试文件中

我在 python 中工作pandas in a Jupyter笔记本我在其中为泰坦尼克号数据集创建了一个随机森林模型 https www kaggle com c titanic data 我读入测试和训练数据然后清理它并添加新列两

将随机森林预测作为列添加到测试文件中

将随机森林预测作为列添加到测试文件中 的相关文章

随机推荐

热门标签

将随机森林预测作为列添加到测试文件中的相关文章