将随机森林预测作为列添加到测试文件中

2023-12-01

我在 python 中工作pandas (in a Jupyter笔记本),我在其中为泰坦尼克号数据集创建了一个随机森林模型。https://www.kaggle.com/c/titanic/data

我读入测试和训练数据,然后清理它并添加新列(两者相同的列)。

在拟合和重新拟合模型并尝试增强等之后;我决定使用一种模型:

 X2 = train_data[['Pclass','Sex','Age','richness']] 
 rfc_model_3 = RandomForestClassifier(n_estimators=200)
 %time cross_val_score(rfc_model_3, X2, Y_target).mean()
 rfc_model_3.fit(X2, Y_target)

然后我预测,是否有人幸存

 X_test = test_data[['Pclass','Sex','Age','richness']]
 predictions = rfc_model_3.predict(X_test)
 preds = pd.DataFrame(predictions, columns=['Survived'])

有没有办法让我将预测添加为column进入测试文件?


Since

rfc_model_3 = RandomForestClassifier(n_estimators=200)
rfc_model_3.predict(X_test)

returns y : array of shape = [n_samples] (see docs),您应该能够将模型输出直接添加到X_test无需创建中间体DataFrame:

X_test['survived'] = rfc_model_3.predict(X_test)

如果您无论如何都想要中间结果,@EdChum 在评论中的建议会很好。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将随机森林预测作为列添加到测试文件中 的相关文章

随机推荐

  • ggplot 将不会绘制缺失的类别

    我正在与 ggplot 作斗争 我总是这样做 有许多very关于强制 ggplot 在图例中包含零值类别的类似问题 here and here 例如 但是我 think I 有一个稍微不同的要求 我对scale x discrete和sca
  • VHDL:对固定信号值进行零扩展

    如何对固定信号值进行零扩展 我有以下信号 signal shamt std logic vector 4 downto 0 在将其分配给另一个大小为 31 到 0 的变量之前 我必须将 shamt 归零 我有以下代码 但我不确定它是否正确
  • 如何查找 PCSC 读卡器的设备实例 ID

    仅具有 PCSC 读取器的句柄和上下文 使用winscard在 Windows gt XP 上 有什么方法可以获取其设备实例 ID 或其他可以在SetupDi 用于查明为所述阅读器加载了哪个驱动程序的 API SCardGetReaderD
  • VS 2013 SDK:如何仅为代码窗口编辑器绑定热键?

    In C 要不然VB Net 使用 Visual StudioPackage 我想为CommandBarButton 例如Ctrl E R 然后 当按下时 关联的CommandBarButton应该调用它的Execute方法 我想是这样 我
  • 从unity上传图片到facebook

    我正在开发一个 Unity 游戏 你可以在其中拍照并将这张照片连同一些标签和东西 很像 Friendsmash 从 Unity 上传到 Facebook 问题是我没有可以放置屏幕截图的网络服务器 并且 Fb Feeb picture 属性只
  • WooCommerce:将产品添加到购物车并覆盖价格?

    replace order new WC Cart replace order gt empty cart true replace order gt add to cart 256 1 以上代码添加产品256到购物车1时间 但我遇到的问题
  • AngularAMD + ui-router + 动态控制器名称?

    我试图在我的应用程序中编写通用路由 并根据路由参数动态解析视图和控制器名称 我有以下有效的代码 stateProvider state default angularAMD route url module action id templa
  • 带有 JWT 令牌的 Google 云存储 JSON API

    我正在尝试使用 Google Cloud Storage 的 JSON API 从 Google Cloud Storage 检索文件 我不被允许使用 SDK 是否可以从 ServiceAccount json 文件创建 JWT 并使用 J
  • CodeIgniter index.php URL 重写 OVH

    我读了很多关于这个主题的主题 但没有人起作用 首先我分享我的配置 虚拟主机文件
  • bash 中的转义字符(对于 JSON)

    我使用 git 然后将提交消息和其他位作为 JSON 有效负载发布到服务器 目前我有 MSG git log n 1 format oneline grep o 它将 MSG 设置为如下所示 Calendar can t go back p
  • 在ios中的谷歌地图上添加多个图钉

    我想在加载谷歌地图时在谷歌地图上添加多个图钉 我有附近位置的纬度和经度值的列表 我怎样才能用图钉在地图上显示所有这些位置 我正在使用适用于 iOS 的 Google SDK 我正在使用以下代码 但它对我不起作用 NSMutableArray
  • 如何独立管理和重新加载多个 QuickFIX/J 会话?

    我可以在一个 QuickFIX J 设置文件中配置多个会话 然后使用一个SocketInitiator 但我希望能够修改一个或多个会话的配置 然后仅重新启动这些会话而不影响任何其他会话 我可以通过拥有多个设置文件并使用一个来做到这一点Soc
  • 自定义 TensorFlow 指标:给定假阳性率下的真阳性率

    我有一个二元分类问题 类别背景 bg 0 信号 sig 1 我正在为此训练神经网络 出于监控目的 我尝试在 Keras 中使用 TensorFlow 后端实现自定义指标 该指标执行以下操作 1 计算我的 NN 输出的阈值 这将导致 X 的误
  • 像 gitolite 这样的程序如何工作?

    我很好奇 gitolite 等程序是如何工作的 特别是它们如何与 SSH 协议交互以提供定制的体验 有人可以提供一个例子来说明我如何完成类似以下的事情以及我可以在哪里了解有关该主题的更多信息吗 ssh email protected PTY
  • 准备好的陈述有简写吗?

    最近我开始使用准备好的语句 但是 我觉得我的代码变得有点过于混乱 包含所有临时变量和仅进行单个查询所需的额外行 到目前为止 我的代码如下所示 stmt conn gt prepare SELECT FROM locations WHERE
  • 无需本地信任库的客户端证书身份验证

    好吧 一开始这可能听起来很奇怪 所以请耐心听我说 我需要解决的问题是这样的 我需要以某种方式在 Spring Boot 应用程序中启用客户端身份验证 允许客户端自己创建证书 without服务器需要使用服务器私钥对 CSR 进行签名 我怎样
  • 防止任务管理器中的进程被关闭

    我正在开发一个小程序来提高工作效率 它应该在预设的分钟数后断开用户与互联网的连接或关闭您的计算机 不应使用任务管理器关闭该程序 我可以编译该程序并运行它 但我可以使用任务管理器关闭它 我的灵感来自于这一页 include
  • 如何用 sed、awk 等 shell 命令的输出替换子字符串?

    我想用sed或任何命令行工具 用 shell 命令的输出替换部分行 例如 通过调用将 linux 纪元替换为人类可读的时间戳date 通过调用内部解码器 将特定协议数据包的十六进制转储替换为其解码后的对应数据包 sed似乎最合适 因为它也允
  • Div 在 IE8 中不会浮动

    这将是主要标记 div class mancha div class logo div div class espacio div class eltitular HEADER div div class lacarta LEFT CONT
  • 将随机森林预测作为列添加到测试文件中

    我在 python 中工作pandas in a Jupyter笔记本 我在其中为泰坦尼克号数据集创建了一个随机森林模型 https www kaggle com c titanic data 我读入测试和训练数据 然后清理它并添加新列 两