如何组合两个机器学习算法的输出？

2023-11-30

如果我有两个非常不同的数据集和两种非常不同的分类技术，是否有一个很好的方法来组合这两个输出？我知道平均值可能有效，但有没有更相关的方法来做到这一点？我听说过一些概念，例如增强学习和集成学习，这些概念是否适用？

解决这个问题有两种一般方法。第一个，叫做boosting，使用加权投票来决定预测。主要思想是结合两个分类器的优点。

第二种方法称为stacking，使用两个分类器的输出作为另一个分类器的特征（可能带有其他特征，例如原始特征），并使用最终分类器的输出进行预测。

在没有更多细节的情况下，这是我能给出的最佳答案。

See 机器学习中的装袋、提升和堆叠请访问 Stats.SE 了解更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

如何组合两个机器学习算法的输出？的相关文章

具有多个输入的 Keras TimeDistributed 层

我正在尝试使以下代码行正常工作 low encoder out TimeDistributed AutoregressiveDecoder X tf embeddings Where AutoregressiveDecoder是一个需要两个
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择我想要获得最终的功能集across标签然后我将在另一个机器学习包中使用它我打算使用我看到的方法here https stackoverflow com questions 1640
在 SciKit-Learn 中使用 Pipeline 计算排列重要性

我正在使用来自的确切示例SciKit https scikit learn org stable auto examples inspection plot permutation importance html sphx glr auto
随机森林修剪

我有 sklearn 随机森林回归器它非常重有 1 6 GB 并且在预测值时工作很长时间我想把它修剪一下让它变得更轻据我所知决策树和森林没有实施修剪我无法自己实现它因为树代码是用 C 编写的而我不知道有谁知道解决方案吗
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
如何创建增量NER训练模型（追加到现有模型中）？

我正在训练定制命名实体识别 NER 模型使用斯坦福自然语言处理但问题是我想要重新训练模型 Example 假设我训练过xyz模型然后我将在一些文本上测试它如果模型检测到错误那么我最终用户将更正它并希望在更正的文本上重新训练追加模
XGBoost 产生预测结果和概率

我可能正在文档中查看它但我想知道 XGBoost 是否有办法生成结果的预测和概率就我而言我正在尝试预测多类分类器如果我能返回Medium 88 那就太好了分类器中预测概率 88 参数 params max depth 3 ob
如何求真实数据的概率分布和参数？（Python 3）

我有一个数据集来自sklearn我绘制了分布load diabetes target数据即回归值load diabetes data用于预测我使用它是因为它的回归变量属性数量最少sklearn datasets 使用Python 3
Scikit-learn：如何获得 True Positive、True Negative、False Positive 和 False Negative

我的问题我有一个数据集它是一个很大的 JSON 文件我读取它并将其存储在trainList多变的接下来我对其进行预处理以便能够使用它完成后我开始分类我用kfold交叉验证方法以获得平均值准确性并训练分类器我做出预测并获
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
BertForSequenceClassification 是否在 CLS 向量上进行分类？

我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
使用 LSTM 进行时间序列模式识别(python)

我的应用场景和上一个类似时间序列中的模式识别 https stackoverflow com questions 11752727 pattern recognition in time series By processing a tim
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
Haar级联正例图像大小调整

我正在迈出第一步为自定义对象识别创建 haar 级联我花了时间获取大量数据并编写了一些预处理脚本以将视频转换为帧我的下一步是裁剪感兴趣的对象以创建一些积极的训练示例我有几个问题我确实在网上寻找答案我有点困惑我读到我应该致力于

随机推荐

JTextArea.append 的线程安全

java doc说append方法是线程安全的但是我记得当我尝试从不同线程几个月前使用附加到文本区域时我得到了混乱的文本其中线程 1 将附加一些字符而线程 2 将附加一些其他字符因此我得到的不是 jtextarea 中的
Ruby x,y = gets.split.map &:to_i

我对这行 ruby 代码感到困惑为什么赋值给 x y 而不是单个变量 x y gets split map to i 这将数组中的第一个条目分配给x 第二个条目y与分配给单个变量相反在这种情况下数组将分配给该变量将多个变量放在赋值的
VS安装项目：在不同目录中安装文件

我有 Visual Studio 安装项目我想将我的文件之一安装到驱动器 C 上的某个目录我该怎么做一个例子我正在将我的应用程序安装在 C MyApp 中以及一个文件 settings ini 到 C Settings MyApp
分配给 Setparent(..) 后 Showmodal 出现问题

我创建了两个应用程序 MainApps 和 SubApps SubApps 有一个模式类型对话框例如登录注销表单等并且工作正常将其附加到 MainApps 后模态对话框显示为正常的框形式它的行为类似于 DIALOG SHOW 而
Google登录API：强制输入密码？

我在我的网站上使用了多个社交提供商包括 Google 每次用户请求我的一项操作时我都会询问 Google 帐户的密码这是出于安全原因通过 Facebook 我们可以发送auth type reauthenticate范围 Googl
使用具有不同 xlabel 的 Pandas 绘制日期时间条形图

我想绘制一个条形图其中带有条形图的 pandas DataFrame 的每一列中只有几个数据条目这是成功的但它不仅有错误的 y 轴限制而且还使 x 刻度间隔非常紧密使得图表毫无用处我想将步速更改为大约每周左右并且仅显示日月和
CKEditor：设置光标/插入符位置

如何在 CKEditor 3 x 中定位插入符号我有 2 个位置我想在这两个位置上使用 insert HTML 伪代码 editor setCaret 20 function does not exists editor insertH
CSS 不适用于 django 密码表单字段

我从网上下载了一个CSS模板我能够将除密码字段和按钮样式之外的所有内容链接到我的 Django 代码我错过了什么步骤我已阅读 Django 文档并且正在使用 attr 方法将 css 属性添加到我的 Django 表单字段在我的P
如何在 Linux/OS X 上打印 wstring？

我怎样才能打印这样的字符串 a c e 在控制台屏幕上我试过这个 include
为什么当我执行performSelectorInBackground:时没有自动释放池？

我正在调用一个在后台线程中运行的方法 self performSelectorInBackground selector loadViewControllerWithIndex withObject NSNumber numberWithI
每个 Flash 上传器都会给出错误的进度值

我去年初为内部网站编写的文件上传脚本在许多机器上表现得很奇怪在某些机器上它始终工作正常而在其他机器上它始终表现不佳我在使用 YUI Uploader SWFUpload 2 2 和 2 5a 和 Uploadify 时遇到完全相同的问
MutableLiveData 中 setValue() 和 postValue() 的区别

有两种方法可以使变化值MutableLiveData 但有什么区别setValue postValue in MutableLiveData 我找不到相同的文档这里是班级MutableLiveData安卓的 package android
改变矩阵维度

让我们举一个可复制的例子这是我的初始矩阵 d lt matrix 1 80 5 d 1 2 3 4 5 1 1 17 33 49 65 2 2 18 34 50 66 3 3 19 35 51 67 4 4 20 36 52 68 5 5
在 asp net mvc 5 中使用会话变量进行授权

所以我的项目需求发生了变化现在我想我需要构建自己的操作过滤器所以这是我当前的登录控制器 public class LoginController Controller GET Login public ActionResult Ind
如何随机均衡不相等的值？

假设我有多个不相等的值 a b c d e 是否可以仅通过随机数生成将这些不相等的值变成相等的值示例 a 100 b 140 c 200 d 2 e 1000 我希望算法随机定位这些集合以便最常定位最大值而大多数情况下只保留最小值我
当列类型为 nvarchar 时，将表与列值总和一起旋转

我有一个具有以下结构的表我想转置它 BookId Status 123A Perfect 123B Restore 123C Lost 123D Perfect 123A Perfect 123B Restore 123A Lost 12
rpy2 在 Windows 7 上安装

我试图在我的计算机上安装 rpy2 但无法做到这一点我下载了源码包并尝试使用命令安装Rpy2 rpy2 2 3 2 python setup py install 这是结果 running install running build r
我想获取 SD 卡中的音频文件

在我的应用程序中我想设置ringtone当我接到来电时如何打开SDCARD并得到音频文件并列出它如何获得URI对于所选的audio file MediaScanner 为您查找音乐填充 MediaStore 数据库下面是一些查找音乐
使用可选参数和命名参数解决歧义

我的项目有两种方法定义如下 void Person int ID double height 0 0 string team Knights my codes void Person int ID double height 0 0 st
如何组合两个机器学习算法的输出？

如果我有两个非常不同的数据集和两种非常不同的分类技术是否有一个很好的方法来组合这两个输出我知道平均值可能有效但有没有更相关的方法来做到这一点我听说过一些概念例如增强学习和集成学习这些概念是否适用解决这个问题有两种一般方法第一

如何组合两个机器学习算法的输出？

如何组合两个机器学习算法的输出？ 的相关文章

随机推荐

热门标签

如何组合两个机器学习算法的输出？的相关文章