如何使用 scikit-learn 评估预测的置信度得分

2023-11-23

我写下了一个简单的代码，它采用一个参数“query_seq”，进一步的方法计算描述符，最后可以使用“LogisticRegression”（或该函数提供的任何其他算法）算法作为“0（给定情况为负）进行预测)”或“1（给定情况为正）”

def main_process(query_Seq):
    LR = LogisticRegression()
    GNB = GaussianNB()
    KNB = KNeighborsClassifier()
    DT = DecisionTreeClassifier()
    SV = SVC(probability=True)

    train_x, train_y,train_l = data_gen(p) 
    a  = DC_CLASS()
    test_x = a.main_p(query_Seq)
    return Prediction(train_x, train_y, test_x,LR)

当我们进行交叉验证时，我们计算了算法的准确性估计（特异性、灵敏度、mmc 等）的不同统计参数。现在我的问题是，scikit-learn 中是否有任何方法可以用来估计测试数据预测的置信度分数。

许多分类器可以通过调用predict_proba而不是predict方法。阅读此方法的文档字符串以了解它返回的 numpy 数组的内容。

但请注意，分类器在估计自己的置信水平时也可能会犯错误。要解决此问题，您可以使用外部校准程序通过保留的数据（使用交叉验证循环）来校准分类器。该文档将为您提供有关校准的更多详细信息：

http://scikit-learn.org/stable/modules/calibration.html

最后请注意LogisticRegression默认情况下给出相当好的校准置信水平。大多数其他模型类别都受益于外部校准。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

scikitlearn

scikits

如何使用 scikit-learn 评估预测的置信度得分的相关文章

LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

我正在学习神经网络中的正则化deeplearning ai课程在dropout正则化中教授说如果应用dropout 计算出的激活值将比不应用dropout时测试时更小因此我们需要扩展激活以使测试阶段更简单我理解这个事实但我
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
为什么我的混淆矩阵只返回一个数字？

我正在做二元分类每当我的预测等于事实时我发现sklearn metrics confusion matrix返回单个值难道没有问题吗 from sklearn metrics import confusion matrix print
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
如何将标记化中的多单词名称保留在一起？

我想使用 TF IDF 特征对文档进行分类一种方法是 from sklearn feature extraction text import TfidfVectorizer import string import re import n
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
Sklearn 随机 Logistic 回归给出错误“ValueError：类的数量必须大于 1”

我发现了 sklearn Randomized Logistic 中的一个错误由于我花了很长时间才解决它所以我会将其发布在这里以防其他人遇到同样的问题发生的情况是在格式完美的数据上 sklearn RandomizedLogist
具有定制损失函数的随机森林

我是机器学习领域的初学者对于一个项目我必须在随机森林分类中使用自定义损失函数到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助损失函数分类树中的基尼杂质和熵在 scikit 的 tree pyx
MultiHeadAttention Attention_mask [Keras、Tensorflow] 示例

我正在努力掩盖 MultiHeadAttention 层的输入我正在使用 Keras 文档中的 Transformer Block 进行自我关注到目前为止我在网上找不到任何示例代码如果有人能给我一个代码片段我将不胜感激变压器块来
卷积 ImageNet 网络对于翻转图像具有不变性

我正在使用深度学习 caffe 框架进行图像分类我有一些有头像的硬币有些是左向的有些是右向的为了对它们进行分类我使用常见的方法从预训练的 ImageNet 网络中获取权重和结构该网络已经捕获了大量图像模式并主要训练最后一层以
如何加速 svm.predict？

我正在编写一个滑动窗口来提取特征并将其输入到 CvSVM 的预测函数中然而我偶然发现 svm predict 函数相对较慢基本上窗口以固定的步幅长度在图像比例上滑动穿过图像遍历图像加上提取每个图像特征的速度窗口大约需要 1000
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不

随机推荐

使用 Xcode 在 MacOS X 上安装 GMP

我正在尝试在我的 C 和 C 程序中使用 GMP 库我使用 Xcode 编写代码我按照说明在我的计算机上安装了 GMP 最终得到了一个文件夹 usr local gmp 5 0 5 其中包含 gmp h 文件我怎样才能让我的程序看到这
ZXing Barcode Reader：如何在捕获屏幕周围制作自定义边框？

我想在 zxing 捕获屏幕相机屏幕周围放置自定义边框我需要为此进行什么修改我需要更改哪些活动和布局才能达到此效果您根本不需要编辑布局 In ViewfinderView find onDraw方法它是绘制扫描矩形的核心您
Forecast.io API 与 jQuery 的结合使用

我在使用 API 特别是 Forecast io 天气 API 创建完整的应用程序时遇到一些问题为简单起见我将 JS 直接放在 HTML 页面中对于这个基本版本我很高兴能有这样的展示假设我想要当前温度当前 gt 温度另外我不
在 Django 中引用来自 Javascript 的静态图像

所以我正在开发一个 Django 项目并试图找出如何让 Javascript 能够从我的静态目录渲染图像我修改了 settings py 以从 myproject static 加载静态文件图像 js 等并从 myproject t
绑定不匹配错误和java泛型方法

我收到以下错误 Bound mismatch The generic method constructPage WebDriver int Class
RStudio 项目打开时自动运行 R 代码

我编写了一个 R 函数来更新包的版本号另一个问题我经常使用 GitHub 和 RStudio 如果每次我打开某个项目时都会自动运行此函数或者更好的是进行 git commit push 但我认为这更难做到但我不知道该怎么做或者这是否可
401 未找到 JWT 令牌

我提供了两个版本security yaml文件第二个版本根据API平台文档 API平台发送到创建自定义用户提供者对于第二个选项security yaml根据 API 平台文档推荐我需要创建两个额外的文件我没有将它们附加到主题中但如
如何在 Joomla 2.5 中获取用户组名称

我正在编写一个 Joomla 2 5 组件我一直在 Joomla 1 7 中开发该组件我一直在使用这样的代码 user JFactory getUser groups user gt get groups groups 数组将包含一个以
$@ 和“$@”有什么区别吗？ [复制]

这个问题在这里已经有答案了有什么区别吗 and 我知道非特殊字符可能存在差异但是用输入参数签名 Yes cat a sh echo echo 让我们运行一下 a sh 2 3 4 5 2 3 4 5 output for 2 3 4
如何使用透明背景的画布获取 CSS 样式元素的 png 图像？

我想使用 CSS 为网页上的元素设置样式然后将该元素用作静态 png 是否可以在例如上绘制html节点画布并将此类透明图像保存到文件中我想找到一种方法使用 CSS 获取现有的 HTML 并将其渲染为 PNG 文件并保持透明度将 H
clang++ -stdlib=libc++ 导致未定义的引用

为什么在将 clang 与 libc 一起使用时出现以下链接器错误 clang stdlib libc po cxx lpoppler tmp po QqlXGY o In function main po cxx text 0x33 un
仅对 UITableView 中可用的 CellForRow 显示分隔符

我正在将 UITableView 与自定义单元格一起使用它工作正常但问题是当 UITableView 中只有一两个单元格时它还为空电池提供了分隔符是否可以仅为使用自定义单元格加载的单元格显示分隔符您需要添加一个空页脚视图来隐藏表中
如何从多个 template_folder 加载 Flask 蓝图？

我学习了如何创建 Flask 蓝图并且可以为使用 Jinja2 模板的非 Flask 产品创建蓝图并在 Flask 项目中使用它们我做了这样的事情 blueprint code from flask import Blueprint f
如何在没有 jQuery 的情况下切换元素可见性？

我正在为 eBay 编写一个拍卖模板希望 eBay 能够允许显然他们没有因为 jquery 有 string replace 等东西该代码非常基础 document ready function function changeIma
Pandas Dataframe选择多个不连续的列/切片

我有超过 100 列的数据框我正在尝试选择第 0 32 列和 83 列看来 1 slice 与下面的代码配合得很好 df new df df columns 0 32 但它不适用于下面的 2 片代码我该如何解决这个问题 df new
更改 ComboBox 项目的格式

是否可以在 C 中格式化 ComboBox 项例如如何将某个项目设为粗体更改其文本的颜色等尽管这篇文章很老我发现它作为搜索的起点很有用但最终使用所示的方法得到了更好的结果here由保罗这是我用来有条件地使组合框中的项目显示为
如何为 httpclient getasync 方法创建模拟？

我正在使用 Moq 为单元测试创建模拟但是当我必须为 httpclient 的 getasync 方法创建模拟时我陷入了困境以前我使用 SendAsync 方法为此我可以使用以下代码 var mockResponse new Ht
从word文档中提取标题文本

我正在尝试提取text来自 MS Word 文档 docx 文件中的任何级别标题目前我正在尝试解决使用python docx 但不幸的是读完后我仍然无法弄清楚它是否可行也许我错了我尝试在网上寻找解决方案但没有发现任何适合我的
我可以替换或修改 jQuery UI 小部件上的函数吗？如何？（猴子补丁）

如果我想通过替换其中一个函数来调整 jQuery UI 对象的某些功能我该怎么做呢示例假设我想修改 jQuery 自动完成小部件呈现建议的方式自动完成对象上有一个方法如下所示 renderItem function ul item
如何使用 scikit-learn 评估预测的置信度得分

我写下了一个简单的代码它采用一个参数 query seq 进一步的方法计算描述符最后可以使用 LogisticRegression 或该函数提供的任何其他算法算法作为 0 给定情况为负进行预测或 1 给定情况为正 def main

如何使用 scikit-learn 评估预测的置信度得分

如何使用 scikit-learn 评估预测的置信度得分 的相关文章

随机推荐

热门标签

如何使用 scikit-learn 评估预测的置信度得分的相关文章