Scikit-learn 具有使用“特征”的自定义评分函数

2024-05-04

我正在尝试使用一种名为“SERA”（平方误差相关区域）的新指标作为本文中提到的不平衡回归的自定义评分函数。https://link.springer.com/article/10.1007/s10994-020-05900-9 https://link.springer.com/article/10.1007/s10994-020-05900-9

以下是该论文的简要介绍。为了计算 SERA，每个特征标签对都需要用户定义的称为“相关性”的特征。相关性从 0 到 1 变化。0 表示不相关，1 表示高度相关。

这就是SERA 的计算过程。相关性从 0 到 1 小步变化。对于每个相关性 (phi) 值（例如 0.45），选择训练数据集的一个子集，其中相关性大于或等于该值（例如 0.45）。对于选定的训练子集，计算平方误差之和，即 sum(y_true - y_pred)**2，称为平方误差相关性 (SER)。然后计算我们为 SER 与 phi 和曲线下面积创建的图，即 SERA。

这是我使用 make_scorer 在 python 中为 sklearn 编写的代码。我运行了这段代码，但出现错误。

import pandas as pd
from scipy.integrate import simps
from sklearn.metrics import make_scorer

def calc_sera(y_true, y_pred, x_relevance=None):

    # creating a list from 0 to 1 with 0.001 interval
    start_range = 0
    end_range = 1
    interval_size = 0.001

    list_1 = [round(val * interval_size, 3) for val in range(1, 1000)]
    list_1.append(start_range)
    list_1.append(end_range)
    epsilon = sorted(list_1, key=lambda x: float(x))

    # Initiating lists to store relevance(phi) and squared-error relevance (ser)
    relevance = []
    ser = []

    # Converting the dataframe to a numpy array
    rel_arr = x_relevance.to_numpy()
    # selecting a phi value
    for phi in epsilon:
        relevance.append(phi)
        error_squared_sum = 0
        for i in rel_arr:
            # Getting the subset of the training data
            if i >= phi:
                # Error calculation
                error_squared_sum += (y_true - y_pred)**2
        ser.append(error_squared_sum)

    # squared-error relevance area (sera)
    # numerical integration using simps(y, x)

    sera = simps(ser, relevance)

    return sera

score = make_scorer(calc_sera, x_relevance=df['Relevance'], greater_is_better=False)

VisibleDeprecationWarning：不推荐从不规则的嵌套序列（这是具有不同长度或形状的列表或元组或 ndarray 的列表或元组）创建 ndarray 。如果您打算这样做，则必须在创建 ndarray 时指定 'dtype=object' 返回数组（a，dtype，复制=假，顺序=顺序）作业异常：评分必须返回一个数字，而是得到 [.....] () 。（得分者=得分）

谁能帮我解决这个问题吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Scikit-learn 具有使用“特征”的自定义评分函数的相关文章

使用 python requests 模块时出现 HTTP 503 错误

我正在尝试发出 HTTP 请求但当前可以从 Firefox 浏览器访问的网站响应 503 错误代码本身非常简单在网上搜索一番后我添加了user Agent请求参数但也没有帮助有人能解释一下如何消除这个 503 错误吗顺便说一句
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
Python getstatusoutput 替换不返回完整输出

我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效不过我觉得这个方法有问题output被构建它只返回输出的最后一行但我不明白为什么任何帮助都是极好的 def
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
在本地网络上运行 Bokeh 服务器

我有一个简单的 Bokeh 应用程序名为app py如下 contents of app py from bokeh client import push session from bokeh embed import server do
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是

随机推荐

您可以控制借用结构体还是借用字段吗？

我正在开发一个涉及以下结构的程序 struct App data Vec
openGL转png

我正在尝试将包含大量纹理没有移动的 openGL 编辑我画的卡片 thx unwind 转换为一个 PNG 文件我可以在框架的另一部分中使用该文件我正在与有 C 库可以做到这一点吗 thanks 如果您的意思只是获取由 Open
用于编译/反编译二进制数据文件的通用实用程序或库？

我有各种二进制文件格式我需要将其转储为某种文本格式编辑然后重新编译可能是二进制格式的稍微不同的版本当然我可以用 C C 编写一堆实用程序代码来完成这种事情并且可能利用一个库来处理文本方面的事情 XML 或 JSON 或其他但这
mysql 查询中的 golang 切片，带有 where in 子句

我正在运行以下查询但只获取第一个 id 值 select from table where table id in 1 2 3 4 5 6 7 9 11 13 14 15 17 and table deleted at is null 我
AWS Api Gateway：缺少身份验证令牌

所以我有一个链接到 lambda 函数的 api 网关的自定义域名设置如果我这样做的话我就可以正常工作https api domain com something https api domain com something行为符合预期
Http Auth 不适用于 PHP

我使用 Laravel Lumen Shield 扩展进行 Http 身份验证但是在我的本地计算机上一切都很完美我只在我们的服务器上遇到了问题问题是在我提交正确的登录数据后登录屏幕再次出现我尝试了不同的登录数据不同的浏览器登录
用于列出用户和组的 Python 脚本

我正在尝试编写一个脚本在自己的行上输出每个用户及其组如下所示 user1 group1 user2 group1 user3 group2 user10 group6 etc 我正在为此用 python 编写一个脚本但想知道如何做到这
在Python中解析制表符分隔的文件

我正在尝试在 Python 中解析一个制表符分隔的文件其中与行开头分开的 k 个制表符的数字应该放入第 k 个数组中除了逐行读取并执行简单解决方案将执行的所有明显处理之外是否有内置函数可以执行此操作或者有更好的方法您可以使用the
动态分配对象数组

我有一个包含动态分配数组的类例如 class A int myArray A myArray 0 A int size myArray new int size A Note that as per MikeB s helpful sty
Python：安装 numpy 时出现损坏的工具链错误

我正在使用 Python 2 7 3 并尝试在 Windows 计算机上安装 numpy 包但收到运行时错误提示工具链损坏无法链接到简单的 C 程序我读了解决方案here https stackoverflow com quest
如何查找组中第一个非空值？（使用dataset api进行二次排序）

我正在研究一个代表事件流的数据集例如从网站跟踪事件时触发所有事件都有一个时间戳我们经常遇到的一个用例是尝试查找给定字段的第一个非空值例如类似的东西最能让我们到达那里 val eventsDf spark read json jso
在 C# 中追加到空字符串是如何工作的？

我很惊讶地看到一个字符串被初始化为 null 然后在生产环境中附加一些内容的示例只是闻起来不对劲我确信它会抛出空对象异常但这个大大简化的示例也有效 string sample null sample test sample equal
迁移范围的独特性

我一直在尝试找到一种方法来实现这一目标但我找不到任何尝试即使如此我想也许我的方法是完全错误的也就是说我应该做什么移民如果我希望两个字段的组合是唯一的请注意我不希望它们成为索引而只是数据库字段例如对于下面的迁移我可以单独
如何在vba中向形状添加点或节点？

I am trying to add points or nodes to a shape so instead of having 4 points I can have more 这是我添加形状的代码 Set shap2 w Shape
SQL错误：1054，SQLState：42S22“字段列表”中的未知列错误Java Spring Boot Mysql错误

基本上我正在尝试制作一个简单的促销页面我收到的错误是 SQL 错误 1054 SQLState 42S22 错误是字段列表中的未知列 promotion0 promo type id 这是模型类 package promotions
单击片段中的按钮不起作用

我在片段中有一个按钮对于该按钮我重写了 onClick 方法但它不起作用单击按钮时我也有一个 Taost 和一个日志 public class DataShown extends Fragment implements OnCli
是否有理由使用 Scala 的 StringLike.replaceAllLiterally 而不是 Java 的 String.replace？

Scala 的 StringLike 有该方法replaceAllLiterally literal String replacement String String https github com scala scala blob 56
ListenableFuture 到 scala Future

我正在围绕 java 库编写一个小型 scala 包装器 java 库有一个对象 QueryExecutor 公开了 2 个方法执行查询结果 asyncExecute 查询 ListenableFuture 结果在这种情况下 Lis
Spring Data Mongo 无法找到 Enum 的 PersistentEntity

编辑我发现了一个相关问题here https stackoverflow com questions 28972455 does spring data mongodb support enums 但仅有的两个答案相互矛盾并且没有足够的
Scikit-learn 具有使用“特征”的自定义评分函数

我正在尝试使用一种名为 SERA 平方误差相关区域的新指标作为本文中提到的不平衡回归的自定义评分函数 https link springer com article 10 1007 s10994 020 05900 9 https lin

Scikit-learn 具有使用“特征”的自定义评分函数

Scikit-learn 具有使用“特征”的自定义评分函数 的相关文章

随机推荐

热门标签

Scikit-learn 具有使用“特征”的自定义评分函数的相关文章