lr推荐模型 特征重要性分析

2024-01-04

在分析lr模型特征重要性之前,需要先明白lr模型是怎么回事儿。

lr模型公式是sigmoid(w1*x1+w2*x2+...+wn*xn),其中w1,w2,...,wn就是模型参数,x1,x2,...,xn是输入的特征值。

对于lr模型来说,特征可以分为两个粒度,一个是特征域,一个是特征值。举例来说,用lr模型判断一个人爱吃什么,输入两个特征,年龄,性别;年龄,性别就是特征域粒度,男,女,10岁,20岁就是特征值粒度。真正输入模型的是特征值粒度,会把特征one-hot化,男可以表征为[1,0],女可以表征为[0,1],年龄取值为[0,100),hash_bucket化为5个桶,[0,20),[20,40),[40,60),[60,80),[80,100),那么10岁表征为[1,0,0,0,0],20岁表征为[0,1,0,0,0]。那么假设此时输入模型的一条样本数据为男性10岁,那么输入模型的w1,w1,...,wn就为1,0,1,0,0,0,0。

分析特征重要性也可以从两个粒度去考虑。然后主要考虑的都是均值,绝对值均值,方差这几个值。然后还可以分为正样本,分为负样本去求这三个值来分析。

从特征值均值来看的话:

1.交叉特征管用,单独特征相对没那么管用。

2.单独特征中应当只有item的单独特征管用,代表大家都喜欢或者都不喜欢该物品。

从特征域来看:

1.均值参考性不那么高,绝对值均值高一些,但也不那么高。因为我们的常规思维都认为不喜欢和喜欢的均值应该是0,但实际情况可能不是,这跟我们参数的初始化,数据分布等因素密切相关,这个值可能是正值,也可能是负值。

2.方差参考性较高,方差较大,代表这个特征域对模型的影响比较大,代表这个特征域重要性比较高。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

lr推荐模型 特征重要性分析 的相关文章

随机推荐

  • wireshark抓包工具的使用

    专注于分享软件测试干货内容 欢迎点赞 收藏 留言 如有错误敬请指正 交流讨论 欢迎加入我们一起学习 资源分享 耗时200 小时精选的 软件测试 资料包 软件测试学习教程推荐 火遍全网的 软件测试 教程 前言 wireshark是非常流行的网
  • win8如何录制屏幕?实用教程分享

    录制屏幕已成为人们日常学习和工作中经常需要面对的问题 随着windows 8系统的普及 越来越多用户需要了解如何在这个平台上录制屏幕 可是win8如何录制屏幕呢 接下来 本文将介绍三种在win8系统上录制屏幕的方法 我们将对每种方法的操作步
  • zzz888

    8
  • 实实在在万事达!实在智能助力山东万事达集团加速数智化转型

    近日 杭州实在智能科技有限公司 以下简称 实在智能 与山东建筑钢市场 领头羊 山东万事达控股有限公司 以下简称 万事达集团 召开 RPA 机器人流程自动化 项目启动会 实在智能携手万事达集团 联合共建财务RPA一体化研发管理项目 以下简称
  • Java中的IO与NIO篇----第二篇

    系列文章目录 文章目录 系列文章目录 前言 一 阻塞 IO 模型 二 非阻塞 IO 模型 三 多路复用 IO 模型 前言 前些天发现了一个巨牛的人工智能学习网站 通俗易懂 风趣幽默 忍不住分享一下给大家 点击跳转到网站 这篇文章男女通用 看
  • iPhone强制恢复出厂设置,记好这2种方法!

    随着智能手机的广泛普及 如今有越来越多的人开始使用iPhone手机 但是 在使用的过程中 我们可能会遇到各种问题 比如程序崩溃 软件故障 系统运行缓慢等等 此时 恢复出厂设置成为了一种解决问题的有效方法 本文将为大家提供两种iphone强制
  • 人工智能未来发展前景怎么样?

    人工智能的未来发展前景怎么样 人工智能的未来发展前景非常广阔 有以下几个方面的发展趋势和前景 1 人工智能的未来发展前景 应用领域扩展 人工智能将在各个领域得到广泛应用 包括医疗保健 金融 交通 制造业 农业等 人工智能技术将帮助提高效率
  • 各位大佬看看这是不是macos的一个bug啊

    请各位大佬看看是不是一个bug啊 打开mac自带的命令行 先输入man less 显示没问题 再输入man more 发现出现的是less的说明 这里出了问题 第一张图是man less 第二张图是man more 我的系统环境如下
  • 易点易动固定资产管理系统:集成飞书,助力企业全生命周期固定资产管理

    易点易动固定资产管理系统 集成飞书 助力企业全生命周期固定资产管理 在现代商业环境中 固定资产管理对企业的运营和发展至关重要 为了提高管理效率和降低成本 我们引入了易点易动固定资产管理系统 该系统集成了飞书 为企业提供全生命周期的固定资产管
  • 美军杀伤网概念研究及对我防空作战装备体系的启示

    源自 现代防御技术 作者 王玉茜 曹亚杰 佘晓琼 廖咏一 人工智能技术与咨询 发布 摘 要 DARPA寻求从杀伤链转向杀伤网 意图利用信息网络构建高度分散的杀伤网 形成难以预测的杀伤链 美空军在试验旗体系下开展 橙旗 翠旗 和 黑旗 试验
  • Jenkins集成部署java项目

    文章目录 Jenkins简介 安装 Jenkins简介 Jenkins能实时监控集成中存在的错误 提供详细的日志文件和提醒功能 还能用图表的形式形象的展示项目构建的趋势和稳定性 官网 安装 在官网下载windows版本的Jenkins 但是
  • 技术人的年终总结分享

    印象深刻的实战经历 系统学习新技术的心得体会 精心整理的技术文档 想要安利给所有人的开发工具 对技术行业的深度思考 职业规划与心灵成长 新年Flag 在项目中取得的辉煌成绩 在应用开发中遇到的问题与解决方案 职场经历与升职感悟 编程语言的新
  • 电锯切割狂

    欢迎来到程序小院 电锯切割狂 玩法 把木块切成等分的碎片 每关都会有切割次数 木块数 切割越均匀分数越搞 有简单 正常 困难 专家版 快去解锁不同版本进行切割吧 开始游戏 https www ormcc com play gameStart
  • String.join()方法

    String join 是 Java 8 中添加的一个静态方法 它可以将一个字符串数组或者一个迭代器中的元素连接成一个字符串 它的语法如下 public static String join CharSequence delimiter C
  • 老生常谈问题之——进程和线程的关系和区别

    最初 我们在学习进程和线程的时候都是和操作系统的知识相关的 但是我们前端菜鸟除了面试的时候很少用到他们 所以我们还是从前端常见的场景来详细的学习进程和线程吧 在前端提到关于进程和线程的概念主要有以下几个场景 1 js 是单线程的编程语言 也
  • JavaScript基础教程|自定义 Error,扩展 Error,深入继承,包装异常,继承 SyntaxError

    函数组件没有自己转台只负责数据展示 类组件有自己的状态 负责更新ui 27state和setState的方法 state的值是对象 表示一个组件里面可以有多个的数据 组件内部的私有数据 只能在组件内部使用 简化语法初始化state stat
  • 在 IBM Cloud 上使用 Spectrum LSF 管理数据

    在 IBM Cloud 上使用 Spectrum LSF 管理数据 在云环境中处理 HPC 工作负载时 要解决的一个关键挑战是如何以最佳方式管理运行工作负载所需的数据 以及可能需要分析以进行进一步处理和决策的输出 通过使用部署在 IBM C
  • 外包干了2个月,技术退步明显了...

    先说一下自己的情况 大专生 19年通过校招进入湖南某软件公司 干了接近4年的功能测试 今年8月份 感觉自己不能够在这样下去了 长时间呆在一个舒适的环境会让一个人堕落 而我已经在一个企业干了四年的功能测试 已经让我变得不思进取 谈了2年的女朋
  • 2023年总结

    2023年总结 兄弟们好 我写这篇文章的时候是2024年的1月4号了 从2022年重新整理并写自己博客的两年里面 自己也学到了很多 我觉得有必要每年都总结一下自己的收货和不足 因此创建了这个专栏 该专栏每年会更新一篇我对上一年度的总结和感悟
  • lr推荐模型 特征重要性分析

    在分析lr模型特征重要性之前 需要先明白lr模型是怎么回事儿 lr模型公式是sigmoid w1 x1 w2 x2 wn xn 其中w1 w2 wn就是模型参数 x1 x2 xn是输入的特征值 对于lr模型来说 特征可以分为两个粒度 一个是