什么是归纳偏置

2023-11-17

首先给出百度百科的定义

当学习器去预测其未遇到过的输入的结果时,会做一些假设(Mitchell, 1980)。而学习算法中归纳偏置则是这些假设的集合。

是指在学习算法之初就通过人为偏好,将某一种解决方案优先于其他解。这既可以包含在底层数据分布假设上,也可以包含于模型设计上。它是一种在模型的无限解空间中所引入的合理假设与约束,这类假设、约束能够缩小求解空间并提高所得模型在目标域的泛化性。

在机器学习领域:

最大条件独立性 如果假说能转成贝叶斯模型架构,则试着使用最大化条件独立性。 这是用于朴素贝叶斯分类器(Naive Bayes classifier)的偏置
最小交叉验证误差 当试图在假说中做选择时,挑选那个具有最低交叉验证误差的假说,虽然交叉验证看起来可能无关偏置,但天下没有免费的午餐理论显示交叉验证已是偏置的
最大边界 当要在两个类别间画一道分界线时,试图去最大化边界的宽度。这是用于支持向量机的偏置,它假设不同的类别是由宽界线来区分。
最小描述长度 当构成一个假设时,试图去最小化其假设的描述长度。假设越简单,越可能为真的。见奥卡姆剃刀。
最少特征数 除非有充分的证据显示一个特征是有效用的,否则它应当被删除。这是特征选择算法背后所使用的假设。
最近邻居 假设在特征空间中一小区域内大部分的样本是同属一类。给一个未知类别的样本,猜测它与它最紧接的大部分邻居是同属一类。这是用于最近邻居法的偏置。这个假设是相近的样本应倾向同属于一类别。

在深度学习时代

比如深度神经网络结构就偏好性的认为,层次化处理信息有更好效果;卷积神经网络认为信息具有空间局部性(locality),可以用滑动卷积共享权重方式降低参数空间;反馈神经网络则将时序信息考虑进来强调顺序重要性;图网络则是认为中心节点与邻居节点的相似性会更好引导信息流动。可以说深度学习时代,纷繁的网络结构创新就体现了不同的归纳性偏

那么我们该怎么确定我们模型的归纳偏好呢?有没有什么原则呢?——一个最基本最常用的、自然科学研究中的原则就是“奥卡姆剃刀原则”,即“若有多个假设与观察一致,则选择最简单的那个”。则根据这个原则,我们一般做线性拟合的时候,会更自然的选择线性模型更平滑的那个。这里又存在一个问题,就是我们怎么确定我们的模型怎么样算最简单呢?怎么样算最好呢?这需要根据我们的具体任务来设定。

参考资料:

  1. https://baike.baidu.com/item/%E5%BD%92%E7%BA%B3%E5%81%8F%E7%BD%AE/10207811?fr=aladdin
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

什么是归纳偏置 的相关文章

随机推荐

  • https网站打不开怎么办?解决方法看这里

    https网站 即安装了SSL证书的网站 打不开的情况也会经常出现 不论是什么网站 只要长时间打不开就会影响到用户体验度和网站本身的流量情况 对于网站的优化也是非常不利的 如果出现了这种情况该怎么解决呢 https网站打不开可能是由多种原因
  • js 保留6位有效数字,直接舍去,不四舍五入

    function sixNum num return Math floor num 1000000 1000000 sixNum 12 123456789 12 123456
  • PCB阻焊层太近了会不会有问题?

    绘制pcb双层板 进行DCR检查 发现如下报错 于是回到pcb的界面去查看 原来是我的组焊层靠的很近 小于规则的6mil 这个报错有必要修改嘛 规则的设置如下 最小组焊层裂口是6mil 但是封装就是官网上下载下来的 是芯片封装引脚的问题 过
  • AttemptID:attempt_1557891872692_0001_r_000000_0 Timed out after 3600 secs

    背景 做kylin 的时候 执行了 hive的命令 是hive数据的重新分布 结果在reduce的时候阻塞了 查看原因为 AttemptID attempt 1557891872692 0001 r 000000 0 Timed out a
  • 公有云、私有云、混合云

    云的部署方式有很多种 如公有云 私有云 混合云等 部署在云上的SaaS主要分为公有云SaaS和私有云SaaS 行业主流的SaaS部署模式是公有云SaaS 私有云部署模式 适用于某些有特殊要求的行业和企业业务 要求有较大的私有化和定制化空间的
  • python case when用法_SQL之CASE WHEN用法详解

    简单CASE WHEN函数 CASE SCORE WHEN A THEN 优 ELSE 不及格 END CASE SCORE WHEN B THEN 良 ELSE 不及格 END CASE SCORE WHEN C THEN 中 ELSE
  • angular蚂蚁_angular4 调用api

    angular2 问题请教 angular2 通过http服务进行对后端api的远程调用 我简单的尝试了一下 发现了几个问题 记录一下 以方便查找问题 angular2 http服务的跨域问题 跨域本身就是一个很复杂的问题 angular2
  • 剑指 Offer 27. 二叉树的镜像 -- 递归

    0 题目描述 leetcode原题链接 剑指 Offer 27 二叉树的镜像 1 递归算法 根据二叉树镜像的定义 考虑递归遍历 d f s mathrm dfs dfs 二叉树 交换每个节点的左 右子节点 即可生成 二叉树的镜像 递归解析
  • Qt入门-文本框类QLineEdit和QTextEdit

    QLineEdit是单行文本框 QTextEdit是多行文本框 1 单行文本框QLineEdit 常用的方法和属性 a 获取和设置文本对齐方式 Qt Alignment alignment const void setAlignment Q
  • MT6739的Android9.0 Camera kernel 驱动

    文章目录 Kernel 层驱动的实现 Camera 开机流程 Camera 驱动的文件结构 Camera 驱动初始化流程 Camera 入口函数 imgsensor init 注册的平台驱动结构体 gimgsensor platform d
  • Linux文本处理工具和正则表达式

    Linux文本处理工具和正则表达式 一 查看 截取和修改文本的工具 1 查看文本的工具 cat 最常用的文件查看命令 当不指明文件或者文件名为一杠 时 读取标准输入 cat OPTION FILE A 显示所有控制符 tab键 I 行结束符
  • 用户变量与系统变量的区别

    用户变量仅对当前用户生效 若有其他用户登录 对其无效 系统变量对所有用户生效 其中 引用已经设置的其他环境变量 使用 变量名 如 MyJAVA PATH C JAVA TheBin MyJAVA PATH Bin 那么 TheBin实际为
  • 电脑调分辨率黑屏了怎么办_电脑屏幕分辨率调节失败的解决方法

    在之前 我们讲到了电脑屏幕分辨率的问题 更加自己电脑的尺寸 来调节出最合适的屏幕分辨率 但有些网友在反映到电脑屏幕分辩率调了却没有反映 遇到这样的情况 我们该如何解决 电脑屏幕分辨率 调节分辨率的三种方法 方法一 右键单击桌面空白处 选择
  • 在linux中如何创建进程,如何在Linux中创建进程?

    加载到内存中并执行的程序称为进程 简单来说 一个进程就是一个正在执行的程序 让我们检查一下如何在Linux中创建进程 可以通过fork 系统调用创建一个新进程 新进程包含原始进程的地址空间的副本 fork 从现有流程创建新流程 现有进程称为
  • Springmvc3+Spring3+Freemarker整合异常

    Springmvc3 Spring3 Freemarker整合异常 提示缺少ui等类 主要异常信息如下 org springframework beans factory BeanCreationException Error creati
  • INFO zookeeper.ClientCnxn: Opening socket connection to server***/192.168.80.151:2181. Will not

    at org apache zookeeper ClientCnxnSocketNIO doTransport ClientCnxnSocketNIO java 361 at org apache zookeeper ClientCnxn
  • win10查看端口号是否被占用及解除占用的常用命令

    netstat ano 查看所有端口号占用情况 netstat ano findstr XXX 查看端口号为XXX的占用情况 如下 得到进程号为12160的进程正在占用本地的9090端口号 如果只是想释放9090端口到这一步就可以了 我们可
  • JDBC操作

    在IDEA中用java中驱动数据库 并使用Java语言操作数据库 10 1 数据库驱动 驱动 比如 声卡 显卡 数据库 我们的程序会通过数据库驱动和数据库打交道 10 2 JDBC sun公司为了简化开发人员的 对数据库的统一 操作 提供了
  • 我零基础,非计算机专业,想快速学习一门编程语言可行吗?

    都说要真正掌握一门编程语言 是件很困难的事情 尤其对于初学者而言 这话说的的确有几分道理 但其实学习编程语言的难度也并没有大多数人想的那么大 因为每个人学习会因为多种因素而有所不同 例如个人学习能力 学习背景 学习时间 编程语言本身等等 首
  • 什么是归纳偏置

    首先给出百度百科的定义 当学习器去预测其未遇到过的输入的结果时 会做一些假设 Mitchell 1980 而学习算法中归纳偏置则是这些假设的集合 是指在学习算法之初就通过人为偏好 将某一种解决方案优先于其他解 这既可以包含在底层数据分布假设