半监督学习

2023-05-16

半监督学习:

       在训练阶段结合了大量未标记的数据和少量标签数据。与使用所有标签数据的模型相比,使用训练集的训练模型在训练时更为准确,而且训练成本更低。如何综合利用已标签例子和未标签例子,是半监督学习需要解决的问题。


半监督学习几种方法:

1.Self-training algorithm(自训练算法)

这个是最早提出的一种研究半监督学习的算法,也是一种最简单的半监督学习算法.

2.Multi-view algorithm(多视角算法)

一般多用于可以进行自然特征分裂的数据集中.考虑特殊情况(每个数据点表征两个特征):每一个数据点看成是两个特征的集合,然后利用协同训练(Co-training algorithm)进行处理.协同训练(co-training)算法,此类算法隐含地利用了聚类假设或流形假设,它们使用两个或多个学习器,在学习过程中,这些学习器挑选若干个置信度高的未标记示例进行相互标记,从而使得模型得以更新。

3.Generative Models(生成模型)

以生成式模型为分类器,将未标记示例属于每个类别的概率视为一组缺失参数,然后采用EM算法来进行标记估计和模型参数估计,此类算法可以看成是在少量有标记示例周围进行聚类,是早期直接采用聚类假设的做法。EM算法的贪心本质使其容易陷入局部极值,因此算法对初始值的选择具有很强的依赖性.常用的解决方法是采用多组初值进行重复运算,并从中选择最好的一组解,或者通过复杂的优化算法(如分裂合并EM算法)获取参数的优化解.这些做法尽管降低了对初始值选择的敏感性,但却引入了过多的运算负担。

具体算法这里不说,我这里只说一下生成模型(Generative Models)和判别模型(Discriminative Models)的区别.

对于分类和聚类问题而言.①判别模型只关心类的决定边界在哪里;生成模型关心的是类本身而非决定边界.②判别模型只能判定数据点属于哪个类别,无法将过程描述出来;生成模型可以将过程描述.③生成模型可以得到判别模型;判别模型推不出生成模型.④判别模型估计的是条件概率分布(Conditional distribution);生成模型估计的是联合概率分布(Joint probability distribution).

常见的判别模型有:Linear discriminate analysis, Support vector machines, Boosting, Conditional random fields, Logistic regression.

常见的生成模型有:Gaussian distribution, Gaussian mixture model, Multinomial distribution, Hidden Markov model, Na?ve Bayes, Latent Dirichlet allocation.

4.Transductive SVM(转导SVM)

强调一点,根据Vapnik的Statistical Learning Theory中提出统计学习中考虑两种不同类型的推理:归纳推理(Inductive inference)和转导推理(Transductive inference).转导推理的目的是估计某一未知预测函数在给定兴趣点上的值(而不是在该函数的全部定义域上的值).关键是,通过求解要求较低的问题,可以得到更精确的解.

传统的推理方法是归纳-演绎方法,人们首先根据用已有的信息定义一个一般规则,然后用这个规则来推断所需要的答案.也就是说,首先从特殊到一般,然后从一般到特殊.但是在转导模式中,我们进行直接的从特殊到特殊的推理,避免了推理中的不适定部分.

5.Graph-Based Algorithms(基于图的算法)

是基于图正则化框架的半监督学习算法,此类算法直接或间接地利用了流形假设,它们通常先根据训练例及某种相似度度量建立一个图,图中结点对应了(有标记或未标记)示例,边为示例间的相似度,然后,定义所需优化的目标函数并使用决策函数在图上的光滑性作为正则化项来求取最优模型参数


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

半监督学习 的相关文章

  • 翔仪 垂直起降固定翼 操作流程

    翔仪 垂直起降固定翼 操作流程 垂直起降固定翼 操作流程 01 地面站采用的是翔仪飞控软件 02 奥维互动定位平台 上规划飞行区域 长方形 为佳 覆盖作业范围200米以上 xff08 防止漏拍发生 xff09 导出KML格式 地图切换里面
  • 一、初识FreeRTOS之FreeRTOS简介

    目录 一 什么是FreeRTOS xff1f 二 为什么选择FreeRTOS xff1f 三 FreeRTOS的特点 四 FreeRTOS资料与源码下载 五 FreeRTOS源码文件介绍 一 什么是FreeRTOS xff1f Free即免
  • Hbase使用scan(get)过滤器查询封装(java)

    在hbase上使用过滤器查询 xff1a 指定参数 xff0c 指定返回字段 xff0c 指定对象 xff0c 指定单 xff08 多 xff09 版本 Collection lt E gt 详情见以下 xff1a Map lt K V g
  • 单片机12864带字库汇编使用教程

    一丶引脚说明 Lcd12864 xff08 带字库版本 xff0c ST7920为主芯片驱动 xff09 xff08 正面 xff09 xff08 反面 xff09 由于是带字库版本 xff0c 与不带字库版本有出入 xff0c 其部分引脚
  • Jetson Xavier NX学习笔记(三)系统烧录+开机教程+YOLOv7环境搭建+错误总结(详细版)

    Jetson Xavier NX 系统烧录 43 开机教程 43 YOLOv7环境搭建 43 错误总结 xff08 详细版 xff09 文章目录 Jetson Xavier NX 系统烧录 43 开机教程 43 YOLOv7环境搭建 43
  • UDP网络编程

    一 UDP的概念 1 1 UDP 面向无连接 xff08 无连接 xff0c 是因为UDP里有了对方的地址 xff0c 直接发就好 xff09 特点 xff1a 1 邮件系统服务模式的抽象 2 每个分组都携带完整的目的地址 3 不能保证分组
  • 全网最详细SUMO仿真软件教程——入门篇

    目录 SUMO下载前提知识使用netedit创建路网需求生成SUMO GUI可视化 SUMO下载 SUMO官网 SUMO下载链接 配置SUMO HOME系统变量 xff0c 后续引入包需要 前提知识 sumo仿真器跑起来需要有三个文件 xf
  • 遥感图像场景分类常用数据集

    1 UC Merced Land Use Data Set 图像像素大小为256 256 xff0c 总包含21类场景图像 xff0c 每一类有100张 xff0c 共2100张 下载地址 xff1a http weegee vision
  • 用vs code连接虚拟机(夜神模拟器)

    手机模拟器设置 打开夜神模拟器的bin目录 xff08 右键夜神模拟器 xff0c 打开文件所在位置 xff09 xff0c 如果是windows10 xff0c 就在文件夹下输入 nox adb exe connect 127 0 0 1
  • 数字加减---多线程案例

    package wzr thread test1 经典的多线程开发操作 xff0c 程序中需要考虑的核心是 xff1a 加一个 xff0c 减一个 xff0c 只在0 1之间 public class Test public static
  • mysql下载安装,详细流程

    下载 https dev mysql com 在水平导航栏点击download 点击MySQL Community GPL Downloads 进入后点击MySQL Installer for Windows 下载安装包是32bit的 xf
  • spring5——2.webflux,响应式编程,执行流程及核心API

    什么是响应式编程 在计算机中 xff0c 响应式编程或反应式编程 xff08 英语 xff1a Reactive programming xff09 是一种面向数据流和变化传播的编程范式 这意味着可以在编程语言中很方便地表达静态或动态的数据
  • springboot——测试时bean无法注入的问题

    问题描述 xff1a 当我在test测试类中测试无法注入 64 Dao类时 xff0c 我去main java下测试 xff0c 是否可以使用这个Dao类 xff0c 结果成功调用 于是我定位到这个问题就是测试时无法注入 猜测可能是 64
  • springboot——跨域(nginx,cors)

    跨域访问 xff0c 是指从一个域名的网页去请求另一个域名的资源 比如从www baidu com 页面去请求 www google com 的资源 但是一般情况下不能这么做跨域访问 xff0c 因为有浏览器的 同源策略 存在 xff0c
  • Python 三大神器:pip,virtualenv(virtualenvwrapper),fabric

    pip用来管理包 文档 xff1a https pip pypa io en latest installing html 介绍 xff1a pip 是 Python 包管理工具 xff0c 该工具提供了对Python 包的查找 下载 安装
  • git命令 本地

    目录 基础命令提交分支合并合并 创造线性的提交历史 高级命令分离HEAD相对引用撤销变更 自由移动提交记录 96 git rebase i 96 的使用说明 提交的技巧里程碑的使用 基础命令 提交 提交git commit 提交 包含信息g
  • git命令大全

    文章目录 仓库配置增加 删除文件代码提交分支标签查看信息远程同步撤销其他 仓库 在当前目录新建一个Git代码库 git init 新建一个目录 xff0c 将其初始化为Git代码库 git init project name 下载一个项目和
  • git命令 远程

    文章目录 pull amp push Git仓库克隆远程仓库 96 git clone 96 远程分支从远程仓库获取数据 96 git fetch 96 从远程仓库获取数据 96 git pull 96 上传数据到远程仓库 96 git p
  • 遥感图像场景分类方法总结

    遥感图像场景分类一般假定相同类别的场景应该共享相似的特征信息 xff0c 基于此 xff0c 遥感图像场景分类方法可以分为三大类 xff1a 基于底层视觉特征 xff0c 基于中层视觉表达 xff0c 基于高层视觉信息 底层视觉特征 xff
  • 香橙派如何扩容升级内存?超简单迁移系统到新的SD卡,树莓派也适用

    香橙派扩容迁移系统到新的SD卡 前言迁移系统新系统测试 本文博客地址 xff1a 香橙派迁移系统到新的 SD 卡 前言 刚开始用香橙派的时候 xff0c 用的是一个 16G 的 SD 卡 xff0c 但随着系统上装的软件越来越多 xff0c

随机推荐

  • 博途(TIA)软件安装教程;博途软件安装常见问题解决办法

    博途软件安装教程 xff0c 这里有两位前辈写的非常不错 xff0c 但在具体细节不够充分 xff0c 对于第一次接触此类软件的小伙伴来说不太友好 xff0c 于是在此进行补充 xff0c 并对安装中常见的问题进行一个汇总 建议 安装时主要
  • zabbix 监控源代码安装

    实验环境 192 168 0 108 server端 192 168 0 109 agent端 步骤一 配置两台虚拟机确保ip能连网 配置l两台主机名 vim etc hostname 配置两台主机hosts文件 cat etc hosts
  • exec函数与fork函数的配合使用

    1 实现功能 当父进程检测到输入为1的时候 xff0c 创建子进程把配置文件的字段值 LENG 61 1修改为LENG 61 6 修改掉 代码如下 xff1a 将该修改配置文件通过gcc o 编译生成可执行文件changeData xff0
  • java中的Arrays.sort()的几种用法

    目录 1 第一种2 第二种方法3 第三种方法4 额外补充 for each的语法结构 直奔主题 Arrays sort 有三种用法 1 第一种 Arrays sort int a 查看源码 span class token keyword
  • Maven:导出war包时报错Failed to execute goal org.apache.maven.plugins:maven-war-plugin解决方法(全)

    出现如下问题的时候 是因为在target文件夹下没有生成war文件 Failed to execute goal org apache maven plugins maven war plugin 2 2 war default war o
  • java框架 零基础从入门到精通的学习路线 附开源项目面经等(超全)

    目录 前言1 学习路线2 学习方法 前言 这篇文章主要总结我之前所学过的框架以及学习路线 从实打实的零基础到框架再到项目 之后实习工作 也在这篇博客中记录我的学习笔记 以及在笔记中遇到的配置安装 代码bug等错误 都从零开始摸索并且记录了下
  • Java抽象类和接口的详细区别(全)

    目录 前言1 抽象类2 接口3 两者结合4 面试总结 前言 这两者经常在笔试以及面试中经常问及 xff0c 甚至在项目实战中还在纠结用哪一种类型 今天就此问题详细剖析一下 以往我的文章中也有稍微提及 xff1a java框架零基础从入门到精
  • Python 通过ImageDraw.rectangle 画矩形框

    目录 1 函数讲解2 示例代码3 补充cv2 rectangle 1 函数讲解 源代码如下 xff1a ImageDraw rectangle xy fill 61 None outline 61 None width 61 1 主要的参数
  • 基于迁移深度学习的遥感图像场景分类

    前述 根据语义特征对遥感图像场景进行分类是一项具有挑战性的任务 因为遥感图像场景的类内变化较大 xff0c 而类间变化有时却较小 不同的物体会以不同的尺度和方向出现在同一类场景中 xff0c 而同样的物体也可能出现在不同的场景里 理论上 x
  • reStructuredText文档图片表格等自动编号以及名称修改

    number figures 61 True numfig 61 True numfig secnum depth 61 1 numfig format 61 39 figure 39 39 图 s 39 39 code block 39
  • Robocup 2D仿真足球机器人环境搭建(Ubuntu 16.04)

    现在很多高校的学生都在搞RoboCup2D仿真足球机器人 xff0c 而平台的搭建便是一大问题 本人也在搭建环境中遇到各种奇奇怪怪的问题 xff0c 有些找了许多网页 xff0c 下面是我对环境搭建 中遇到的问题以及解决方法的总结 希望能帮
  • Robocup 2D仿真足球机器人环境搭建快速搭建

    虽然之前已经写了Robocup 2D仿真足球机器人环境搭建 xff0c 但是后面我找到了更快搭建环境的方法 而且现在很多团队都是在agent底层代码的基础上编写的 之前的方法配置的环境运行agent球队代码会出现错误 通过找资料得知是有些软
  • Robocup 2D新手导读(入门总结)

    目前 xff0c 我们团队接触Robocup 2D比赛也有好几个月了 xff0c 不得不说 这个比赛也有一定难度 尤其是对于第一次接触这个比赛的我们来 说 下面是我的一些总结 xff0c 希望能够帮助你们 1 Robocup 2D的比赛基本
  • Robocup 2D比赛代码导读(agent底层代码指导)

    相信刚开始接触Robocup 2D比赛的萌新 xff0c 都清楚agent的代码看起来是很痛苦的 xff0c 而且不知道从何看起 我个人观点看代码先看bhv和role这部分的代码 bhv行为动作的类的代码涉及到球员的进攻 跑位 防守 铲球等
  • python爬虫接单-资料总结

    相信看到我这篇文章的朋友们 xff0c 都是奔着赚钱来的 当初我也是冲着爬虫接单 可以赚钱 xff0c 一下就报了个将近3000元的爬虫班 python爬虫确实可以接单赚钱 后来学会了之后就迫不及待地加入了接单行列 也确实赚了一些 希望这篇
  • 爬虫Scrapy框架的介绍与使用

    Scrapy Scrapy介绍 爬取网站数据 xff0c 提取结构数据而编写的爬虫应用框架 Scrapy工作流程图 Scrapy命令 span class token number 1 span 创建Scrapy项目 scrapy star
  • 太难为我了,为了这份P7岗offer,我承受了7轮面试

    前言 今年的大环境非常差 xff0c 互联网企业裁员的现象比往年更严重了 xff0c 可今年刚好是我的第一个 五年计划 截止的时间点 xff0c 说什么也不能够耽搁了 xff0c 所以早早准备的跳槽也在疫情好转之后开始进行了 但是 xff0
  • 云计算与大数据概论第五周

    对于 大数据 xff08 Big data xff09 研究机构Gartner给出了这样的定义 大数据 是需要新处理模式才能具有更强的决策力 洞察发现力和流程优化能力来适应海量 高增长率和多样化的信息资产 麦肯锡全球研究所给出的定义是 xf
  • 【hadoop_读写流程】

    14 hadoop 补充 xff1a 解决 linux 网卡丢失问题 xff1a service NetworkManager stop chkconfig NetworkManager off 重启网络 systemctl restart
  • 半监督学习

    半监督学习 xff1a 在训练阶段结合了大量未标记的数据和少量标签数据 与使用所有标签数据的模型相比 xff0c 使用训练集的训练模型在训练时更为准确 xff0c 而且训练成本更低 如何综合利用已标签例子和未标签例子 xff0c 是半监督学