机器学习——深度学习(Deep Learning)

2023-10-29

Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得。


Key Words:有监督学习与无监督学习,分类、回归,密度估计、聚类,深度学习,Sparse DBN,


1. 有监督学习和无监督学习


给定一组数据(input,target)为Z=(X,Y)。

有监督学习:最常见的是regression & classification

regression:Y是实数vector。回归问题,就是拟合(X,Y)的一条曲线,使得下式cost function L最小。


classification:Y是一个finite number,可以看做类标号。分类问题需要首先给定有label的数据训练分类器,故属于有监督学习过程。分类问题中,cost function L(X,Y)是X属于类Y的概率的负对数。

,其中fi(X)=P(Y=i | X);


无监督学习:无监督学习的目的是学习一个function f,使它可以描述给定数据的位置分布P(Z)。 包括两种:density estimation & clustering.

density estimation就是密度估计,估计该数据在任意位置的分布密度

clustering就是聚类,将Z聚集几类(如K-Means),或者给出一个样本属于每一类的概率。由于不需要事先根据训练数据去train聚类器,故属于无监督学习。

PCA和很多deep learning算法都属于无监督学习。



2. 深度学习Deep Learning介绍

   Depth 概念:depth: the length of the longest path from an input to an output.

   Deep Architecture 的三个特点:深度不足会出现问题;人脑具有一个深度结构(每深入一层进行一次abstraction,由lower-layer的features描述而成的feature构成,就是上篇中提到的feature hierarchy问题,而且该hierarchy是一个稀疏矩阵);认知过程逐层进行,逐步抽象

   3篇文章介绍Deep Belief Networks,作为DBN的breakthrough


3.Deep Learning Algorithm 的核心思想:

    把learning hierarchy 看做一个network,则

    ①无监督学习用于每一层网络的pre-train;

    ②每次用无监督学习只训练一层,将其训练结果作为其higher一层的输入;

    ③用监督学习去调整所有层

这里不负责任地理解下,举个例子在Autoencoder中,无监督学习学的是feature,有监督学习用在fine-tuning. 比如每一个neural network 学出的hidden layer就是feature,作为下一次神经网络无监督学习的input……这样一次次就学出了一个deep的网络,每一层都是上一次学习的hidden layer。再用softmax classifier去fine-tuning这个deep network的系数。



这三个点是Deep Learning Algorithm的精髓,我在上一篇文章中也有讲到,其中第三部分:Learning Features Hierachy & Sparse DBN就讲了如何运用Sparse DBN进行feature学习。


4. Deep Learning 经典阅读材料:

阐述Deep learning主要思想的三篇文章:
06年后,大批deep learning文章涌现,感兴趣的可以看下大牛Yoshua Bengio的综述Learning deep architectures for {AI},不过本文很长,很长……

5. Deep Learning工具—— Theano

     Theano是deep learning的Python库,要求首先熟悉Python语言和numpy,建议读者先看Theano basic tutorial,然后按照Getting Started 下载相关数据并用gradient descent的方法进行学习。

学习了Theano的基本方法后,可以练习写以下几个算法:

有监督学习:

  1. Logistic Regression - using Theano for something simple
  2. Multilayer perceptron - introduction to layers
  3. Deep Convolutional Network - a simplified version of LeNet5


无监督学习:




最后呢,推荐给大家基本ML的书籍:



关于Machine Learning更多的学习资料将继续更新,敬请关注本博客和新浪微博Sophia_qing


References:

1. Brief Introduction to ML for AI

2.Deep Learning Tutorial

3.A tutorial on deep learning - Video


转自:http://blog.csdn.net/abcjennifer/article/details/7826917

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习——深度学习(Deep Learning) 的相关文章

随机推荐

  • 超级实用的shell脚本100例(一)

    超级实用的shell脚本100例 一 1 编写 hello world 脚本 bin bash echo hello world 2 通过位置变量创建 Linux 系统账户及密码 bin bash 1 是执行脚本的第一个参数 2 是执行脚本
  • Android 简介

    国内移动互联网发展史 播种 2000年9月19日 中国移动和国内百家ICP首次坐在了一起 日本取经 2001年11月10日 中国移动通信的 移动梦网 正式开通 萌芽 萌芽时期 先后冒出了搜索 音乐 阅读 游戏等领域的多种无线企业 不过 整个
  • Visual Studio修改代码后运行程序不更新问题解决方案

    一 在生成中重新生成 但是此方法需要每次修改后重新点击 二 配置生成管理器 路径 生成 配置管理器 勾选 生成 刚学visual studio 2022 3天 自己摸索出来的方案
  • 福布斯发布区块链50强 这5家中国公司上榜

    福布斯发布区块链50强 这5家中国公司上榜 附榜单 福布斯今日 2月20日 在官网发布第二届 区块链50强 Blockchain 50 榜单 据福布斯评选标准 入选 Blockchain 50 榜单的公司必须每年营收不少于10亿美元或估值超
  • 欧拉角 图解释

    定义 先引wiki上的定义 欧拉角 由三个角度组成 在特定坐标系下用于描述刚体的orientation 简单来说 就是绕一个三维坐标系统下的三个基轴旋转三个角度 可以用来表示物体通过各种绕七绕八的转 最终转到的那种形态 orientatio
  • wifi类物联产品配网之web

    文章目录 wifi类物联产品配网之web web配网介绍 web配网实现 wifi类物联产品配网之web 上接wifi类物联产品配网前言 web配网介绍 web主要连接设备建立的wifi 热点后 以网页的形式 让用户输入wifi ssid和
  • Mybatis

    1 简介 1 1 持久化 数据持久化 持久化就是将程序的数据在持久状态和瞬时状态转换的过程 内存 断电即失 数据库 Jdbc io文件持久化 为什么需要持久化 有些对象 不能让他丢掉 内存太贵了 1 2 持久层 Dao层 Service层
  • LLM-大模型训练-步骤(二)-预训练/Pre-Training(1):全参数预训练(Full-Param Pre-Training)【对LLaMA等模型进一步全量参数预训练】【中文无监督学习语料】

    GitHub项目 KnowLM 一 全参数预训练 Full Param Pre training 使用中文语料对LLaMA等模型进行进一步全量预训练 在尽可能保留原来的英文和代码能力的前提下 进一步提高模型对于中文理解能力和丰富模型的知识储
  • moveToThread的最简单用法(依葫芦画瓢即可)(使得线程也更偏向于信号槽的使用方法)

    file main cpp Copyright C 2010 dbzhang800 All rights reserved include
  • 蓝桥杯2015年第六届真题-奇怪的数列

    题目 题目链接 题解 实现题 太简单了 就是遍历字符串 拼接一下就可以了 代码 include
  • Jvm参数优化

    Jvm参数优化 背景 1 系统上线规划容量 分析 2 垃圾回收器选择 吞吐量和响应时间 垃圾回收器选择 3 规划各个分区的比例大小 4 对象年龄对少移动到老年代合适 5 对象多大放到老年代 6 垃圾回收器CMS老年代参数优化 7 配置OOM
  • 更换硬盘_「心得」群晖NAS升级硬盘——硬盘篇:硬盘的更换与RAID设置思路

    经过大概一周左右的时间 终于断断续续的把我的群晖NAS的硬盘升级完了 把原来3TB 2的RAID 1 变成3TB 3的RAID 5 同时把额外单独的3TB冷备份硬盘 也升级成了6TB 为什么花费了一周左右的时间 当中包括前期的文件校验 新硬
  • C#中的多线程 - 并行编程

    转载至 https blog gkarch com threading part5 html 1并行编程Permalink 在这一部分 我们讨论 Framework 4 0 加入的多线程 API 它们可以充分利用多核处理器 并行 LINQ
  • 宝塔部署nodejs接口项目及mysql数据库教程

    上传项目文件至宝塔目录文件夹 我这里上传的server文件 在网站菜单添加node项目 填写node项目信息 项目端口需要填写项目真实的启动端口 需要绑定域名的可以添加域名管理 添加域名后需要开启外网映射 新建mysql数据库 导入数据库数
  • Qt窗体背景绘图和图片显示篇

    今天重新研究Qt窗体绘图和图片显示 1 窗体的背景上绘制线段和区域 2 窗体背景显示图片以及图片缩放 3 无边框窗体显示以及无边框窗体的移动 4 自定义widget形状 1 在窗体上执行绘制线段和区域等操作 图1 有时候需要在窗体的背景上绘
  • Pig-使用PigLatin操作员工表和部门表

    前提条件 安装好hadoop2 7 3 Linux系统下 安装好pig Linux系统下 准备源数据 打开终端 新建emp csv文件 nano emp csv 输入内容如下 保存退出 7369 SMITH CLERK 7902 1980
  • JetBrain Rider控制台 输出乱码问题

    JetBrain Rider控制台 输出乱码问题 新安装的Rider默认在Windows下运行控制台输出中文会出现乱码 黑窗口运行不会乱码 想必是控制台编码方式的问题 解决方案 点击help gt Edit Custom VM Option
  • Android screencap截屏指令

    查看帮助 注意 有的网友错误使用 screencap v 结果差不多 因为系统不能识别 v 就自动打印出帮助信息 screencap hscreencap husage screencap hp d display id FILENAME
  • 如何在uniapp中优雅地使用WebView

    这里给大家分享我在网上总结出来的一些知识 希望对大家有所帮助 从webview页面传值到uniapp中 官方文档已经很详细了 这里给大家上我的实战代码 首先在webview页面中引入相关依赖
  • 机器学习——深度学习(Deep Learning)

    Deep Learning是机器学习中一个非常接近AI的领域 其动机在于建立 模拟人脑进行分析学习的神经网络 最近研究了机器学习中一些深度学习的相关知识 本文给出一些很有用的资料和心得 Key Words 有监督学习与无监督学习 分类 回归