机器学习——深度学习(Deep Learning)

2023-10-29

Deep Learning是机器学习中一个非常接近AI的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，最近研究了机器学习中一些深度学习的相关知识，本文给出一些很有用的资料和心得。

Key Words：有监督学习与无监督学习，分类、回归，密度估计、聚类，深度学习，Sparse DBN，

1. 有监督学习和无监督学习

给定一组数据(input，target)为Z=(X，Y)。

有监督学习：最常见的是regression & classification。

regression：Y是实数vector。回归问题，就是拟合(X，Y)的一条曲线，使得下式cost function L最小。

classification：Y是一个finite number，可以看做类标号。分类问题需要首先给定有label的数据训练分类器，故属于有监督学习过程。分类问题中，cost function L(X,Y)是X属于类Y的概率的负对数。

，其中f_i(X)=P(Y=i | X);

无监督学习：无监督学习的目的是学习一个function f，使它可以描述给定数据的位置分布P(Z)。包括两种：density estimation & clustering.

density estimation就是密度估计，估计该数据在任意位置的分布密度

clustering就是聚类，将Z聚集几类（如K-Means），或者给出一个样本属于每一类的概率。由于不需要事先根据训练数据去train聚类器，故属于无监督学习。

PCA和很多deep learning算法都属于无监督学习。

2. 深度学习Deep Learning介绍

Depth 概念：depth: the length of the longest path from an input to an output.

Deep Architecture 的三个特点：深度不足会出现问题；人脑具有一个深度结构（每深入一层进行一次abstraction，由lower-layer的features描述而成的feature构成，就是上篇中提到的feature hierarchy问题，而且该hierarchy是一个稀疏矩阵）；认知过程逐层进行，逐步抽象

3篇文章介绍Deep Belief Networks，作为DBN的breakthrough

3.Deep Learning Algorithm 的核心思想：

把learning hierarchy 看做一个network，则

①无监督学习用于每一层网络的pre-train；

②每次用无监督学习只训练一层，将其训练结果作为其higher一层的输入；

③用监督学习去调整所有层

这里不负责任地理解下，举个例子在Autoencoder中，无监督学习学的是feature，有监督学习用在fine-tuning. 比如每一个neural network 学出的hidden layer就是feature，作为下一次神经网络无监督学习的input……这样一次次就学出了一个deep的网络，每一层都是上一次学习的hidden layer。再用softmax classifier去fine-tuning这个deep network的系数。

这三个点是Deep Learning Algorithm的精髓，我在上一篇文章中也有讲到，其中第三部分：Learning Features Hierachy & Sparse DBN就讲了如何运用Sparse DBN进行feature学习。

4. Deep Learning 经典阅读材料：

The monograph or review paper Learning Deep Architectures for AI (Foundations & Trends in Machine Learning, 2009).

The ICML 2009 Workshop on Learning Feature Hierarchies webpage has a list of references.

The LISA public wiki has a reading list and a bibliography.

Geoff Hinton has readings from last year’s NIPS tutorial.

阐述Deep learning主要思想的三篇文章：

Hinton, G. E., Osindero, S. and Teh, Y., A fast learning algorithm for deep belief netsNeural Computation 18:1527-1554, 2006

Yoshua Bengio, Pascal Lamblin, Dan Popovici and Hugo Larochelle, Greedy Layer-Wise Training of Deep Networks, in J. Platt et al. (Eds), Advances in Neural Information Processing Systems 19 (NIPS 2006), pp. 153-160, MIT Press, 2007<比较了RBM和Auto-encoder>

Marc’Aurelio Ranzato, Christopher Poultney, Sumit Chopra and Yann LeCun Efficient Learning of Sparse Representations with an Energy-Based Model, in J. Platt et al. (Eds), Advances in Neural Information Processing Systems (NIPS 2006), MIT Press, 2007<将稀疏自编码用于回旋结构(convolutional architecture)>

06年后，大批deep learning文章涌现，感兴趣的可以看下大牛Yoshua Bengio的综述Learning deep architectures for {AI},不过本文很长，很长……

5. Deep Learning工具—— Theano

Theano是deep learning的Python库，要求首先熟悉Python语言和numpy，建议读者先看Theano basic tutorial，然后按照Getting Started 下载相关数据并用gradient descent的方法进行学习。

学习了Theano的基本方法后，可以练习写以下几个算法：

有监督学习：

Logistic Regression - using Theano for something simple
Multilayer perceptron - introduction to layers
Deep Convolutional Network - a simplified version of LeNet5

无监督学习：

Auto Encoders, Denoising Autoencoders - description of autoencoders
Stacked Denoising Auto-Encoders - easy steps into unsupervised pre-training for deep nets
Restricted Boltzmann Machines - single layer generative RBM model
Deep Belief Networks - unsupervised generative pre-training of stacked RBMs followed by supervised fine-tuning

最后呢，推荐给大家基本ML的书籍：

关于Machine Learning更多的学习资料将继续更新，敬请关注本博客和新浪微博Sophia_qing。

References：

1. Brief Introduction to ML for AI

2.Deep Learning Tutorial

3.A tutorial on deep learning - Video

转自：http://blog.csdn.net/abcjennifer/article/details/7826917

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习——深度学习(Deep Learning) 的相关文章

LLama Factory 实操记录（一）

1 api端口参数说明 src api h help 显示帮助信息并退出 model name or path MODEL NAME OR PATH 模型权重的路径或标识符来自 huggingface co models 或 models
【人工智能领域优质书籍】实战AI大模型

文末送书今天推荐一本人工智能领域好书实战AI大模型文章目录导语书籍亮点初学者必备文末送书导语人工智能领域资深专家尤洋老师倾力打造获得了李开复周鸿祎颜水成三位大咖鼎力推荐一经上市就登上了京东计算机与互联网图书排行
Python机器学习实战：用Python构建10个有趣的应用

机器学习是一门强大的工具可以用于解决各种各样的问题通过学习机器学习您可以开发出能够自动化任务做出预测甚至创造艺术的应用程序如果您是一名 Python 开发人员那么您将很高兴知道有许多可以用 Python 构建的有趣机器学习应用
Python机器学习实战：用Python构建10个有趣的应用

机器学习是一门强大的工具可以用于解决各种各样的问题通过学习机器学习您可以开发出能够自动化任务做出预测甚至创造艺术的应用程序如果您是一名 Python 开发人员那么您将很高兴知道有许多可以用 Python 构建的有趣机器学习应用
基于深度学习的停车位关键点检测系统（代码+原理）

摘要 DMPR PS是一种基于深度学习的停车位检测系统旨在实时监测和识别停车场中的停车位该系统利用图像处理和分析技术通过摄像头获取停车场的实时图像并自动检测停车位的位置和状态本文详细介绍了DMPR PS系统的算法原理创新点和实验
3 分钟为英语学习神器 Anki 部署一个专属同步服务器

Anki 介绍 Anki 是一款基于间隔重复 Spaced Repetition 原理的学习软件想象一下你的大脑就像是一个需要定期维护的精密仪器间隔重复就好比是一种精准的维护计划它通过在最佳时刻复习信息来确保知识在你的脑海中牢固地
【深度学习：（Contrastive Learning）对比学习】深入浅出讲解对比学习

对比学习允许模型从未标记的数据中提取有意义的表示通过利用相似性和不相似性对比学习使模型能够在潜在空间中将相似的实例紧密地映射在一起同时将那些不同的实例分开这种方法已被证明在计算机视觉自然语言处理 NLP 和强化学习等不同领域都是有
3 分钟为英语学习神器 Anki 部署一个专属同步服务器

Anki 介绍 Anki 是一款基于间隔重复 Spaced Repetition 原理的学习软件想象一下你的大脑就像是一个需要定期维护的精密仪器间隔重复就好比是一种精准的维护计划它通过在最佳时刻复习信息来确保知识在你的脑海中牢固地
3 分钟为英语学习神器 Anki 部署一个专属同步服务器

Anki 介绍 Anki 是一款基于间隔重复 Spaced Repetition 原理的学习软件想象一下你的大脑就像是一个需要定期维护的精密仪器间隔重复就好比是一种精准的维护计划它通过在最佳时刻复习信息来确保知识在你的脑海中牢固地
图神经网络与智能教育：创新教育技术的未来

导言图神经网络 GNNs 和智能教育技术的结合为教育领域注入新活力本文深入研究二者的结合可能性涉及各自侧重当前研究动态技术运用实际场景未来展望并提供相关链接 1 图神经网络与智能教育的结合方向 1 1 图神经网络在教育技术中
蒙牛×每日互动合作获评中国信通院2023“数据+”行业应用优秀案例

当前在数字营销领域品牌广告主越来越追求品效协同针对品牌主更注重营销转化的切实需求数据智能上市企业每日互动股票代码 300766 发挥自身数据和技术能力优势为垂直行业的品牌客户提供专业的数字化营销解决方案颇受行业认可就在不久前举
如何用GPT制作PPT和写代码？

详情点击链接如何用GPT制作PPT和写模型代码一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemin
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
15天学会Python深度学习，我是如何办到的？

陆陆续续有同学向我们咨询 Python编程如何上手深度学习怎么学习如果有人能手把手一对一帮帮我就好了我们非常理解初学者的茫然和困惑大量视频书籍广告干扰了大家的判断学习Python和人工智能成为内行人不难为此我们推出了
GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验注册与
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车

随机推荐

超级实用的shell脚本100例（一）

超级实用的shell脚本100例一 1 编写 hello world 脚本 bin bash echo hello world 2 通过位置变量创建 Linux 系统账户及密码 bin bash 1 是执行脚本的第一个参数 2 是执行脚本
Android 简介

国内移动互联网发展史播种 2000年9月19日中国移动和国内百家ICP首次坐在了一起日本取经 2001年11月10日中国移动通信的移动梦网正式开通萌芽萌芽时期先后冒出了搜索音乐阅读游戏等领域的多种无线企业不过整个
Visual Studio修改代码后运行程序不更新问题解决方案

一在生成中重新生成但是此方法需要每次修改后重新点击二配置生成管理器路径生成配置管理器勾选生成刚学visual studio 2022 3天自己摸索出来的方案
福布斯发布区块链50强这5家中国公司上榜

福布斯发布区块链50强这5家中国公司上榜附榜单福布斯今日 2月20日在官网发布第二届区块链50强 Blockchain 50 榜单据福布斯评选标准入选 Blockchain 50 榜单的公司必须每年营收不少于10亿美元或估值超
欧拉角图解释

定义先引wiki上的定义欧拉角由三个角度组成在特定坐标系下用于描述刚体的orientation 简单来说就是绕一个三维坐标系统下的三个基轴旋转三个角度可以用来表示物体通过各种绕七绕八的转最终转到的那种形态 orientatio
wifi类物联产品配网之web

文章目录 wifi类物联产品配网之web web配网介绍 web配网实现 wifi类物联产品配网之web 上接wifi类物联产品配网前言 web配网介绍 web主要连接设备建立的wifi 热点后以网页的形式让用户输入wifi ssid和
Mybatis

1 简介 1 1 持久化数据持久化持久化就是将程序的数据在持久状态和瞬时状态转换的过程内存断电即失数据库 Jdbc io文件持久化为什么需要持久化有些对象不能让他丢掉内存太贵了 1 2 持久层 Dao层 Service层
LLM-大模型训练-步骤(二)-预训练/Pre-Training(1)：全参数预训练(Full-Param Pre-Training)【对LLaMA等模型进一步全量参数预训练】【中文无监督学习语料】

GitHub项目 KnowLM 一全参数预训练 Full Param Pre training 使用中文语料对LLaMA等模型进行进一步全量预训练在尽可能保留原来的英文和代码能力的前提下进一步提高模型对于中文理解能力和丰富模型的知识储
蓝桥杯2015年第六届真题-奇怪的数列

题目题目链接题解实现题太简单了就是遍历字符串拼接一下就可以了代码 include
Jvm参数优化

Jvm参数优化背景 1 系统上线规划容量分析 2 垃圾回收器选择吞吐量和响应时间垃圾回收器选择 3 规划各个分区的比例大小 4 对象年龄对少移动到老年代合适 5 对象多大放到老年代 6 垃圾回收器CMS老年代参数优化 7 配置OOM
更换硬盘_「心得」群晖NAS升级硬盘——硬盘篇：硬盘的更换与RAID设置思路

经过大概一周左右的时间终于断断续续的把我的群晖NAS的硬盘升级完了把原来3TB 2的RAID 1 变成3TB 3的RAID 5 同时把额外单独的3TB冷备份硬盘也升级成了6TB 为什么花费了一周左右的时间当中包括前期的文件校验新硬
C#中的多线程 - 并行编程

转载至 https blog gkarch com threading part5 html 1并行编程Permalink 在这一部分我们讨论 Framework 4 0 加入的多线程 API 它们可以充分利用多核处理器并行 LINQ
宝塔部署nodejs接口项目及mysql数据库教程

上传项目文件至宝塔目录文件夹我这里上传的server文件在网站菜单添加node项目填写node项目信息项目端口需要填写项目真实的启动端口需要绑定域名的可以添加域名管理添加域名后需要开启外网映射新建mysql数据库导入数据库数
Qt窗体背景绘图和图片显示篇

今天重新研究Qt窗体绘图和图片显示 1 窗体的背景上绘制线段和区域 2 窗体背景显示图片以及图片缩放 3 无边框窗体显示以及无边框窗体的移动 4 自定义widget形状 1 在窗体上执行绘制线段和区域等操作图1 有时候需要在窗体的背景上绘
Pig-使用PigLatin操作员工表和部门表

前提条件安装好hadoop2 7 3 Linux系统下安装好pig Linux系统下准备源数据打开终端新建emp csv文件 nano emp csv 输入内容如下保存退出 7369 SMITH CLERK 7902 1980
JetBrain Rider控制台输出乱码问题

JetBrain Rider控制台输出乱码问题新安装的Rider默认在Windows下运行控制台输出中文会出现乱码黑窗口运行不会乱码想必是控制台编码方式的问题解决方案点击help gt Edit Custom VM Option
Android screencap截屏指令

查看帮助注意有的网友错误使用 screencap v 结果差不多因为系统不能识别 v 就自动打印出帮助信息 screencap hscreencap husage screencap hp d display id FILENAME
如何在uniapp中优雅地使用WebView

这里给大家分享我在网上总结出来的一些知识希望对大家有所帮助从webview页面传值到uniapp中官方文档已经很详细了这里给大家上我的实战代码首先在webview页面中引入相关依赖
机器学习——深度学习(Deep Learning)

Deep Learning是机器学习中一个非常接近AI的领域其动机在于建立模拟人脑进行分析学习的神经网络最近研究了机器学习中一些深度学习的相关知识本文给出一些很有用的资料和心得 Key Words 有监督学习与无监督学习分类回归

机器学习——深度学习(Deep Learning)

机器学习——深度学习(Deep Learning) 的相关文章

随机推荐

热门标签