【深入浅出深度学习】1、深度学习的发展

2023-11-10

人工智能、机器学习、深度学习的关系

1、人工智能——机器推理

利用计算机构建具有人类智力特征的复杂机器，即为通用人工智能或强人工智能，即让机器拥有人类的所有感觉、所有理智、像人类一样思考。要实现真正意义上的人工智能可能还有很长的路，但是在一些特定的领域，如图像识别、人脸识别、计算机视觉等方面已经实现了比人类更好的效果。这些被称为“狭义的人工智能”或“弱人工智能”。

2、机器学习——数据驱动的科学

机器学习也被称为统计机器学习，是人工智能领域的一个分支，基本思想是基于数据构建统计模型，并利用模型对数据进行分析和预测的一门学科。机器学习是一种让计算机利用数据而非指令来进行各种工作的方法。
机器学习最基本的做法是利用算法来解析数据，从数据中学习到规律，并掌握这种规律，然后对真实世界中的时间做出决策或预测。机器学习的核心是使用大量的数据进行训练，通过各种算法从数据中学习如何完成任务。
机器学习是基于训练数据构建统计模型，从而是的计算机具有对新数据进行预测和分析的能力，机器学习方法按其实现的目标不同，可以分为：监督学习、无监督学习和强化学习。

监督学习：
使用带有标签的训练数据集进行训练，输入的训练数据由物体的特征向量（输入）和物体的标签（输出）两部分构成。若输出的标签是一个连续的值，称为回归监督学习；若输出的标签是一个离散的值，称为分类监督学习。
涉及两个方面：
① 根据提供的训练数据，选择一种合适的模型进行训练，直至模型收敛。
常见的监督学习模型：Logistic回归、SVM、KNN、决策树、朴素贝叶斯等。
每个样本数据的输入是由物体的特征构成的特征向量，如颜色大小等，输出的是物体类别。
② 当模型训练完毕后，将新的输入数据带入模型，模型将根据新的特征信息，找出最符合这种特征的输出结果。
无监督学习：
训练样本没有任何的标签和输出，其目的是对原始数据结构进行深入的分析，找出数据间存在的规律与关系。
典型的无监督学习任务包括：聚类、降维、特征提取等。
虽然监督学习准确率更高，但是现实中我们获得大量数据一般是没有标签数据的，因此无监督学习显得尤为重要。传统的方法不令人满意，但是深度学习被证明有强大的无监督学习能力，尤其在计算机视觉领域，深度学习达到的效果远远优于传统机器学习。
强化学习：
也称增强学习。强调如何基于环境而行动，以取代最大化的预期利益。和有监督/无监督对比，不需要出现正确的输入输出对，也不需要精确校正次优化行为，更注重在线规划，在未知领域和现有知识之间找到平衡，其学习过程是一个从实际环境中不断学习积累，不断进化的过程。

3、深度学习——大脑的仿真

过去，深度学习是作为机器学习的一个算法而存在，被称为人工神经网络，由于受到算法理论、数据、硬件的制约，多年以来一直都是单层或浅层的网络结构。并且随着其他更有效率的浅层算法（SVM/Logistic回归）的提出，神经网络在效果和性能上都没有任何优势，逐渐淡出视野。后来，随着大数据的发展，以及大规模硬件加速设备的出现，特别是GPU的不断提升，使得神经网络重新受到重视。

深度学习的发展历程

1957年，Rosenblatt提出感知器，但无法解决非线性数据的分类，后又学者提出剁成神经网络能够解决非线性问题，但却没有提出多层神经网络的有效训练方法。
1986年Rumelhar和Hinton提出了BP算法，解决了两层乃至多层的神经网络训练问题，解决了非线性分类问题。
BP算法的制约：
① 随着神经元节点的增多，训练时间容易变长；
② 神经网络的优化函数是一个非凸优化问题，容易造成局部最优解；
③ 理论上说网络层数越多，神经网络的学习能力越强，但是随着网络层数的增多，网络的学习能力并未随之提高，由于BP算法导致的梯度消失的问题。
2006年Hinton首次提出“深度信念网络”，传统的训练方式采样随机初始化的方式来初始化权值参数，但该网络利用预训练（pre-training）的过程，可以方便神经网络中的权值找到一个接近最优解的初始值，再用“微调”技术（fine-tuning）技术对整个网络进行优化训练。这两个技术有效的减小了网络的训练时间，并缓解了BP算法导致的梯度消失的问题。给神经网络赋予了新名称——深度学习。
深度学习真正受人瞩目是2012年的ImageNet比赛，Hinton的学生利用多层卷积神经网络成功的对包含一千类别的一百万张图片进行了训练，分类错误率只有15%，比第二名低了近11个百分点，此后深度学习呈爆发式的发展。
深度学习的兴起离不开大数据和高性能的计算平台的推动，分别被称为 “引擎”和“燃料”。深度学习的成功需要依靠大量的训练数据来进行学习，大数据是深度学习的基础；另一方面，对大量数据的学习和训练，效率问题很难解决，就需要硬件设施的加速发展。

深度学习概述

1. 从低层到高层的特征抽象

深度学习借助人类视觉系统对外部信息的分级处理方式，通过组合底层特征形成更加抽象的高层特征。如计算机视觉领域，深度学习就是从原始图像的像素数据出发，通过不同的卷积核处理，如拉普拉斯滤波器等，去学习得到一个低层次的表达，之后在这些低层次表达的基础上，通过线性或非线性组合，来获得一个高层次的表达。

2. 让网络变得更深

深度学习是机器学习的一种分支学科，其目的是建立可以模拟人脑进行分析学习的模型，模仿人脑的机制来解释数据.深度学习之所以成为“深度”，是因为之前的机器学习方法都是浅层学习，深度学习可以理解为传统神经网络的发展。
二三十年前，神经网络曾是机器学习领域的热点方向。但是后来由于理论分析的难度，加上训练方法需要很多经验和技巧，以及巨大的计算量和优化求解难度，使其慢慢淡出了科研领域的主流方向。此后出现的Hinton的预训练和微调技术缓解了梯度消失问题，此后出现了各种优化技术。如单侧抑制的激活函数ReLu取代传统的sigmoid激活函数，使得梯度消失问题进一步缓解。最近，一种称为梯度残差的技术被应用到神经网络的训练中，使得网络层数达到了百层以上。

3. 自动特征提取

深度学习的第三个技术改革是其具有强大的自动提取特征的能力，浅层结构算法有很多局限性，在有限样本和计算单元情况下对复杂函数的表示能力有限，针对复杂分类问题七泛化能力受到一定的制约。更重要的是浅层模型有一个特点，是需要依靠人工来抽取样本的特征，然而手工选取是很费力的一件事情，能不能选取好的特征很大程度上靠经验和运气。
深度学习使得自动学习特征成为可能。深度学习框架将特征提取和分类器结合到一个框架中，自动从海量大数据中去学习特征，在使用中减少了手工设计特征的巨大工作量。
相比前两次人工智能高潮中的神经网络模型，深度学习带来的变化不仅仅是层数上的简单堆叠，更重要的是端到端（end-to-end）的表示学习（representation learning）思想。
深度学习时代，输入数据直接变成了欲处理对象的最初形态，如初始图像的最初形态，如初始图像、初始语音等。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【深入浅出深度学习】1、深度学习的发展的相关文章

【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
用CHAT写一份标题为职业教育教师教学能力提升培训总结

CHAT回复标题职业教育教师教学能力提升培训总结一活动概述本次由学校组织的职业教育教师教学能力提升培训于8月15日至8月20日顺利进行来自全校的60位职业教育教师参与了此次培训主讲人为享有盛名的教育专家马丁先生二培训内容与
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
毕业设计：基于卷积神经网络的图像分类系统 python人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 卷积神经网络 2 2 SVM算法三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
AI帮助终结全球饥饿问题

全球饥饿问题是牵动人心的头等大事 5月28日是世界饥饿日这一问题更值得关注让人人都能吃饱的想法不仅令人向往而且很快就会变成现实与大多数新事物引进一样对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用人们还踟蹰不前
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金

随机推荐

功能测试数据测试之数据测试关注点

数据类型常见数据类型整型浮点型字符型布尔型等可用等价类方法对输入数据类型设计测试用例数据长度数据长度可能是固定长度或者是在某个范围内的长度可用等价类和边界值方法对数据长度设计测试用例数据一致性组织数据测试该交易在交易
Fatal Python error: init_sys_streams: can‘t initialize sys standard streamsPython runtime state: 问题

哈喽大家好我是奇点江湖人称 singularity 刚工作几年想和大家一同进步一位上进心十足的 Java ToB端大厂领域博主喜欢java和python 平时比较懒能用程序解决的坚决不手动解决如果有对 java 感兴趣的
canvas绘制火柴人
每日面试题day02

1 int 和 Integer 有什么区别 int 是基本数据类型 Integer 是其包装类注意是一个类在 java 中包装类用途比较多的是用在于各种数据类型的转化中 2 重载和重写的区别 overload 重载参数类型个数顺
vue3如何进行数据监听watch/watchEffect

我们都知道监听器的作用是在每次响应式状态发生变化时触发在组合式 API 中我们可以使用 watch 函数和watchEffect 函数当你更改了响应式状态它可能会同时触发 Vue 组件更新和侦听器回调默认情况下用户创建的侦听器回
IntelliJ IDEA Plugins加载太慢_IntelliJ IDEA Plugins搜不出来【已解决】

问题 IntelliJ IDEA Plugins加载太慢或者IntelliJ IDEA Plugins搜不出来解决方案
html form 表单

定义 form 表单在网页中主要负责数据采集功能属于一个容器标记表单组成一个表单由 form元素表单控件和表单按钮组成 1 form元素 form元素用来创建表单语法格式如下
SQL中根据经纬度计算两点之间的直线距离

最近接到一个需求获取当前用户的经纬度然后计算与目标地的的距离我自己也是看别人的博客学习自己也做个记录吧直接放出计算的公式不想浪费时间的直接看公式套进去就成依次是纬度纬度经度 round 6378 138 2 ASIN SQ
vue显示PDF文件

小编最近接手的项目中有个需求前端显示后端返回的PDF格式的文件经过小编两天的调研和试验终于找到了一个比较好的插件方法直接贴代码 1 安装 npm i vue pdf signature save dev 2 pdfShow vue
一个测试的成长历程【功能测试篇】——web测试的总结
js自写发布订阅模块

实现效果如下图所示代码如下
【论文阅读】文献阅读笔记-泊松重建

先了解泊松分布就二项分布而言泊松分布可以是二项分布的推广样本数趋向于无穷大而事件发生的概率趋近于0时此时期望满足np Lamda 常数且此时事件发生的概率满足泊松分布且概率的计算只与Lamda有关但泊松方程和泊松分布没啥关系
微信小程序实现扫二维码时仿微信扫码音效

需求分析使用wx scanCode时无交互感对用户来说没有反馈故增加扫码成功时震动及播放微信扫码音效 index html
一些关于c语言if语句的练习

练习题1 在终端输入一个整数用来表示学生的成绩输出学生成绩对应的等级 90 100 A 80 90 B 70 80 C 60 70 D 0 60 不及格练习题2 在终端输入一个整数用来表示年份输出这一年是平年还是闰年闰年能被4
联盟链FISCO BCOS网络端口讲解

FISCO BCOS是完全开源的联盟区块链底层技术平台由金融区块链合作联盟深圳简称金链盟成立开源工作组通力打造开源工作组成员包括博彦科技华为深证通神州数码四方精创腾讯微众银行亦笔科技和越秀金科等金链盟成员机构代码仓
IDEA 查看源码快捷键

一快捷键快捷键功能 Ctrl Shift i 出现类似于预览的小窗口 Ctrl Enter 接上步完全打开源码 Ctrl 鼠标左键一步到位打开源码 Ctrl Shift i gt Ctrl Enter IDEA 2018版实用快
使用Canal实现mysql binlog增量订阅数据

前言是由公司业务改造搜索功能使用ES搜索引擎中间件那么我们需要将mysql中的数据同步至ES服务中最总选择使用alibaba的canal增量订阅和解析工具简单原理 canal模拟mysql slave的交互协议伪装自己为mysq
使用Java操作excel的几种方法

在平时的业务系统开发中少不了需要用到导出导入excel功能今天我们就一起来总结一下下面给大家介绍一下几种常用方法 apache poi easypoi easyexcel 文章目录一 Apache poi 1 1 首先添加依赖 1
动态IP代理是什么？一文看懂动态代理IP

一什么是动态IP代理动态IP代理是一种代理服务而动态IP是由ISP动态分配给用户的IP地址这些IP地址会周期性地更改每次链接互联网时用户会被分配一个新的IP地址因而也称为轮换IP IP地址轮换是一个过程您的IP 地址网络
【深入浅出深度学习】1、深度学习的发展

人工智能机器学习深度学习的关系 1 人工智能机器推理利用计算机构建具有人类智力特征的复杂机器即为通用人工智能或强人工智能即让机器拥有人类的所有感觉所有理智像人类一样思考要实现真正意义上的人工智能可能还有很长的路但是在一些

【深入浅出深度学习】1、深度学习的发展

人工智能、机器学习、深度学习的关系

1、 人工智能——机器推理

2、 机器学习——数据驱动的科学