机器学习岗位面试问题汇总之深度学习

2023-11-17

自己结合网络内容总结，欢迎指正欢迎补充。

最新更新：20170624—版本2（增加22-28）

1.模式识别、机器学习、深度学习的区别与联系
模式识别：过去、程序/机器做智能的事、决策树等
机器学习：热点领域、给数据+学习数据
深度学习：前言领域、强调模型

2.早年神经网络被淘汰的原因
耗时、局部最优、竞争对手、over-fitting、参数

3.深度学习的实质及其与浅层学习的区别
深度学习实质：多隐层+海量数据——>学习有用特征—–>提高分类或预测准确性
区别：（1）DL强调模型深度（2）DL突出特征学习的重要性：特征变换+非人工

4.神经网络的发展（背景之类的）
MP模型+sgn—->单层感知机（只能线性）+sgn— Minsky 低谷 —>多层感知机+BP+sigmoid—- (低谷) —>深度学习+pre-training+ReLU/sigmoid

5.DL解决过拟合的方法
数据扩容、dropout技术

6.介绍dropout技术
修改神经网络本身来避免过拟合、训练网络的一种trike。
步骤：repeat { 随机‘删除’+BP获权值}
为何会避免过拟合：训练多个“半数网络”，随着训练的进行，大部分正确，小部分错误（不影响）

7.推导BP算法
http://blog.csdn.net/hungryof/article/details/50436231

8.BP算法为什么不能适应于深度学习
BP为传统多层感知机的训练方法，<=5层
问题：（1）梯度越来越稀疏（梯度扩散<—-非凸目标函数）（2）局部最小（3）一般，有标签
NOTE：解决其中局部最小值的方法：（1）多组不同随机参数，取最好参数（2）启发式优化算法：模拟退火或遗传（3）随机梯度下降

9.深度学习与传统神经网络之间的区别与联系
联系：分层结构
区别：训练机制（初始值）

10.介绍DNN（原理和应用）
DNN：深度神经网络，广义上包含CNN，DBN，RNN等
优点：层数多，抽象能力强，模拟更复杂模型
应用：图像处理、语音识别、文本分类。。。

11.什么是深度学习、深度学习的训练过程是什么
无监督预训练(Layerwise Pre-Training)+有监督微调（fine-tune）
过程：（1）自下而上非监督学习特征（2）自顶向下有监督微调

12.深度学习常用方法
全连接DNN（相邻层相互连接、层内无连接）：
AutoEncoder(尽可能还原输入)、Sparse Coding（在AE上加入L1规范）、RBM（解决概率问题）—–>特征探测器——>栈式叠加贪心训练
RBM—->DBN
解决全连接DNN的全连接问题—–>CNN
解决全连接DNN的无法对时间序列上变化进行建模的问题—–>RNN—解决时间轴上的梯度消失问题——->LSTM

13.RBM用途
（1）编码、降维（2）得到权重矩阵和偏移量，供BP网络初始化训练（3）可作为生成模型使用（4）可作为判别模型使用

14.介绍DBN
DBN是一个概率生成模型。
组成：多个RBM+BP网络
训练过程：（1）无监督训练每一层RBM网络、特征向量映射到不同特征空间、尽可能保留特征信息（贪心算法）（2）DBN最后一层设置为BP网络，有监督微调
RBM训练可以看作对一个深层BP网络的网络权值参数的初始化—->克服容易局部最优+训练时间长
优点：不用人工选取特征
缺点：（1）有标签样本集（2）学习过程慢（3）参数不当可能导致局部最优
公式推导：
http://blog.csdn.net/app_12062011/article/details/54313082

15.介绍CNN
重点：局部感受域、权值共享
组成：卷基层、子采样层（池化层）
训练过程：不同小随机数初始参数—->repeat{ 前向传播（特征提取层C层—->特征映射层S层） + 后向传播 }
广义上的优点：（1）识别位移、缩放及其他形式扭曲不变性的二维图形（2）隐式从训练数据中学习特征（3）同一特征映射面的神经元权值相同—–>课并行学习（4）局部权值共享—->在语音识别、图像处理方面有优势、更接近实际生物神经网络、降低网络复杂性、避免特征提取和分类过程中的数据重建复杂度
较一般神经网络在图像处理方面的优点：（1）图像和网络拓扑更好吻合（2）特征提取和模式分类同时进行，并同时在训练中产生（3）权值共享—–>减少参数、结构简单、适应性更强
应用：语音分析、图像识别等
公式推导之 inference：
http://blog.csdn.net/lu597203933/article/details/46575871
http://blog.csdn.net/zouxy09/article/details/9993371
公式推导之 BP：
http://blog.csdn.net/walegahaha/article/details/51945421

16.CNN卷基层和pooling层的作用
卷积层：特征提取
子采样层/池化层：缩减输入数据的规模

17.CNN和DBN有什么区别
CNN是判别模型，DBN基于生成模型
CNN是局部连接，DBN是全连接

18.介绍RNN
概念：广义来说RNN是两种人工神经网络的总称：结构递归神经网络（Recursive Neural Network）和循环神经网络/时间递归神经网络（Recurrent Neural Network）。时间递归升降网络的神经元之间连接构成有向图，结构递归神经网络利用相似的神经网络结构递归构造更为复杂的网络结构，两者训练算法不同，但属于同一变体。
一般我们说的RNN是指时间递归神经网络
重点：同一个神经网络单元不停处理不同的输入值，而这些值是它自己产生的
缺点：长时间依赖问题，即时间距离较长时，会出现时间轴上的梯度消失现象，可以形象的理解为，比较容易忘事
应用：应为它老忘事，所以没有改进为LSTM的它并没有什么有价值的应用

19.介绍LSTM及其变体
是一种特殊的循环神经网络，具有能够学习的长期依赖能力
重点：cell
组成：Cell（state参数，用来记录），Input Gate, Output Gate, Forget Gate
训练过程：前向传播（Input Gate, Forget Gate, cell, output gate, cell output）+后向传播（cell output, output gates, states, cells, forget gates, input gates）
优点：能够解决长时间依赖问题
应用：自然语言处理、语音识别、手写识别等
推导：打印资料

20.深度学习的优化问题，及各种优化算法的区别
经典的：MBGD（小批量梯度算法）
改进梯度算法，使梯度更新更加灵活：Momentum,Nesterov
可以自适应学习率：Adagrad，Adadelta,RMSprop,Adam,Adamax,Nadam

21.深度学习在推荐系统上可能有怎样的发挥
推荐系统要解决：预测和推荐。深度学习可以用来做预测，（此处可以撤一点DL做预测的一般过程），YouTube已经开始使用了，他的推荐系统由2个神经网络组成，一个用来生成后选视频列表（协同过滤算法），另一个对输入的视频列表进行打分排名。

22.神经网络相比于LR、线性回归的优势
包含DNN
不包含DNN，即传统神经网络：特征提取抽象

23.梯度消失的原因
（1）sigmoid求导<=1/4
参考：http://blog.csdn.net/baidu_29782299/article/details/52742773
（2）BP？

24.DNN常用的激活函数有哪些，各有什么特点
（1）sigmoid：易饱和（梯度消失），非0均值（2）tanh，改进了sigmoid的第二个缺点，即它是0均值的（3）ReLU，收敛快（不容易饱和），求梯度简单（没有指数计算，只需要阈值就可以），有稀疏特性。缺点是神经元容易坏死。
参考：http://f.dataguru.cn/thread-712946-1-1.html

25.什么样的资料不适合用深度学习？
（1）数据量小（2）没有局部相关性

26.什么是共线性，跟过拟合有何关联？
共线性：高度相关—>冗余——>过拟合
解决：排除相关、加入权重正则

27.CNN可应用与图像识别、语音识别、Alphago等，这些不相关问题的共性是什么？也就是说CNN为什么可以应用在这几个问题上？CNN又是通过什么手段抓住了这些共性？
共性：都存在局部与整体的关系（单词与句子，一步棋和整个棋局）。（我自己想的（1）可以用CNN，（2）CNN有优势）
CNN通过局部感知、权值共享、池化操作。越来越抽象。

28.CNN什么时候用local-conv？什么时候用全卷积（每一个点用同一个filter）？
当数据集的局部特征之间具有较强相关性的时候，适合用全卷积。在不同的区域有不同的特征分布时，适合用local-conv

参考
《统计学习方法》，李航
《神经网络与深度学习》，吴岸城
《机器学习》，周志华
《斯坦福大学2014机器学习课程笔记》，Andrew Ng主讲，黄海广整理笔记

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习岗位面试问题汇总之深度学习的相关文章

测试市场已经饱和了吗？现在转行软件测试会不会太迟？

非常有意思的话题某种程度上来说测试职场一条从未设想过的道路真的走通了这条路指广大测试呼吁对测试从业进行学历保护专业保护就像医学那样设置护城河以一种令人意想不到的方式完成了得益于大量培训机构为了赚钱盲目的向大量非计算机相关专业
‘DR-GAN: Automatic Radial Distortion RectificationUsing Conditional GAN in Real-Time‘条件GAN实时径向畸变自动矫正

这篇文章在2020年发表在IEEE Transactions on Circuits and Systems for Video Technology上
蒙牛×每日互动合作获评中国信通院2023“数据+”行业应用优秀案例

当前在数字营销领域品牌广告主越来越追求品效协同针对品牌主更注重营销转化的切实需求数据智能上市企业每日互动股票代码 300766 发挥自身数据和技术能力优势为垂直行业的品牌客户提供专业的数字化营销解决方案颇受行业认可就在不久前举
论文查重部分算不算重复率呢

大家好今天来聊聊论文查重部分算不算重复率呢希望能给大家提供一点参考以下是针对论文重复率高的情况提供一些修改建议和技巧可以借助此类工具论文查重部分算不算重复率呢在论文查重过程中查重部分是否计入重复率是一个关键问题本文将从七个
史上最全的中高级Java工程师面试题汇总有哪些？

你有面试机会了吗近期肯定有很多小伙伴投出去的简历HR基本上都是已读不回甚至都没有任何回复或者平台默认筛选你的简历HR根本就看不到即使有些小伙伴简历通过收到面试邀请了结果被通知不用面试了还有些小伙伴有面试机会了甚至已经
基于机器学习的贷中风险预测模型-江苏银行“随e融”杯-二等奖

文章目录源码下载地址项目介绍界面预览项目备注毕设定制咨询源码下载地址源码下载地址点击这里下载源码项目介绍基于机器学习的贷中风险预测模型江苏银行
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
HarmonyOS 基于eTS高效开发HarmonyOS课程类应用

随着HarmonyOS 3 0 Beta版的发布 API Version 8新增了大批JS eTS API接口相信很多开发者已经迫不及待想体验基于eTS的HamronyOS应用开发本期Codelab 我们将基于API Version 8
2024诸多大厂春招提前启动！Android的程序员还在等什么

春招提前批已开 xdm别打瞌睡了格力顺丰酷狗沃尔玛中国理想科大讯飞等开启春招开始收简历了还有hc的企业提前抢人春招时间短节奏快招满即止就算挂了也绝不能不投对企业来说秋招和春招都是储备人才的黄金时期春招中除
数据库 | 面试官：一次到底插入多少条数据合适啊？.....面试连环炮

数据库面试官一次到底插入多少条数据合适啊面试连环炮数据库插入操作的基础知识插入数据是数据库操作中的基础但是我们程序员将面临随之而来的问题如何快速有效地插入数据并保持数据库性能当你向数据库中插入数据时这些数据直接存储到
最新整理Java面试八股文，大厂必备神器

在看这篇文章之前我想我们需要先搞明白八股文是什么明清科举考试的一种文体也称制义制艺时文八比文八股文章就四书五经取题内容必须用古人的语气绝对不允许自由发挥而句子的长短字的繁简声调高低等也都要相对成文字数也有限制八股
15天学会Python深度学习，我是如何办到的？

陆陆续续有同学向我们咨询 Python编程如何上手深度学习怎么学习如果有人能手把手一对一帮帮我就好了我们非常理解初学者的茫然和困惑大量视频书籍广告干扰了大家的判断学习Python和人工智能成为内行人不难为此我们推出了
深度学习：人脸识别系统 Tensorflow 人脸检测 Python语言 facenet人脸识别算法毕业设计（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验注册与
软件测试面试：还没有自动化测试项目经验，3个项目帮你走入软测职场！

2024软件测试面试刷题这个小程序永久刷题靠它快速找到工作了刷题APP的天花板 CSDN博客文章浏览阅读2 3k次点赞85次收藏11次你知不知道有这么一个软件测试面试的刷题小程序里面包含了面试常问的软件测试基础题 web自
2024最强Java面试八股文合集（持续更新）

今天要谈的主题是关于求职求职是在每个技术人员的生涯中都要经历多次对于我们大部分人而言在进入自己心仪的公司之前少不了准备工作有一份全面细致面试题将帮助我们减少许多麻烦在跳槽季来临之前特地做这个系列的文章一方面帮助自己巩固下基
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
如何应对Android面试官-＞玩转 ViewPager 懒加载

前言 ViewPager 缓存页面与预加载机制通常我们 ViewPager 在使用的是一般都是结合 Fragment 一起使用我们先来搭一个简单的使用界面最终搭建出来的效果如下简单的 ViewPager Fragment 的实现比

随机推荐

【数据结构】KMP算法

算法简介传统暴力算法和KMP算法设定主串的长度为n 字串的的长度为m 传统的暴力字符串匹配算法理论上最多需要花费O nm 的时间复杂度才能完成串的匹配操作但是在实际使用中往往也能够以接近O m n 的时间复杂的完成匹配操作因此现在
【js】JSON.stringify 语法实例讲解

语法 JSON stringify value replacer space value 是必选字段就是你输入的对象比如数组类等 replacer 这个是可选的它又分为2种方式一种是数组第二种是方法情况一 replacer为数
Tcp建立连接为什么需要三次握手

前言众所周知tcp传输层协议在建立连接的时候需要三次才能建立起一个真正的可靠连接可是为什么是三次呢不可以是两次四次等等呢可以自己思考一番带着疑问可以看下文三次握手在计算机网络一书中其中有提到三次握手的目的是为了防止已
逐步视频讲解--用Tensorflow进行中文自然语言处理--情感分析

本教程为原创转载请注明教学视频地址视频教程链接 https www bilibili com video av30543613 书面教程和代码链接 https github com aespresso chinese sentiment
王者荣耀8月15日服务器维护,王者荣耀8月15日更新维护到什么时候王者荣耀8月15日更新时间分享...

王者荣耀 5V5英雄公平对战手游腾讯最新MOBA大作 5V5 3v3 1v1 多样模式一键体验海量英雄随心选择 10秒实时跨区匹配与好友组队类型动作冒险大小 792 06M 语言简体中文在王者荣耀8月15日更新到什么时候呢
BAT54C 二极管是如何工作的？

这是一个多电源供电的电路 Vcc是正常供电电源如5V 由市电变换得到电压大于 Vcc1 Vf 正常供电时二极管不导通 Vcc1是电池供电电源当Vcc撤掉时 DD1 上边的二极管导通由Vcc1供电当电池Vcc1耗尽或更换电池时 V
openwrt上opkg更新报错"opkg_download: Failed to download ............."

开始搞op的时候看到op竟然可以直接安装一些插件激动坏了因为这东西对嵌入式的小系统来说简直不敢想但是op就支持了就是这么任性好不容易编译了固件按照网上的教程 telnet进去首先opkg update 结果没有想象中的华丽更
聚类算法（二）--层次聚类法

本文主要介绍层次聚类法的基本原理距离计算方法算法的优缺点以及R语言实战一概述层次聚类 Hierarchical Clustering 试图在不同层次上对数据集进行划分从而形成树形的聚类结构数据集的划分可采用自底向上的聚合
CUDA编程学习0——环境搭建&环境详解

目录环境配置软件安装 1 支持最高的cuda版本查询下载cuda开发软件 3 配置环境 bashrc添加环境变量 4 后续维护查询补关于windows下的cuda环境配置一 Visual Studio 2022 CUDA 11
java，html5+css3以及javascript面试题------自己面试的时候遇到的面试题，所以整理一下

1 java部分 1 线程与进程的区别一个程序至少有一个进程一个进程至少有一个线程线程的划分尺度小于进程使得多线程程序的并发性高另外进程在执行过程中拥有独立的内存单元而多个线程共享内存从而极大地提高了程序的运行效率线程在执
matlab 计算结果为nan,matlab 计算结果总是为Nan

本人刚刚接触matlab 对这些运算不是很懂计算ni的位置 exp E g 2 k T eps 这个值之前一直是0 加了eps后就有结果显示了后面部分exp alfa T 2 k T beita 一直为无穷大然后结果就为Nan 不知道怎
UIKeyboard键盘相关知识点-IOS开发

一键盘风格 UIKit框架支持8种风格键盘 java view plain copy print typedef enum UIKeyboardTypeDefault 默认键盘支持所有字符 UIKeyboardTypeASCIICapa
08.animation-----05.旋转

1 旋转是将元素沿着x y z轴以指定的角度旋转旋转方向为顺时针单位可以为deg也可为turn 2 旋转也是使用transform标签使用以下函数 rotatex 使元素沿着x轴旋转 rotatey 使元素沿着y轴旋转 rotatez
微信小程序-天气预报案例之和风天气API-云开发版

小程序天气预报在现实生活中是非常常用的我们平时都可以通过自己的手机上面或网上进行查看天气等等鉴于有些小伙伴对云开发不熟悉学习请移步到我的另外一篇文章天气预报之和风天气简易版这个demo可以应用到自己的小程序模块上前期准备
面试华为软件测试岗，收到offer后我却毫不犹豫拒绝了....

我大学学的是计算机专业毕业的时候对于找工作比较迷茫也不知道当时怎么想的一头就扎进了一家外包公司一干就是2年我想说的是但凡有点机会千万别去外包在深思熟虑过后决定要提升自己也发现自己身边的人都是在大厂上班也听他们说了大厂
第十章 os.path模块

1 os path模块介绍 os 模块是Python 内置的与操作系统功能和文件系统相关的模块该模块的子模块os path 是专门用于进行路径操作的模块常用的路径操作主要有判断目录是否存在创建目录删除目录和遍历目录等说明在使用o
腾讯视频url获取方法

总公式 url fn vkey 第一步复制视频地址步骤如下点击复制通用页面地址第二布 http vv video qq com getinfo vid m00253deqqo platform 101001 charge 0 oty
[激光原理与应用-34]：《光电检测技术-1》- 光学测量基础 - 光电检测、光学测量、作用、应用、发展趋势

目录第1章光学测量概述 1 1 什么是光学检测 1 2 光学检测的重要作用 1 3 计量 1 4 测量 1 5 光学测量的特点与优点第2章光的测量范围与相应技术手段 2 1 光的辐射度量与光度量的测量 2 2 非光物理量的光学测量
PAT Basic Level 1075 链表元素分类（静态链表）

题目链接点击查看题目描述给定一个单链表请编写程序将链表元素进行分类排列使得所有负值元素都排在非负值元素的前面而 0 K 区间内的元素都排在大于 K 的元素前面但每一类内部元素的顺序是不能改变的例如给定链表为 18 7 4
机器学习岗位面试问题汇总之深度学习

自己结合网络内容总结欢迎指正欢迎补充最新更新 20170624 版本2 增加22 28 1 模式识别机器学习深度学习的区别与联系模式识别过去程序机器做智能的事决策树等机器学习热点领域给数据学习数据深度学习前言领

机器学习岗位面试问题汇总 之 深度学习

机器学习岗位面试问题汇总 之 深度学习 的相关文章

随机推荐

热门标签

机器学习岗位面试问题汇总之深度学习

机器学习岗位面试问题汇总之深度学习的相关文章