李宏毅老师机器学习选择题解析

2023-11-13

机器学习选择题解析加整理

项目说明,本项目是李宏毅老师在飞桨授权课程的配套问题
课程 传送门
该项目AiStudio项目 传送门

仅供学习参考!

三岁出品必是精品!
整理内容源于李宏毅老师机器学习课程群提问答疑解析内容!

单选题(一)


机器学习训练时,Mini-Batch 的大小优选为2个的幂,如 256 或 512。它背后的原因是什么?
A. Mini-Batch 为偶数的时候,梯度下降算法训练的更快
B. Mini-Batch 设为2的幂,是为了符合CPU、GPU的内存要求,利于并行化处理
C. 不使用偶数时,损失函数是不稳定的
D. 以上说法都不对

答案:B
解析:略


下列说法错误的是?
A. 当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解
B. 进行 PCA 降维时,需要计算协方差矩阵
C. 沿负梯度的方向一定是最优的方向
D. 利用拉格朗日函数能解带约束的优化问题

答案:C
解析:沿负梯度的方向是函数值减少最快的方向但不一定就是最优方向。


关于 L1、L2 正则化下列说法正确的是?
A. L2 正则化能防止过拟合,提升模型的泛化能力,但 L1 做不到这点
B. L2 正则化技术又称为 Lasso Regularization
C. L1 正则化得到的解更加稀疏
D. L2 正则化得到的解更加稀疏

答案:C
解析:L1、L2 正则化都能防止过拟合,提升模型的泛化能力。L1 正则化技术又称为 Lasso Regularization。L1 正则化得到的解更加稀疏。


“增加卷积核的尺寸,一定能提高卷积神经网络的性能。” 这句话是否正确?
A. 正确
B. 错误

答案:B
解析:卷积核的尺寸是超参数,不一定增加其尺寸就一定增加神经网络的性能,需要验证选择最佳尺寸。


有 N 个样本,一般用于训练,一般用于测试。若增大 N 值,则训练误差和测试误差之间的差距会如何变化?
A. 增大
B. 减小

答案:B
解析:增加数据,能够有效减小过拟合,减小训练样本误差和测试样本误差之间的差距。


在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?
A. 多项式阶数
B. 更新权重 w 时,使用的是矩阵求逆还是梯度下降
C. 使用常数项

答案:A
解析:选择合适的多项式阶数非常重要。如果阶数过大,模型就会更加复杂,容易发生过拟合;如果阶数较小,模型就会过于简单,容易发生欠拟合。


如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?
A.测试样本误差始终为零
B.测试样本误差不可能为零
C.以上答案都不对

答案:C
解析:略

多选题(一)

下列方法中,可以用于特征降维的方法包括?
A. 主成分分析 PCA
B. 线性判别分析 LDA
C. AutoEncoder
D. 矩阵奇异值分解 SVD
E. 最小二乘法 LeastSquares

答案:ABCD
解析:主成分分析 PCA 、线性判别分析 LDA 、AutoEncoder、矩阵奇异值分解 SVD 都是用于特征降维的方法。最小二乘法是解决线性回归问题的算法,但是并没有进行降维。


下列关于极大似然估计(Maximum Likelihood Estimate,MLE),说法正确的是?
A. MLE 可能并不存在
B. MLE 总是存在
C. 如果 MLE 存在,那么它的解可能不是唯一的
D. 如果 MLE 存在,那么它的解一定是唯一的
答案:AC
解析:如果极大似然函数 L(θ) 在极大值处不连续,一阶导数不存在,则 MLE 不存在;另一种情况是 MLE 并不唯一,极大值对应两个θ。


下列哪种方法可以用来减小过拟合?
A. 更多的训练数据
B. L1 正则化
C. L2 正则化
D. 减小模型的复杂度

答案:ABCD
解析:略

单选题(二)


关于循环神经网络(RNN)描述正确的是
A.可以用于处理序列数据
B.不能处理可变长序列数据
C.不同于卷积神经网络,RNN的参数不能共享
D.隐藏层上面的unit彼此没有关联

答案:A
解析:RNN可以设置单独的句子长度参数,也能参数共享,隐藏层的神经元也是彼此作用的


下面梯度下降说法错误的是?
A.随机梯度下降是梯度下降中常用的一种
B.梯度下降包括随机梯度下降和批量梯度下降
C.梯度下降算法速度快且可靠
D.随机梯度下降是深度学习算法当中常用的优化算法之一

答案:C
解析:梯度下降一般只全量更新,效率低,所以随机梯度相比梯度下降,每次只选择部分样本做更新,效率更高,速度更快


下面关于无监督学习描述正确的是
A.无监督算法只处理“特征”,不处理“标签”
B.降维算法不属于无监督学习
C.K-meas算法和SVM算法都属于无监督学习
D.以上都不对

答案:A
解析:SVM属于监督学习算法,降维是非监督


"在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步,如果以某种方法知道了神经网络准确的权重和偏差,你就可以近似任何函数,实现这个最佳的方法是什么?
A.随机赋值,祈祷它们是正确的
B.搜索所有权重的偏差的组合,直到得到最佳值
C.赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重
D.以上都不是

答案:C
解析:这是神经网络算法的原理


关于神经网络与深度学习的关系表述不正确的是?
A.深度学习的概念源于人工神经网络的研究
B.含有多个隐层的神经网络算法就是一种深度学习算法
C.单层神经网络也是深度学习的一种
D.卷积神经网络属于深度学习的一种

答案:C
解析:深度学习一般至少包含输入层,隐藏层,输出层,不是单层。


以下关于卷积神经网络,说法正确的是?
A.卷积神经网络只能有一个卷积核
B.卷积神经网络可以有多个卷积核,但是必须同大小
C.卷积神经网络可以有多个卷积核,可以不同大小
D.卷积神经网络不能使用在文本这种序列数据中

答案:C
解析:可以多个卷积核;大小也可以在不同的层,设置不同的值;在NLP领域也可以使用CNN做特征提取


以下关于逻辑回归的说法不正确的是?
A.逻辑回归必须对缺失值做预处理
B.逻辑回归要求自变量和目标变量是线性关系
C.逻辑回归比决策树,更容易过度拟合
D.逻辑回归只能做2值分类,不能直接做多值分类

答案:C
解析:决策树是更容易过拟合的

多选题(二)

训练误差会降低模型的准确率,产生欠拟合,此时如何提升模拟拟合度?
A.增加数据量
B.特征工程
C.减少正则化参数
D.提高模型复杂度

答案:B、C、D
解析:训练误差来自模型算法本身,和数据量大小无关


对于PCA说法正确的是?
A.我们必须在使用PCA前规范化数据
B.我们应该选择使得模型有最大variance的主成分
C.我们应该选择使得模型有最小variance的主成分
D.我们可以使用PCA在低维度上做数据可视化

答案:A、B、D
解析:主成分是能对数据产生巨大影响的,因此产生巨大影响的那么对于方差的影响肯定也很大,所以C不对


有关集成学习下列说法正确的是?
A.基本模型应尽量来自于同一算法,通过改变训练数据和参数,得到不同的基本模型
B.通常来讲,基本模型之间相关性应该低一些
C.集成的基本模型的数量越多,集成模型的效果就越好
D.bagging boosting 时常用的集成学习的方法

答案:B、D
解析:集成算法可以集成不同算法模型,这也正式集成算法有效的原因;基本模型越多,也可能导致过拟合,在模型选择上,应保证效果好的情况下再考虑集成

作者简介

作者:三岁
经历:自学python,现在混迹于paddle社区,希望和大家一起从基础走起,一起学习Paddle
csdn地址:https://blog.csdn.net/weixin_45623093/article/list/3
我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/284366

传说中的飞桨社区最菜代码人,让我们一起努力!
记住:三岁出品必是精品 (不要脸系列

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

李宏毅老师机器学习选择题解析 的相关文章

随机推荐

  • 论文笔记 2023.5.22

    图像分类的深度卷积神经网络模型综述 图像分类的过程 图像预处理 图像特征提取 人工提取 传统图像分类算法 卷积操作提取 卷积神经网络 使用分类器对图像进行分类 以图像分类为载体 深度卷积神经网络模型主要包括以下四个类别 1 经典深度卷积神经
  • KVM处理器管理和硬件辅助虚拟化技术

    KVM处理器管理和硬件辅助虚拟化技术 Intel 在2006年发布了硬件虚拟化技术 其中支持X86体系结构的称为Intel VT x技术 AMD称为SVM技术 VT x引入了一种新的处理器操作 叫做VMX Virtual MachineEx
  • 基于多项贝叶斯的三分类的情感分析实现

    写在前面 本实验报告是一篇很水的水课的期末大作业 代码 数据集均为原创 意在用最少的代码和最简单的数据集完成老师留下的题目 仅供交流学习使用 禁止直接洗稿嗷 目录 写在前面 一 实验目的 二 实验手段和方法 三 实验内容 四 实验总结 一
  • 量子计算(13)基础知识4:量子测量

    量子测量是量子电路中最后一个元素 在电路中我们经常用到 下面 我将描述量子测量的数学依据以及与量子测量相关的科学定理 目录 一 量子测量 1 理论知识 2 计算基下测量单量子比特 二 两个原理 1 延迟测量原理 2 隐含测量原理 一 量子测
  • Linux下查找文件(日志)中的关键字

    进入到需要查看日志文件的目录 执行以下命令 即可快速定位到想要查看日志内容所在行 1 查看日志 前 n行 cat 或者 tail 日志文件名 head n 数量 示例1 cat api log head n 200 查看log前200行 示
  • three.js加载纹理总是黑色的问题

    什么是纹理 简单理解就是贴在几何体或平面的纹路 就比如一个杯子上的图案 菜鸟 包括我 根据three js教程上代码敲上去之后 纹理没有效果 查阅了半天 总结有以下几个原因 1 图片路径 谷歌浏览器需要在属性中按照如图配置 allow fi
  • SYS_PTRACE容器

    docker run cap add SYS PTRACE security opt seccomp unconfined security opt apparmor unconfined
  • 基于springboot+vue的电影视频订票咨询网站系统-Java项目毕业设计

    项目介绍 随着网络不断的普及发展 影城管理系统依靠网络技术的支持得到了快速的发展 首先要从用户的实际需求出发 通过了解用户的需求开发出具有针对性的首页 电影信息 电影资讯 个人中心 后台管理 在线客服功能 影城管理系统的主要使用者分为管理员
  • 全数字锁相环的研究与设计

    参考文档 http www doc88 com p 4364928925689 html 一篇硕士学位论文 全数字锁相环的研究与设计 https www docin com p 1390623327 html 基于延迟锁定环的TDC的设计
  • mysql 连接池断开后自动连接

    MySQL对所有连接的有效时间默认为28800秒 正好8小时 也就是说 如果一个连接8小时没有请求和操作 就会自动断开 但是对于 Hibernate来说 它的连接池并不知道它所管理的连接中是否有被MySQL断开的 如果一个程序要使用数据库连
  • 实时数仓之实际落地如何选型和构建

    往期类似文章 实时数仓之 Kappa 架构与 Lambda 架构 奔跑者 辉的博客 CSDN博客 企业级 实时数仓架构图 奔跑者 辉的博客 CSDN博客 第一部分 Spark基础篇 奔跑者 辉的博客 CSDN博客 第一部分 Flink基础篇
  • 找不到msvcp120dll,无法继续执行代码的修复方法

    本教程操作系统 Windows系统 msvcp120 dll是电脑文件中的dll文件 动态链接库文件 如果计算机中丢失了某个dll文件 可能会导致某些软件和游戏等程序无法正常启动运行 并且导致电脑系统弹窗报错 msvcp120 dll文件丢
  • 32 --> 详解 OpenWRT系统框架基础软件模块之netifd

    一 简介 OpenWrt路由操作系统的框架基础软件有很多 大部分是通用的软件模块 如 dhcp dnsmasq iproute cmwp vpn ipsec等等 OpenWrt还集成部分具有专属特征软件模块 也是OpenWRT系统核心框架软
  • 【云原生】k8s之Ingress

    内容预知 1 Ingress的相关知识 1 1 Ingress的简介 1 2 Ingress 的组成 1 3 Ingress Nginx的工作原理 1 4 新生代Ingress controller Traefik Ingress ngin
  • 代码随想录算法训练营第十九天

    代码随想录算法训练营第十九天 一 654 最大二叉树 这题跟构造二叉树的题目一样 比较简单 class Solution private TreeNode traversal vector
  • 什么时候触发MinorGC?什么时候触发FullGC?

    触发MinorGC Young GC 虚拟机在进行minorGC之前会判断老年代最大的可用连续空间是否大于新生代的所有对象总空间 1 如果大于的话 直接执行minorGC 2 如果小于 判断是否开启HandlerPromotionFailu
  • chatgpt赋能python:Python安装Numpy库详细教程

    Python安装Numpy库详细教程 Python是一种高水平语言 当我们需要处理数值计算和科学计算时 通常需要使用Numpy库 Numpy库可以使Python在处理数组时变得更加便利 本文将会详细介绍如何在Python中安装Numpy库
  • 前端好用工具推荐-获取页面区块坐标

    最近分析网页的区块的逻辑关系和区块的坐标 找了一下相关的画图工具和插件 最后发现还是chrome牛叉 工具多 插件也多 而且非常方便好用 其中一个插件叫做 FE助手 能够方便的确定页面位置的坐标 而且使用起来相当方便 除此之外还有很多页面代
  • Stream流的使用

    目录 流介绍 流的生成 流的操作类型 流的使用 中间操作 终端操作 流介绍 流是从支持数据处理操作的源生成的元素序列 源可以是数组 文件 集合 函数 流的目的不在于保存数据 而是计算 流的生成 通常有5种方式 1 通过集合生成 List
  • 李宏毅老师机器学习选择题解析

    机器学习选择题解析加整理 项目说明 本项目是李宏毅老师在飞桨授权课程的配套问题 课程 传送门 该项目AiStudio项目 传送门 仅供学习参考 三岁出品必是精品 整理内容源于李宏毅老师机器学习课程群提问答疑解析内容 单选题 一 机器学习训练