《机器学习》 周志华学习笔记第一章 绪论(课后习题)

2023-10-27

        最近需要学习机器学习,有一点点基础但是很少,希望能通过写博客的方式和大家交流以及学习达到共同进步的目的。

绪论 :

一、内容

1.基本术语

2.假设空间与版本空间

3.归纳偏好(常用的有奥卡姆剃刀) 没有免费的午餐定理(No Free Lunch Theorem,NFL,前提建设f均匀分布)式(1.2)显示总误差竟然与学习算法无关!告诉我们要谈论算法的相对优劣,必须要针对具体的学习问题。学习算法自身的归纳偏好与问题是否匹配,往往会起到决定性的作用!

二、课后答案:

1、表1.1中若只包含编号为1,4的两个样例,试给出相应的版本空间。

首先求出这个问题的假设空间。数据集有3个属性,每个属性2种取值,加上可能取所有值都合适,‘*’,以及可能所有瓜都不是好瓜的取值空值,一共 3∗3∗3+1=28种假设,分别为

1.色泽=青绿 根蒂=蜷缩 敲声=浊响

2.色泽=青绿 根蒂=蜷缩 敲声=沉闷

3.色泽=青绿 根蒂=稍蜷 敲声=浊响

4.色泽=青绿 根蒂=稍蜷 敲声=沉闷

5.色泽=乌黑 根蒂=蜷缩 敲声=浊响

6.色泽=乌黑 根蒂=蜷缩 敲声=沉闷

7.色泽=乌黑 根蒂=稍蜷 敲声=浊响

8.色泽=乌黑 根蒂=稍蜷 敲声=沉闷

9.色泽=青绿 根蒂=蜷缩 敲声=*

10.色泽=青绿 根蒂=稍蜷 敲声=*

11.色泽=乌黑 根蒂=蜷缩 敲声=*

12.色泽=乌黑 根蒂=稍蜷 敲声=*

13.色泽=青绿 根蒂=* 敲声=浊响

14.色泽=青绿 根蒂=* 敲声=沉闷

15.色泽=乌黑 根蒂=* 敲声=浊响

16.色泽=乌黑 根蒂=* 敲声=沉闷

17.色泽=* 根蒂=蜷缩 敲声=浊响

18.色泽=* 根蒂=蜷缩 敲声=沉闷

19.色泽=* 根蒂=稍蜷 敲声=浊响

20.色泽=* 根蒂=稍蜷 敲声=沉闷

21.色泽=青绿 根蒂=* 敲声=*

22.色泽=乌黑 根蒂=* 敲声=*

23.色泽=* 根蒂=蜷缩 敲声=*

24.色泽=* 根蒂=稍蜷 敲声=*

25.色泽=* 根蒂=* 敲声=浊响

26.色泽=* 根蒂=* 敲声=沉闷

27.色泽=* 根蒂=* 敲声=*

28.空集Ø 

版本空间是与训练集一致的假设集合,因此我们根据数据1,4分别对假设空间中的假设进行搜索,搜索过程不断删除与正例不一致的假设,和与反例一致的假设。最终获得与训练集一致的假设即可。

得到的版本空间如下:

1.色泽=青绿 根蒂=蜷缩 敲声=浊响

9.色泽=青绿 根蒂=蜷缩 敲声=*

13.色泽=青绿 根蒂=* 敲声=浊响

17.色泽=* 根蒂=蜷缩 敲声=浊响

21.色泽=青绿 根蒂=* 敲声=*

23.色泽=* 根蒂=蜷缩 敲声=*

25.色泽=* 根蒂=* 敲声=浊响 

2、与使用单个合取式来进行假设表示相比,使用“析合范式”将使得假设空间具有更强的表示能力。若使用最多包含k个合取式的析合范式来表达1.1的西瓜分类问题的假设空间,试估算有多少种可能的假设

这个也是参考了其他人的答案,没有看明白,有兴趣的同学可以去页面底部查看链接文章。

3、若数据包含噪声,则假设空间中可能不存在与所有训练样本都一致的假设。在此情形下,试设计一种归纳偏好用于假设选择

通常认为两个数据的属性越相近,则更倾向于将他们分为同一类。若相同属性出现了两种不同的分类,则认为它属于与他最临近几个数据的属性。也可以考虑同时去掉所有具有相同属性而不同分类的数据,留下的数据就是没误差的数据,但是可能会丢失部分信息。

4、本章1.4节在论述“没有免费的午餐”定理时,默认使用了“分类错误率”作为性能度量来对分类器进行评估。若换用其他性能度量l,试证明没有免费的午餐”定理仍成立

考虑二分类问题,真实目标函数可以是任何函数X->{0, 1},函数空间为2的|X|平方,对所有的可能的f按均匀分布对误差求和,对l(f(x), h(x))求和是一个常数,所有最后结果与(1.2)除前边的常数外其他一样。我觉得这个定理最重要的就是要明白前提f满足均匀分布。

5.试述机器学习在互联网搜索的哪些环节起什么作用

1.消息推送,相关推荐

2.分类搜索

课后试题参考  http://blog.csdn.net/icefire_tyh/article/details/52065224

转载于:https://my.oschina.net/u/3870452/blog/1824594

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

《机器学习》 周志华学习笔记第一章 绪论(课后习题) 的相关文章

随机推荐

  • 向量与矩阵的相乘

    向量与矩阵的相乘 2016年07月31日 10 00 55 阅读数 2253 在学习计算机图形学的时候 最常遇到的就是矩阵的乘法了 下面我们就简单的介绍下 使用程序如何编写两个矩阵的相乘呢 其实这个问题 大一的孩子都会写的 不是很难的 但是
  • 【文本信息处理】网络文本访问和处理+分词

    一 网络文本访问和处理 1 re findall 返回string中所有与pattern匹配的全部字符串 返回形式为数组 def findall pattern string flags 0 Return a list of all non
  • unity 实现Android端视频在UI上播放

    之前unity实现在RawImage上播放视频主要是通过movieTexture 而现在这个方法已经被抛弃 采用VideoPlayer来实现 实现的原理是将VideoPlayerd的视频渲染到UGUI的RawImage上 private V
  • 【C++拾遗之八】#pragmaonce与#ifndef的用法总结

    宏定义 一 两种宏定义的功能 二 两种宏定义的用法 三 两种宏定义的区别 一 两种宏定义的功能 ifndef 和 pragma once都是C C 中的两种宏定义 它们的作用是为了避免同一个头文件被多次包含 include note 只能保
  • Nginx入门笔记

    目录 Nginx 快速入门 1 启动 停止和重新加载 Nginx 配置 2 配置文件的结构 3 提供静态内容服务 静态网站 4 设置简单的代理服务器 5 设置 FastCGI 代理 Nginx 进程和运行时控制 1 主进程和工作进程 2 控
  • idea 配置(下载) golang 环境 GOROOT、GOPATH

    windows 10 平台 golang镜像下载地址 https gomirrors org 选择稳定版的windows amd64 msi或者zip zip 解压到目录即可 msi 打开直接安装 配置环境变量 高版本有的会自己配置环境变量
  • [定向爬虫] 网络爬虫实例2-淘宝定向爬虫

    import requests import re import time 获取html页面 def getHTMLText url try r requests get url timeout 30 r raise for status
  • 【雕爷学编程】MicroPython手册之 WiPy 特定端口库 wipy.machine.I2C.stop()

    MicroPython是为了在嵌入式系统中运行Python 3编程语言而设计的轻量级版本解释器 与常规Python相比 MicroPython解释器体积小 仅100KB左右 通过编译成二进制Executable文件运行 执行效率较高 它使用
  • 一文了解电商大促系统的高可用保障思路

    本文面向受众可以是运营 可以是产品 也可以是研发 测试人员 作者希望通过如下思路 知历史 gt 清家底 gt 明目标 gt 定战略 gt 做战术 gt 促成长 帮助大家能够了解电商大促系统的高可用保障 减少哪些高深莫测的黑话和高大尚的论调
  • 【linux】linux中fork()详解(实例讲解)

    目录 linux中fork 函数详解 从一道面试题谈linux下fork的运行机制 linux中fork 函数详解 原文 linux中fork 函数详解 原创 实例讲解 jason314的博客 CSDN博客 fork 函数 一 fork入门
  • Conda 创建和删除虚拟环境

    1 检验当前conda的版本 conda V 2 conda常用的命令 查看已有的虚拟环境 conda env list 创建虚拟环境和删除虚拟环境 anaconda命令创建python版本为x x 名字为env name的虚拟环境 env
  • 微信小程序授权获取头像昵称的最新形式——头像昵称填写

    微信小程序授权用户信息 不知道有没有人像我一样 从wx getUserInfo到wx getUserProfile再到头像昵称填写获取用户头像昵称全部尝试了一遍 怪就怪自己一开始没仔细看官方文档 没注意到小程序的官方公告 不多说了 整理一下
  • LCD图片显示、触摸屏、音乐播放、缩放图片和播放视频

    一 GEC6818开发板的LCD 1 LCD 1 原理 LCD屏幕是由一个个像素组成的 横向像素个数和纵向像素个数是LCD的一个重要指标 称为像素分辨率 当前举例开发板的分辨率是 800X480 LCD显示从屏幕左上角的像素开始 直到右下角
  • C0223 [2015普及组-B]扫雷游戏-C语言写

    题目描述 扫雷游戏是一款十分经典的单机小游戏 在n行m列的雷区中有一些格子含有地雷 称之为地雷格 其他格子不含地雷 称之为非地雷格 玩家翻开一个非地雷格时 该格将会出现一个数字 提示周围格子中有多少个是地雷格 游戏的目标是在不翻出任何地雷格
  • wget命令详解,断点续传

    1 支持断点下传功能 2 同时支持FTP和HTTP下载方式 3 支持代理服务器 4 设置方便简单 5 程序小 完全免费 wget虽然功能强大 但是使用起来还是比较简单的 基本的语法是 wget 参数列表 URL 下面就结合具体的例子来说明一
  • CSDN新星计划/原力计划来喽,对此你有何期待

    文章目录 写在前面 新星计划 独自开 原力计划 横穿全年的计划 写在最后 写在前面 哈喽 大家好 我是几何心凉 这是一份全新的专栏 得到CSDN王总的授权 来对于我们每周四的绿萝时间 直达CSDN 直播内容进行总结概括 让大家能够省去看直播
  • 【虚幻】在UE4使用c++的Timeline和Curve制作动画

    文章目录 虚幻 在UE4使用c 的Timeline和Curve制作动画 动画的必备要素 Curve Timeline 调用流程 代码示例 虚幻 在UE4使用c 的Timeline和Curve制作动画 想用c 在UE4里面写一个动画 Goog
  • LeetCode 98 验证二叉搜索树(二叉搜索树的中序遍历为递增)

    题目 给定一个二叉树 判断其是否是一个有效的二叉搜索树 假设一个二叉搜索树具有如下特征 节点的左子树只包含小于当前节点的数 节点的右子树只包含大于当前节点的数 所有左子树和右子树自身必须也是二叉搜索树 示例 1 输入 2 1 3 输出 tr
  • “自顶向下,逐步求精“的程序设计方法

    在程序设计中 自顶向下 和 面向对象 是两类最重要也最基本的程序设计方法 今天我们先介绍 自顶向下 逐步求精 的程序设计方法 所谓 自顶向下 即是把一个抽象的 困难的大问题分解为若干个小问题 如果认为小问题仍然不够简单可行 就再进一步分解
  • 《机器学习》 周志华学习笔记第一章 绪论(课后习题)

    最近需要学习机器学习 有一点点基础但是很少 希望能通过写博客的方式和大家交流以及学习达到共同进步的目的 绪论 一 内容 1 基本术语 2 假设空间与版本空间 3 归纳偏好 常用的有奥卡姆剃刀 没有免费的午餐定理 No Free Lunch