机器学习基础(一)——人工神经网络与简单的感知器

2023-11-04

机器学习基础(一)——人工神经网络与简单的感知器

  (2012-07-04 19:57:20)
标签: 

杂谈

分类: machineのlearning

    从最开始做数据挖掘而接触人工智能的知识开始,就不断听学长,老师说起神经网络算法。从这个角度来讲,神经网络真的可以被称作“传说中的”知识了。所以说,我是持着一种跪拜的心态开始这部分的学习的。

人工神经网络的一大代表性的用途就是接受和处理传感器产生的复杂的输入并进行自适应性的学习。受生物学的启发,人工神经网络由一系列简单的单元相互紧密联系构成的,每个单元有一定数量的实数输入和唯一的实数输出。

神经网络实际上是一类算法的总和,其中一部分算法的基础是被称为感知器的单元。什么是感知器呢?说的啰嗦一点,就是以一个实数向量作为输入,计算输入的线性组合,其大于某个阈值时输出1,否则输出0的单元。实际上,用一个简单的式子就可以表示

机器学习基础(一)——人工神经网络与简单的感知器这就是数学的魅力。。

为什么要建立感知器这个概念呢?感知器实际上是n维实例空间里的超平面决策面,它可以表示所有原子布尔函数,事实上,所有的布尔函数都可以用至多两层的感知器网络来表示。说白了,就是把任意一个布尔函数表达式表示成我们离散数学里的合取范式和析取范式。

为了训练出我们想要的布尔函数,我们可以走两条路,一条是根据现成的公式对权值进行直接调整,另一条是通过求使误差最小的时候的权值向量来间接地训练权值。前者对应感知器法则,后者就用到了传说中的梯度下降原理。

不同的训练方法在大体上是有共同点的,一般来说是从随机的权值开始,反复地输入样例,每当有错误结果的时候就根据一定的方法来修改权值,直到达到要求为止。先说比较简单的感知器法则吧,废话不说直接上公式:

 

机器学习基础(一)——人工神经网络与简单的感知器

其中,                 

                                机器学习基础(一)——人工神经网络与简单的感知器
    在这里,to分别是训练样例的目标输出以及感知器的结果,η被称为学习速率。从直观上来讲,这个过程就是根据结果的差值和x的值基于一个学习速率来进行权值的调节,结果差得越多,调节的幅度越大,x越大,调节的幅度越大,从而保持一种变换速率相对于x的稳定。

感知器法则很简单,下面就来介绍稍微复杂但是更加神奇的delta法则。如果训练样例是线性不可分的,它会收敛到目标的最佳近似。为了使它可用,我们要先修改一下感知器的定义。很简单,我们取消掉阈值的限制,直接将线性组合的结果输出就可以了。同时,我们还要定义一个概念——训练误差

                      机器学习基础(一)——人工神经网络与简单的感知器

 

很好理解,每个训练样例的误差平方和的一半(均方误差),它是权值向量的函数。我们的目标就是把它最小化,要用什么方法呢?普通的高中生都知道——求导。这就引出了梯度下降算法。

具体说这个算法之前先说一些废话吧。其实从我小学把数学从幼稚的“算数”这个字眼中剥离出来开始,我就对她怀着一种无尽的鄙视之情,这种感情一直保持到了大一结束,在我高考数学考砸的那段时间达到顶峰。一直觉得这种东西最大的用处就是一帮白痴爬不上旗杆没法测量它的长度只好测量它的影子来算一下相似三角形等等。从我真正的静下心来体会算法开始,数学才真正成为了门神学。大学高数基本没听过课,印象比较深的是大一下期中考试梯度和方向导数的两道题因为印在了背面而漏掉了,交卷一瞬间蒙的答案竟然是对的。那次考试那道题班里几乎全军覆没。一直没怎么把它当回事儿,直到大二看machine learning视频的第一堂课老师降到梯度下降算法的时候,不禁血脉贲张泪流满面。其实很多东西都是这样,你对她了解越深,越觉得她可爱与伟大。

不扯淡了。梯度是什么呢?梯度是一个向量,它的每个成员是E对每个w的偏导数。高数书里讲过,梯度的方向是函数上升最快的方向,反过来,它的相反数就是下降最快的方向。因此,我们从这个角度出发用一种比较贪心的策略来寻找问题的局部最优解,它的训练法则是:

 

                             机器学习基础(一)——人工神经网络与简单的感知器

其中:                    机器学习基础(一)——人工神经网络与简单的感知器

梯度下降算法仍然存在一些问题,它的收敛过程比较慢,而且有可能得到局部最优解。为了解决这些问题,随机梯度下降应运而生,它其实是对梯度下降的一种近似,通过简单改动一下原来的算法就可以了,这里就不把算法列出来了,梯度下降是对所有训练样例求和后计算权值更新,而随机近似梯度下降是根据每个单独样例的误差增量计算权值更新,从而减少了计算步骤和陷入局部最优解得可能性。

先写这么多吧,作为机器学习的一大类代表性的东西,神经网络科研究的东西太多太多,上面写的东西还远远不算入门,接下来还有多层网络的算法以及很多延伸,关于多层网络的算法我会在下一篇文章提到。而且我现在自学的书是二十年前的一本比较经典的书,已经过时的太多太多了,接下来怎么跟上时代的步伐还要不断地学习和摸索。。。哎,共勉吧~~~

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习基础(一)——人工神经网络与简单的感知器 的相关文章

  • 【深度学习基础】

    最终效果如上图所示 xff1a 真不知道这一路有多艰难 众所周知CHATGPT 可以做表格和 公式 xff0c 但它输出的文本是直接渲染好的 你是直接复制不了的 xff0c 你只能复制它出来的字体 于是我尝试了各种 想让它输出表格和文字的方
  • 深度学习入门资料整理

    深度学习基础总结 无一句废话 附完整思维导图 深度学习如何入门 知乎 深度学习入门基础讲义 shuzfan的博客 CSDN博客 深度学习入门 神经网络15分钟入门 足够通俗易懂了吧 知乎 深度学习基础知识点梳理 知乎
  • jittor框架

    sudo apt install python dev sudo pip install https github com Jittor jittor git python3 m jittor test test example http
  • 深度学习——深度生成模型(GAN,VAE)

    深度学习与PyTorch入门 对抗生成网络GAN理论讲解及项目实战 哔哩哔哩 bilibili 背景 生成模型 从某个分布中获取输入训练样本 并学习表示该分布的模型 作用 产生真实数据 艺术创作 超分辨率图片 2 帮助我们发现数据集中的隐变
  • 语义分割代码阅读---评价指标mIoU的计算

    1 语义分割IoU的定义 传统意义上的IoU Intersection over Union 交并比 直观表示 公式 语义分割中的IoU 在语义分割的问题中 这两个集合为真实值 ground truth 和预测值 predicted seg
  • 理解机器学习/深度学习的正则化Regularization概念

    通过防止过拟合来优化预测模型 目录 前言 正文 L2正则化或岭回归 这是如何实现的 改变 值所带来的影响 如何选择lambda的值 多维数据集 L1 Regularization or LASSO regression 改变lambda的效
  • 目标检测——概述

    学习视觉与深度学习有一年了 想把以前看到的文章和资料整理一下 不知道从哪些开始 这个暑假 趁着刚刚开完题 稍微闲一些 把目标检测相关的经典论文逐一记录一下 有时间跑一下作者的原码 水平有限 如涉及的内容有误 恳请大家指出 前言 计算机视觉领
  • 空洞卷积aspp 学习笔记

    ASPP 以下内容转自 空洞空间卷积池化金字塔 atrous spatial pyramid pooling ASPP 对所给定的输入以不同采样率的空洞卷积并行采样 相当于以多个比例捕捉图像的上下文 上图为deeplab v2的ASPP模块
  • 机器学习基础(一)——人工神经网络与简单的感知器

    机器学习基础 一 人工神经网络与简单的感知器 2012 07 04 19 57 20 转载 标签 杂谈 分类 machine learning 从最开始做数据挖掘而接触人工智能的知识开始 就不断听学长 老师说起神经网络算法 从这个角度来讲
  • 卷积神经网络的深入理解-归一化篇(Batch Normalization具体实例)

    卷积神经网络的深入理解 归一化篇 标准化 归一化 神经网络中主要用在激活之前 卷积之后 持续补充 归一化在网络中的作用 1 线性归一化 进行线性拉伸 可以增加对比度 2 零均值归一化 像素值 均值 方差 3 Batch Normalizat
  • 深度学习09 -Transformer2 - 理论篇

    参考文档 详解Transformer 1 开局来一张Transformer的整体结构图 2 结构图每步分析 1 Encoder 1 Input Embedding 就是对输入的数据进行向量化编码 可能是one hot等等 2 Positio
  • 卷积层计算量(FLOPS)和参数量的计算

    1 卷积参数量的计算 若卷积层的输入featuremap的维度为Cin Hin Win 卷积核的大小为K1 K2 padding P1 P2 stride S1 S2 卷积核 filter 的数量为Cout 则输出特征图的大小为Cout H
  • 机器学习(一)——K-近邻(KNN)算法

    机器学习 一 K 近邻 KNN 算法 最近在看 机器学习实战 这本书 因为自己本身很想深入的了解机器学习算法 加之想学python 就在朋友的推荐之下选择了这本书进行学习 一 K 近邻算法 KNN 概述 最简单最初级的分类器是将全部的训练数
  • 深度学习入门基础CNN系列——卷积计算

    卷积计算 卷积是数学分析中的一种积分变换的方法 在图像处理中采用的是卷积的离散形式 这里需要说明的是 在卷积神经网络中 卷积层的实现方式实际上是数学中定义的互相关 cross correlation 运算 与数学分析中的卷积定义有所不同 这
  • ML/DL-复习笔记【十】- 分组卷积和深度可分离卷积的区别

    本节为ML DL 复习笔记 十 分组卷积和深度可分离卷积的区别 主要内容包括 分组卷积与深度可分离卷积的参数量分析 最早出现分组卷积是AlexNet 由于单块GPU显存的限制 需要将网络部署在两张显卡上 分别进行训练最后再融合 Alex认为
  • 注意力&Transformer

    注意力 注意力分为两步 计算注意力分布 alpha 其实就是 打分函数进行打分 然后softmax进行归一化 根据 alpha 来计算输入信息的加权平均 软注意力 其选择
  • dropout层

    深度神经网 DNN 中经常会存在一个常见的问题 模型只学会在训练集上分类 过拟合现象 dropout就是为了减少过拟合而研究出的一种方法 一 简介 当训练模型较大 而训练数据很少的话 很容易引起过拟合 一般情况我们会想到用正则化 或者减小网
  • 懒人式迁移服务器深度学习环境(完全不需要重新下载)

    换服务器了 想迁移原来服务器上的深度学习环境 但又觉得麻烦懒得重新安装一遍anaconda pytorch 有没有办法能不费吹灰之力直接迁移 接下来跟着我一起 懒汉式迁移 本方法适用于在同一内网下的两台服务器之间互相迁移 不在同一局域网下的
  • 最强Pose模型RTMO开源 | 基于YOLO架构再设计,9MB+9ms性能完爆YOLO-Pose

    实时多人在图像中的姿态估计面临着在速度和精度之间实现平衡的重大挑战 尽管两阶段的上下文方法在图像中人数增加时会减慢速度 但现有的单阶段方法往往无法同时实现高精度和实时性能 本文介绍了RTMO 这是一个单阶段姿态估计框架 通过在YOLO架构中
  • 图像配准 CVPRW21 - 深度特征匹配 DFM

    本文转自 图像配准 CVPRW21 深度特征匹配 DFM 深度学习图像配准 CSDN博客 github地址 https github com ufukefe DFM 相识 图像配准 Image Registration 是计算机视觉领域中的

随机推荐

  • L - Candy Machine

    SDUT 2022 Spring Team Contest for 21 12 Virtual Judge JB loves candy very much One day he finds a candy machine with NN
  • SQLException之驱动版本不匹配

    java sql SQLException Unknown initial character set index 255 received from server Initial client character set can be f
  • docker安装fastdfs

    一 准备docker环境 二 搜索fastdfs镜像 三 拉取镜像 docker pull delron fastdfs 选取delron fastdfs镜像的原因是包含了nginx不用自己安装nginx转发 也可以选择qbanxiaoli
  • c++ this指针

    this指针是c 中的一个关键字 它在类中被自动隐藏了起来 this指针指向当前对象并且只能用在类的内部使用 通过this指针我们可以访问类中的所有成员 public protect private class A public void
  • IDEA过期重置

    过期重置 https blog csdn net zzztimes article details 117550423
  • win10电脑发现不了华为share_huaweishare打开 电脑找不到手机

    本帖最后由 lang dine 于 2020 1 26 22 37 编辑 我的笔记本不是华为笔记本其他的网络设备都能搜索到 唯独huawei手机搜索不到 无法被搜到应该是huawei share的问题 这个问题还能顺延出两个故障 win10
  • 方波参考测试信号PI控制调试

    要调试方波参考测试信号的PI控制 可以按照以下步骤进行操作 确保系统已经正确连接 并且您已经设置了方波参考测试信号的频率和幅值 配置PI控制器 根据您的控制系统要求 选择适当的PI控制器参数 例如比例增益 Kp 和积分时间 Ki 这些参数可
  • c++虚函数和纯虚函数的区别

    关于虚函数的定义是 被virtual关键字修饰的成员函数 关于纯虚函数的定义是 是一种特殊的虚函数 在许多情况下 在基类中不能对虚函数给出有意义的实现 把它声明为纯虚函数 它的实现留给该基类的派生类去做 这是是纯虚函数 虚函数的简单实例 定
  • Android9以后遇到的一些问题

    Android9以后不能使用外存 我遇到这个问题的时候没报错 但就是无法成功创建文件 报了找不到文件异常才发现问题 application的属性中添加一条属性 请求使用遗留外存 android requestLegacyExternalSt
  • pm ux ui_ui与ux回顾2020年前端设计方面与重要性之间的差异

    pm ux ui Why Because people use the terms UI and UX so interchangeably that I believe it is about time someone talks abo
  • 【C++】 函数返回vector

    当程序中要返回vector时 一般做法会将函数直接定义为 vector
  • Qt tabwidget中插入widget

    一 简单介绍 QT gt tabWidget 标签页面 在ui中通过工具栏自定义拉取控件 其中tabwidget可以可以创建多个标签页面 默认生成两个tab widget tab 1 tab 2 并且可以在ui中右键自由添加控制删除等标签页
  • 头歌python实训通关四——分支结构

    第1关 英制单位英寸与公制单位厘米互换 任务描述 本关任务 编写一个能实现单位英寸与公制单位厘米的互换的函数 相关知识 为了完成本关任务 你需要掌握 1 if条件语句 编程要求 根据提示 在右侧编辑器补充代码 实现单位英寸与公制单位厘米互换
  • 关于 private static final long serialVersionUID = 1L

    实现java io Serializable这个接口是为序列化 serialVersionUID 用来表明实现序列化类的不同版本间的兼容性 如果你修改了此类 要修改此值 否则以前用老版本的类序列化的类恢复时会出错 实现后如果你用的是工具的话
  • Java内省机制

    Wiki上的解释 在计算机科学中 内省是指计算机程序在运行时 Run time 检查对象 Object 类型的一种能力 通常也可以称作运行时类型检查 不应该将内省和反射混淆 相对于内省 反射更进一步 是指计算机程序在运行时 Run time
  • Log4Net(Logging for DotNet)学习笔记

    系统支持 SystemFramework 提供系统的框架支持 典型的 如异常 日志等 也有现成的 比如log4net 突然一种老朋友似的感觉涌上心头 这不是我一直想要得到的吗 一直想在的我系统加入的东西吗 日志系统 嘿嘿 高兴啊 本文从一个
  • 开源数据库对比 H2, HSQLDB, DERBY, PostgreSQL, MySQL

    H2 HSQLDB DERBY PostgreSQL MySQL
  • 接口复习总结

    第一章微型计算机系统概述 1 计算机硬件系统 运算器 控制器 存储器 输入和输出设备 2 接口的功能 I O端口编址方式 统一编址和独立编址 CPU与接口数据交换技术 无条件方式 控制简单 无需额外的硬件支出 CPU和外设之间只能串行工作
  • PyQt5执行shell

    代码如下 from PyQt5 QtCore import QProcess from PyQt5 QtWidgets import QWidget QApplication QVBoxLayout QLineEdit QTextEdit
  • 机器学习基础(一)——人工神经网络与简单的感知器

    机器学习基础 一 人工神经网络与简单的感知器 2012 07 04 19 57 20 转载 标签 杂谈 分类 machine learning 从最开始做数据挖掘而接触人工智能的知识开始 就不断听学长 老师说起神经网络算法 从这个角度来讲