机器学习基础（一）——人工神经网络与简单的感知器

2023-11-04

机器学习基础（一）——人工神经网络与简单的感知器

(2012-07-04 19:57:20)

转载▼

标签：

杂谈

分类： machineのlearning

从最开始做数据挖掘而接触人工智能的知识开始，就不断听学长，老师说起神经网络算法。从这个角度来讲，神经网络真的可以被称作“传说中的”知识了。所以说，我是持着一种跪拜的心态开始这部分的学习的。

人工神经网络的一大代表性的用途就是接受和处理传感器产生的复杂的输入并进行自适应性的学习。受生物学的启发，人工神经网络由一系列简单的单元相互紧密联系构成的，每个单元有一定数量的实数输入和唯一的实数输出。

神经网络实际上是一类算法的总和，其中一部分算法的基础是被称为感知器的单元。什么是感知器呢？说的啰嗦一点，就是以一个实数向量作为输入，计算输入的线性组合，其大于某个阈值时输出1，否则输出0的单元。实际上，用一个简单的式子就可以表示

这就是数学的魅力。。

为什么要建立感知器这个概念呢？感知器实际上是n维实例空间里的超平面决策面，它可以表示所有原子布尔函数，事实上，所有的布尔函数都可以用至多两层的感知器网络来表示。说白了，就是把任意一个布尔函数表达式表示成我们离散数学里的合取范式和析取范式。

为了训练出我们想要的布尔函数，我们可以走两条路，一条是根据现成的公式对权值进行直接调整，另一条是通过求使误差最小的时候的权值向量来间接地训练权值。前者对应感知器法则，后者就用到了传说中的梯度下降原理。

不同的训练方法在大体上是有共同点的，一般来说是从随机的权值开始，反复地输入样例，每当有错误结果的时候就根据一定的方法来修改权值，直到达到要求为止。先说比较简单的感知器法则吧，废话不说直接上公式：

其中，

在这里，t和o分别是训练样例的目标输出以及感知器的结果，η被称为学习速率。从直观上来讲，这个过程就是根据结果的差值和x的值基于一个学习速率来进行权值的调节，结果差得越多，调节的幅度越大，x越大，调节的幅度越大,从而保持一种变换速率相对于x的稳定。

感知器法则很简单，下面就来介绍稍微复杂但是更加神奇的delta法则。如果训练样例是线性不可分的，它会收敛到目标的最佳近似。为了使它可用，我们要先修改一下感知器的定义。很简单，我们取消掉阈值的限制，直接将线性组合的结果输出就可以了。同时，我们还要定义一个概念——训练误差

很好理解，每个训练样例的误差平方和的一半（均方误差），它是权值向量的函数。我们的目标就是把它最小化，要用什么方法呢？普通的高中生都知道——求导。这就引出了梯度下降算法。

具体说这个算法之前先说一些废话吧。其实从我小学把数学从幼稚的“算数”这个字眼中剥离出来开始，我就对她怀着一种无尽的鄙视之情，这种感情一直保持到了大一结束，在我高考数学考砸的那段时间达到顶峰。一直觉得这种东西最大的用处就是一帮白痴爬不上旗杆没法测量它的长度只好测量它的影子来算一下相似三角形等等。从我真正的静下心来体会算法开始，数学才真正成为了门神学。大学高数基本没听过课，印象比较深的是大一下期中考试梯度和方向导数的两道题因为印在了背面而漏掉了，交卷一瞬间蒙的答案竟然是对的。那次考试那道题班里几乎全军覆没。一直没怎么把它当回事儿，直到大二看machine learning视频的第一堂课老师降到梯度下降算法的时候，不禁血脉贲张泪流满面。其实很多东西都是这样，你对她了解越深，越觉得她可爱与伟大。

不扯淡了。梯度是什么呢？梯度是一个向量，它的每个成员是E对每个w的偏导数。高数书里讲过，梯度的方向是函数上升最快的方向，反过来，它的相反数就是下降最快的方向。因此，我们从这个角度出发用一种比较贪心的策略来寻找问题的局部最优解，它的训练法则是：

其中：

梯度下降算法仍然存在一些问题，它的收敛过程比较慢，而且有可能得到局部最优解。为了解决这些问题，随机梯度下降应运而生，它其实是对梯度下降的一种近似，通过简单改动一下原来的算法就可以了，这里就不把算法列出来了，梯度下降是对所有训练样例求和后计算权值更新，而随机近似梯度下降是根据每个单独样例的误差增量计算权值更新，从而减少了计算步骤和陷入局部最优解得可能性。

先写这么多吧，作为机器学习的一大类代表性的东西，神经网络科研究的东西太多太多，上面写的东西还远远不算入门，接下来还有多层网络的算法以及很多延伸，关于多层网络的算法我会在下一篇文章提到。而且我现在自学的书是二十年前的一本比较经典的书，已经过时的太多太多了，接下来怎么跟上时代的步伐还要不断地学习和摸索。。。哎，共勉吧~~~

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习基础

机器学习基础（一）——人工神经网络与简单的感知器的相关文章

【深度学习基础】

最终效果如上图所示 xff1a 真不知道这一路有多艰难众所周知CHATGPT 可以做表格和公式 xff0c 但它输出的文本是直接渲染好的你是直接复制不了的 xff0c 你只能复制它出来的字体于是我尝试了各种想让它输出表格和文字的方
深度学习入门资料整理

深度学习基础总结无一句废话附完整思维导图深度学习如何入门知乎深度学习入门基础讲义 shuzfan的博客 CSDN博客深度学习入门神经网络15分钟入门足够通俗易懂了吧知乎深度学习基础知识点梳理知乎
jittor框架

sudo apt install python dev sudo pip install https github com Jittor jittor git python3 m jittor test test example http
深度学习——深度生成模型（GAN，VAE）

深度学习与PyTorch入门对抗生成网络GAN理论讲解及项目实战哔哩哔哩 bilibili 背景生成模型从某个分布中获取输入训练样本并学习表示该分布的模型作用产生真实数据艺术创作超分辨率图片 2 帮助我们发现数据集中的隐变
语义分割代码阅读---评价指标mIoU的计算

1 语义分割IoU的定义传统意义上的IoU Intersection over Union 交并比直观表示公式语义分割中的IoU 在语义分割的问题中这两个集合为真实值 ground truth 和预测值 predicted seg
理解机器学习/深度学习的正则化Regularization概念

通过防止过拟合来优化预测模型目录前言正文 L2正则化或岭回归这是如何实现的改变值所带来的影响如何选择lambda的值多维数据集 L1 Regularization or LASSO regression 改变lambda的效
目标检测——概述

学习视觉与深度学习有一年了想把以前看到的文章和资料整理一下不知道从哪些开始这个暑假趁着刚刚开完题稍微闲一些把目标检测相关的经典论文逐一记录一下有时间跑一下作者的原码水平有限如涉及的内容有误恳请大家指出前言计算机视觉领
空洞卷积aspp 学习笔记

ASPP 以下内容转自空洞空间卷积池化金字塔 atrous spatial pyramid pooling ASPP 对所给定的输入以不同采样率的空洞卷积并行采样相当于以多个比例捕捉图像的上下文上图为deeplab v2的ASPP模块
机器学习基础（一）——人工神经网络与简单的感知器

机器学习基础一人工神经网络与简单的感知器 2012 07 04 19 57 20 转载标签杂谈分类 machine learning 从最开始做数据挖掘而接触人工智能的知识开始就不断听学长老师说起神经网络算法从这个角度来讲
卷积神经网络的深入理解-归一化篇（Batch Normalization具体实例）

卷积神经网络的深入理解归一化篇标准化归一化神经网络中主要用在激活之前卷积之后持续补充归一化在网络中的作用 1 线性归一化进行线性拉伸可以增加对比度 2 零均值归一化像素值均值方差 3 Batch Normalizat
深度学习09 -Transformer2 - 理论篇

参考文档详解Transformer 1 开局来一张Transformer的整体结构图 2 结构图每步分析 1 Encoder 1 Input Embedding 就是对输入的数据进行向量化编码可能是one hot等等 2 Positio
卷积层计算量(FLOPS)和参数量的计算

1 卷积参数量的计算若卷积层的输入featuremap的维度为Cin Hin Win 卷积核的大小为K1 K2 padding P1 P2 stride S1 S2 卷积核 filter 的数量为Cout 则输出特征图的大小为Cout H
机器学习（一）——K-近邻（KNN）算法

机器学习一 K 近邻 KNN 算法最近在看机器学习实战这本书因为自己本身很想深入的了解机器学习算法加之想学python 就在朋友的推荐之下选择了这本书进行学习一 K 近邻算法 KNN 概述最简单最初级的分类器是将全部的训练数
深度学习入门基础CNN系列——卷积计算

卷积计算卷积是数学分析中的一种积分变换的方法在图像处理中采用的是卷积的离散形式这里需要说明的是在卷积神经网络中卷积层的实现方式实际上是数学中定义的互相关 cross correlation 运算与数学分析中的卷积定义有所不同这
ML/DL-复习笔记【十】- 分组卷积和深度可分离卷积的区别

本节为ML DL 复习笔记十分组卷积和深度可分离卷积的区别主要内容包括分组卷积与深度可分离卷积的参数量分析最早出现分组卷积是AlexNet 由于单块GPU显存的限制需要将网络部署在两张显卡上分别进行训练最后再融合 Alex认为
注意力&Transformer

注意力注意力分为两步计算注意力分布 alpha 其实就是打分函数进行打分然后softmax进行归一化根据 alpha 来计算输入信息的加权平均软注意力其选择
dropout层

深度神经网 DNN 中经常会存在一个常见的问题模型只学会在训练集上分类过拟合现象 dropout就是为了减少过拟合而研究出的一种方法一简介当训练模型较大而训练数据很少的话很容易引起过拟合一般情况我们会想到用正则化或者减小网
懒人式迁移服务器深度学习环境（完全不需要重新下载）

换服务器了想迁移原来服务器上的深度学习环境但又觉得麻烦懒得重新安装一遍anaconda pytorch 有没有办法能不费吹灰之力直接迁移接下来跟着我一起懒汉式迁移本方法适用于在同一内网下的两台服务器之间互相迁移不在同一局域网下的
最强Pose模型RTMO开源 | 基于YOLO架构再设计，9MB+9ms性能完爆YOLO-Pose

实时多人在图像中的姿态估计面临着在速度和精度之间实现平衡的重大挑战尽管两阶段的上下文方法在图像中人数增加时会减慢速度但现有的单阶段方法往往无法同时实现高精度和实时性能本文介绍了RTMO 这是一个单阶段姿态估计框架通过在YOLO架构中
图像配准 CVPRW21 - 深度特征匹配 DFM

本文转自图像配准 CVPRW21 深度特征匹配 DFM 深度学习图像配准 CSDN博客 github地址 https github com ufukefe DFM 相识图像配准 Image Registration 是计算机视觉领域中的

随机推荐

L - Candy Machine

SDUT 2022 Spring Team Contest for 21 12 Virtual Judge JB loves candy very much One day he finds a candy machine with NN
SQLException之驱动版本不匹配

java sql SQLException Unknown initial character set index 255 received from server Initial client character set can be f
docker安装fastdfs

一准备docker环境二搜索fastdfs镜像三拉取镜像 docker pull delron fastdfs 选取delron fastdfs镜像的原因是包含了nginx不用自己安装nginx转发也可以选择qbanxiaoli
c++ this指针

this指针是c 中的一个关键字它在类中被自动隐藏了起来 this指针指向当前对象并且只能用在类的内部使用通过this指针我们可以访问类中的所有成员 public protect private class A public void
IDEA过期重置

过期重置 https blog csdn net zzztimes article details 117550423
win10电脑发现不了华为share_huaweishare打开电脑找不到手机

本帖最后由 lang dine 于 2020 1 26 22 37 编辑我的笔记本不是华为笔记本其他的网络设备都能搜索到唯独huawei手机搜索不到无法被搜到应该是huawei share的问题这个问题还能顺延出两个故障 win10
方波参考测试信号PI控制调试

要调试方波参考测试信号的PI控制可以按照以下步骤进行操作确保系统已经正确连接并且您已经设置了方波参考测试信号的频率和幅值配置PI控制器根据您的控制系统要求选择适当的PI控制器参数例如比例增益 Kp 和积分时间 Ki 这些参数可
c++虚函数和纯虚函数的区别

关于虚函数的定义是被virtual关键字修饰的成员函数关于纯虚函数的定义是是一种特殊的虚函数在许多情况下在基类中不能对虚函数给出有意义的实现把它声明为纯虚函数它的实现留给该基类的派生类去做这是是纯虚函数虚函数的简单实例定
Android9以后遇到的一些问题

Android9以后不能使用外存我遇到这个问题的时候没报错但就是无法成功创建文件报了找不到文件异常才发现问题 application的属性中添加一条属性请求使用遗留外存 android requestLegacyExternalSt
pm ux ui_ui与ux回顾2020年前端设计方面与重要性之间的差异

pm ux ui Why Because people use the terms UI and UX so interchangeably that I believe it is about time someone talks abo
【C++】函数返回vector

当程序中要返回vector时一般做法会将函数直接定义为 vector
Qt tabwidget中插入widget

一简单介绍 QT gt tabWidget 标签页面在ui中通过工具栏自定义拉取控件其中tabwidget可以可以创建多个标签页面默认生成两个tab widget tab 1 tab 2 并且可以在ui中右键自由添加控制删除等标签页
头歌python实训通关四——分支结构

第1关英制单位英寸与公制单位厘米互换任务描述本关任务编写一个能实现单位英寸与公制单位厘米的互换的函数相关知识为了完成本关任务你需要掌握 1 if条件语句编程要求根据提示在右侧编辑器补充代码实现单位英寸与公制单位厘米互换
关于 private static final long serialVersionUID = 1L

实现java io Serializable这个接口是为序列化 serialVersionUID 用来表明实现序列化类的不同版本间的兼容性如果你修改了此类要修改此值否则以前用老版本的类序列化的类恢复时会出错实现后如果你用的是工具的话
Java内省机制

Wiki上的解释在计算机科学中内省是指计算机程序在运行时 Run time 检查对象 Object 类型的一种能力通常也可以称作运行时类型检查不应该将内省和反射混淆相对于内省反射更进一步是指计算机程序在运行时 Run time
Log4Net(Logging for DotNet)学习笔记

系统支持 SystemFramework 提供系统的框架支持典型的如异常日志等也有现成的比如log4net 突然一种老朋友似的感觉涌上心头这不是我一直想要得到的吗一直想在的我系统加入的东西吗日志系统嘿嘿高兴啊本文从一个
开源数据库对比 H2, HSQLDB, DERBY, PostgreSQL, MySQL

H2 HSQLDB DERBY PostgreSQL MySQL
接口复习总结

第一章微型计算机系统概述 1 计算机硬件系统运算器控制器存储器输入和输出设备 2 接口的功能 I O端口编址方式统一编址和独立编址 CPU与接口数据交换技术无条件方式控制简单无需额外的硬件支出 CPU和外设之间只能串行工作
PyQt5执行shell

代码如下 from PyQt5 QtCore import QProcess from PyQt5 QtWidgets import QWidget QApplication QVBoxLayout QLineEdit QTextEdit
机器学习基础（一）——人工神经网络与简单的感知器

机器学习基础一人工神经网络与简单的感知器 2012 07 04 19 57 20 转载标签杂谈分类 machine learning 从最开始做数据挖掘而接触人工智能的知识开始就不断听学长老师说起神经网络算法从这个角度来讲

机器学习基础（一）——人工神经网络与简单的感知器

机器学习基础（一）——人工神经网络与简单的感知器

机器学习基础（一）——人工神经网络与简单的感知器 的相关文章

随机推荐

热门标签

机器学习基础（一）——人工神经网络与简单的感知器的相关文章