udacity上Google的深度学习笔记

2023-05-16

Udacity上deeplearning这门课是google开的,介绍了常见的几种深度神经网络模型,同时还附带了几个练习,并且练习用的工具都是tensorflow,所以既可以学习一下神经网络的知识,又可以学习tensorflow。我写的课后练习的代码都放到了我的githuh上(同时也是第一次用git,所以也学习了git的用法)https://github.com/haolexiao/udacity-deeplearning

L1从机器学习到深度学习

为什么最近几年深度学习/神经网络开始火了:

  1. 更便宜的GPU
  2. 更大规模的数据

分类问题是很多问题的基础:

  • 检测问题:诸如检测图片中是否有行人,Logo之类的。
  • 排序:诸如一个请求,搜索引擎返回跟query相关的网页,则可以设计一个分类器, 分的是成对的:query和网页,输出相关或者不相关。来这样建立分类器。
  • 回归
  • 强化学习

归一化

因为计算机的精度问题,所以必须要进行归一化

深度神经网络

既然MLP(三层神经网络)已经可以拟合任何函数了, 为什么要用多层神经网络?

  • 相较于让神经网络变得更宽,使得神经网络变得更深能够增加较小的参数就能够获得很好的效果
  • 深层的神经网络不同层之间往往呈现出层次化的特征,越往后的层,往往呈现出越复杂的特征。这个特征非常不错

为什么最近几年深度学习才火起来呢?

一个原因在于只有数据量足够大的情况下的深度神经网络才能发挥出比较好的效果,而只有在最近几年,学术界才接触到了大规模数据。
另外一方面,最近几年学术界才知道如何更好的用正则化方法训练很大的模型

防止过拟合的方法

  • 画出训练模型在验证集合的曲线,当开始出现过拟合的时候,停止训练。这种方法叫早停
  • 正则化方法

卷积神经网络

卷积网络提出的思路是基于权重共享的思想,有些东西不需要跟其位置有关,比如图片中人脸的位置,文本中某个特定名词出现的位置(在某些特定任务下)等等。不同位置的输入能够得到相同的信息。

提升卷积网络性能的方式:

  • POOLING池化,降低卷及网络特种图的空间范围。把几个相邻的卷积再进行合并。典型的一种池化方式就是最大池化Max Pooling,它的好处有

    • 没有增加新的参数,所以不会有过拟合的问题
    • 常常产生更好的精度
    • 减少了计算量

    还有平均池化,相当于模糊了图像。

  • 1*1卷积。只关注一个单个像素。
  • INCEPTION结构。inception非常有效的,就是每一层可以用许多不同类型的卷积,或者池化,最后把他们统一连接起来。

文本和序列的深度学习模型

Word Embedding

tSNE是比较适合用来可视化embedding结果的方式,因为如果用PCA这种传统方法的话,做出来的结果并不好,而tSNE这种方法能够最大限度的保留原空间中的相对距离信息。

RNN

如果说CNN是通过权值共享,来在不同空间来提取图像的模式。而RNN则是在时间序列上的权值共享。

RNN上的梯度下降

因为在时间上权值共享的关系,所以梯度下降算法其实对于RNN来说并不好,因为梯度下降更加偏向于相互之间无关联的参数更新,以保证训练时的稳定性。相关联的更新会使训练中的数学过程变得不稳定——梯度爆炸或者梯度消失,会使网络丢失训练对象。
对于梯度爆炸(Exploding Gradient):

  • 可以采用梯度剪裁的方法,即当其增长过大时,缩小步长

对与梯度消失(Vanishing Gradient):

  • 比较困难一些,因为梯度消失表明了模型只记住了近期的事件,这就需要LSTM了。用LSTM就是为了让RNN更好地记录过去很久的事情。

LSTM为什么有效

简单来说LSTM能够帮助模型在需要记忆的情况下记忆很久,在需要忘记的情况下,立刻忘记。最终导致消失的问题也被解决了。
L2正则话和Dropout也能用在LSTM中,不过需要用在输入层和输出层,而不是递归连接层

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

udacity上Google的深度学习笔记 的相关文章

  • 百度tangram框架开发工具小结

    根据在开发流程中出现的顺序 对每个工具简要介绍如下 firebug 几乎所有写html css js代码的人都熟悉的工具 tangram开发调试中用到 官方站点 http getfirebug com closure linter gjsl
  • Google云

    Google 云计算 Cloud Computing 是个新概念 但也不过是分布式处理 Distributed Computing 并行处理 Parallel Computing 和网格计算 Grid Computing 的发展 也许是一个
  • 原来早就有java代码规范

    happy 最近几天 研究代码规范 想给给公司制定一个代码规范 公司很小 目前还没有代码规范 这个东西很烦人 也很难产生作用 小公司一般不采用吧 但现在为了提高代码质量 也就需要考虑了 今天 发现早在1997年 SUN公司就制定了java代
  • 关于知识的理解与忘却

    关于知识的理解与忘却 在做项目的过程中 我会遇到一些难题 会通过baidu与google来解决 解决之后 我很少对这些知识进行总结 但是 将来又遇到这方面的知识时 我发现却很难再找到记忆中的那些文章 当初对于自己理解这些知识有很大影响的文章
  • 3个字节的空txt文本文件

    运行下面代码可以建立一个3个字节的空txt文本文件 想了解其原因的请参考文本文件的编码方式和unicode的具体资料 google上就有很多 System IO FileStream fs new System IO FileStream
  • 【深度学习

    文章目录 一 问题引入 二 如何读取路径呢 一 问题引入 当使用 torchvision datasets Celeba 加载 CELEBA 数据集时 我们如何获取文件的路径是一个问题 celeba torchvision datasets
  • zxing二维码的生成与解码(C#)(附例子)

    二维码的生成 using com google zxing qrcode using com google zxing using com google zxing common using ByteMatrix com google zx
  • ASP.NET系统用户权限设计与实现

    引言 电子商务系统对安全问题有较高的要求 传统的访问控制方法DAC Discretionary Access Control 自主访问控制模型 MAC Mandatory Access Control 强制访问控制模型 难以满足复杂的企业环
  • google扫码库barcode-scanning的使用

    一 加入barcode scanning库 捆绑模式扫码 implementation com google mlkit barcode scanning 17 1 0 二 编写扫码分析类 用于分析扫码数据并回调方法返回结果 package
  • word2vector学习笔记(一)

    word2vector学习笔记 一 最近研究了一下google的开源项目word2vector http code google com p word2vec 其实这玩意算是神经网络在文本挖掘的一项成功应用 本文是看了论文 Distribu
  • 中国猎头公司排名 (前十)

    4月3日 平时能够收到不少猎头公司排名评选的邀请 但自己一直怀疑这类排名评选的可行性和公信力 人为因素在这样的评选中占了太大的成分 因为喜欢搜索这个职业 所以我一直是一个谷歌Google的粉丝 Google的成功和深入人心和它坚持自己的 搜
  • 终于搞定了部分网站无法打开的问题

    最近机器出现一个烦人的问题 有些网站无法打开 最初以为是实验室网络的问题 后来发现别人的机器能打开 于是开始折腾自己的机器了 hosts文件没有异常 关掉杀毒软件 防火墙 症状依旧 在浏览器地址栏中敲入url回车之后 浏览器很快报错无法访问
  • ubuntu software center have problems,it cannot run.

    When I update my ubuntu 11 10 I meet this problem like following Items cannot be installed or removed until the package
  • 30个适合女生玩的可爱网站

    ugmbbc发布于 2008 03 20 13 30 12 2905 次阅读 字体 大 小 打印预览 感谢不要笑我的投递这次推荐给大家的都是非常好玩和可爱的网站 他们都拥有不错的技术和创意 这些网站尤其适合女孩子玩 当然cnBeta是一个罗
  • IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU损失函数分析及Pytorch实现

    IOU Loss 算法作用 Iou的就是交并比 预测框和真实框相交区域面积和合并区域面积的比值 计算公式如下 Iou作为损失函数的时候只要将其对数值输出就好了 def Iou loss preds bbox eps 1e 6 reducti
  • js利用google翻译接口把网页翻译成各国语言

    网页翻译为德语 Translate Page To German a href 网页翻译为德语 Translate Page To German a 网页翻译为西班牙语 Translate Page To Spanish a href a
  • [Binospace] Google-MegaStore的解读

    MegaStore是Google在BigTable之上实现了一个跨机房高可用的数据库 它提供了类似DB的数据分布 索引的功能 实现了在EntityGroup内部以及EntityGroup之间的事务性 并且通过Paxos协议实现在DC之间多备
  • 【计算机视觉】上游任务和下游任务的理解

    文章目录 一 前言概述 二 上游任务 三 下游任务 一 前言概述 计算机视觉中有常见的四大任务 分类 解决 what 定位 解决 where 检测 解决 what 和 where 分割 实例分割 语义分割和场景分割等像素级别的处理 二 上游
  • 【计算机视觉】最后显示的CIFAR-100数据集照片很模糊怎么解决?

    文章目录 一 前言 二 如何解决 2 1 使用图像增强技术 2 2 使用插值方法 2 3 使用更高分辨率的图像数据集 2 4 手动调整图像尺寸 三 总结 一 前言 如果从CIFAR 100数据集加载的图像显示模糊 可能有几个可能的原因 分辨
  • 最快的公共dns服务器_如何使用Google公共DNS服务器?

    最快的公共dns服务器 Google is a huge company that provides paid and free services It mainly operates in the IT and internet area

随机推荐

  • 阿里云轻量应用服务器使用教程

    阿里云轻量应用服务器怎么远程连接 xff1f 轻量服务器可以更换操作系统吗 xff1f 使用轻量应用服务器如何搭建网站 xff1f 轻量应用服务器端口如何开通 xff1f 阿里云百科来详细说下轻量服务器远程连接 搭建网站 开放端口等详细使用
  • 超详细!阿里内部都在用的K8S实战手册,新手看这一篇就够了

    一直关注云计算领域的人 xff0c 必定知道Kubernetes的崛起 如今 xff0c 世界范围内的公有云巨头 xff08 谷歌 亚马逊 微软 华为云 阿里云等等 xff09 都在其传统的公共云服务之上提供托管的Kubernetes服务
  • YOLO目标检测多种改进模型

    写于2020年11月 一 SlimYOLOv3 论文链接 xff1a arxiv org abs 1907 11093 代码链接 xff1a https github com PengyiZhang SlimYOLOv3 二 YOLOV3
  • 解决cv2.error报错解决方案

    问题摘要 xff1a 一般出现如下 xff1a 解决cv2 error OpenCV 4 2 0 C projects opencv python opencv 报错 cv2 error OpenCV 4 2 0 C projects op
  • YOLOv5网络结构分析

  • EraseNet:端到端的真实场景文本擦除方法

    六 相关资源 EraseNet论文链接 xff1a https ieeexplore ieee org document 9180003 EraseNet代码 xff1a https github com lcy0604 EraseNet
  • 《程序人生》

    对乔布斯和马斯克访谈的反思 xff1a 1 这个世界不在乎你的自尊 xff0c 只在乎你自我感觉良好的同时有所成就 说明大多数人的观点是 乌合之众 xff0c 必须有从想到去做到的能力 xff0c 面子是无能者维护尊严的盾牌 2 年轻时候一
  • DiffusionDet:Diffusion Model for Object Detection

    Diffusion Model for Object Detection 一种用于目标检测的扩散模型 Motivation 1 如何使用一种更简单的方法代替可查询的object queries 2 Bounding box的生成方式过去是三
  • springboot整合shiro的小demo(一)

    刚学shiro整合springboot xff0c 在此做一个笔记 xff0c 以便后期忘了查阅 本文分以下几个方面进行整合以及验证 xff1a 1 springboot项目搭建整合thymeleaf实现页面访问 2 springboot整
  • ChatGPT:通用人工智能设计范式方法

    通用人工智能设计范式未来发展方向 https openai com https riscv org 一 ChatGPT xff08 AIGC xff09 开启通用人工智能AGI新纪元时代 二 通用人工智能设计范式现状和方法 目前随着Chat
  • 格拉布斯法—异常值判断(异常值)

    数值数据类型 xff1a 方法一 xff1a Z Score 方法二 xff1a DBSCAN 方法三 xff1a Lsolation Forest 方法四 xff1a Mahalanobis距离 xff08 主要解决多元离散群点问题 xf
  • 你会为AI转型吗? 土豆的思考浅谈

    人工智能意味着什么 xff1f 终身学习与人工智能 复杂 读后感 0 经历 按照自己生活规律每天早上第一件事收发邮件这是昨天打开邮箱后看到的论文和相关论文推荐 xff0c 从1956年诞生以来到2013开始接触这个东西 xff0c 国内我曾
  • 神经网络的过去、现状、未来!

    从BP CNN RNN DCN GAN GNN图网络 GCN CAP三维卷积胶囊模型及融合 人工神经网络是计算智能和机器学习研究的最活跃的分支之一 xff0c 它是从人脑的生理结构出发探讨人类智能活动的机理 从 1943年 McCulloc
  • 场景理解类目标检测SENet

    论文 xff1a Squeeze and Excitation Networks 论文链接 xff1a https arxiv org abs 1709 01507 代码地址 xff1a https github com hujie fra
  • 目标检测发展方向(1)

    从目标检测发展到目标追踪 目标检测 xff08 监督学习 xff09 FasterRCNN CascadeRCNN YOLOX Complex YOLO SSD RetinaNet xff0c FOCS ATSS CornerNet Cen
  • 车道线检测与分割

    https github com amusi awesome lane detection VPGNet论文 xff1a https arxiv org abs 1710 06288 caffe 版code xff1a https gith
  • CAS单点登录原理解析

    1 基于Cookie的单点登录的回顾 基于Cookie的单点登录核心原理 xff1a 将用户名密码加密之后存于Cookie中 xff0c 之后访问网站时在过滤器 xff08 filter xff09 中校验用户权限 xff0c 如果没有权限
  • js中.?、??、??=的用法和含义

    前言 在项目中我们往往要做很多很多的空值判断进行容错处理 往往伴随着三目运算 与或 if else来使用 不仅要写很多冗余的代码 后期维护起来也是满屏的if else可以说是非常的痛苦了 今天分享几个处理空值简单的方法 希望可以解决大家的一
  • 服务器安装docker,拉取一些常用镜像

    1 购买服务器 xff08 系统centos7 6 xff09 2 在控制台中找到购买的服务器 xff0c 设置密码 xff0c 账号默认 root 3 开放需要的端口 xff0c 如nacos xff0c redis等等 4 使用Fina
  • udacity上Google的深度学习笔记

    Udacity上deeplearning这门课是google开的 xff0c 介绍了常见的几种深度神经网络模型 xff0c 同时还附带了几个练习 xff0c 并且练习用的工具都是tensorflow xff0c 所以既可以学习一下神经网络的