AI实战:深度学习必须使用大量数据?数据量对深度学习的重要性可能超乎你的想象!

2023-10-27

前言


最近,几个CV相关的项目陆续暴露出识别准确率不高的问题,导致客户反应强烈。其实在项目初期时我就指出过,只有千级的训练数据是无法训练出一个准确率高的模型的。

在此写一篇博文记录一下。



正文


《数据量不够大,别玩深度学习》

2017年 Jeff Leek 在 Simply Stats 上发表了一篇题为《数据量不够大,别玩深度学习》(Don’t use deep learning your data isn’t that big)的博文。

作者指出,当样本数据集很小时,简单的线性模型也能优于深度网络模型的。

为了证明自己的论点,Leek 举了一个基于 MNIST 数据库进行图像识别的例子,分辨 0 或 1。当用仅 80 个样本的 MNIST 数据集中进行 0 和 1 的分类时,一个简单的线性预测器要比深度神经网络的预测准确度更高。

原文链接:You can probably use deep learning even if your data isn’t that big



谷歌与CMU联合发文:审视数据对深度学习的重要性

深度学习在视觉问题上所取得的成功可归因于以下几点:

  • 高容量模型;

  • 高速增长的计算力;

  • 大规模标记数据的可用性

原文链接:Revisiting Unreasonable Effectiveness of Data in Deep Learning Era



Why go large with Data for Deep Learning?

  • 从原理了解为什么需要大量训练数据

    1957年,弗兰克罗森布拉特设计了第一个模拟单个神经元活动的rst感知器。

    感知器(感知机)如下图所示:
    在这里插入图片描述
    线性单元如下图所示:
    在这里插入图片描述

    神经网络如下图所示:
    在这里插入图片描述
    卷积神经网络的示意图:
    在这里插入图片描述一个卷积神经网络由若干卷积层、Pooling层、全连接层组成。你可以构建各种不同的卷积神经网络,它的常用架构模式为:

    INPUT -> [[CONV]*N -> POOL?]*M -> [FC]*K


  • 以图像识别为例子

    图像识别是神经网络应用的主要领域之一,涉及识别隐藏在数据像素后面的大量特征。为了获取这些特征,采用了多层感知机。
    在这里插入图片描述
    常用反向传播将输出与训练数据的误差进行比较,并计算输出中的误差。然后,紧靠输出层的层会调整其权重,导致后续内层中的权重调整,直到错误率降低。

    深度学习需要大量不同实例的数据集,模型从中学习要查找的特征并生成带有概率向量的输出。

  • 深度学习的性能能否提升取决于数据集的大小

    模型学习的参数越多,训练所需的数据也会增加。否则,具有更多维数和小数据的问题会导致过拟合。

    为了验证大数据的必要性,我们来看看2个大容量训练数据的成功应用场景

    1、Facebook上著名的现代人脸识别系统称为“DeepFace”,部署了一套4000多个身份的4百万面部图像,并且在带标签的数据集上达到了97.35%的准确率。

    2、Alex Krizhevsky与Geoffrey Hinton等其他学者,描述了一个涉及手眼协调的机器人抓握学习模型。为了训练他们的网络,共收集了800,000次抓握尝试,机器人手臂成功地学习了更多种类的抓握策略。


原文链接:Why go large with Data for Deep Learning?

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

AI实战:深度学习必须使用大量数据?数据量对深度学习的重要性可能超乎你的想象! 的相关文章

随机推荐

  • 如何理解jquery的$(".span").eq(0) 和 $(”.span“)[0]

    span class span 1 span span class span 2 span span class span 3 span span class span 4 span span 选择了4个span 都是jquery对象 可以
  • 第一章:走进scratch3.0

    第一章 Scratch中国 想象 创作 编程 分享 scratch cn cn 离线版桌面版下载 exe结尾是 windows版 dmg是 macOS 苹果 版 点击下方链接下载 链接 https pan baidu com s 1wwrK
  • ALtium 16等长布线、差分布线

    等长布线 1 先布好线 2 定义一个class design classes 下图右键net classes add classes 之后定义这个class的名字 例如dc 选择要等长的网络加入这个dc 之后close即可 3 tools
  • 毕业设计-基于机器学习的股票预测

    目录 前言 课题背景和意义 实现技术思路 一 传统股票预测模型 二 新型股票预测方法 实现效果图样例 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备 一边要为毕业设计耗费大量精力 近几年各个学校
  • ImportError: No module named psutil的解决

    系统版本 cat etc redhat release CentOS release 6 9 Final 跑python脚本的时候报错ImportError No module named psutil 于是想要用pip来安装 但是发现pi
  • 关于source中的TARGETLIBS和SOURCELIBS的区别

    摘自 http topic csdn net u 20090403 11 897684cc 3eca 40f4 90d7 88e501669efe html 转自微软MVP作者 ARM WinCE 1 Dirs文件 关于Dirs文件 就是指
  • Win10 环境配置 Github SSH Key

    使用 Git 关联远程仓库通常可以使用 HTTP 协议或者 SSH 协议 在使用上 SSH 只需要一次配置 之后提交操作都不需要进行用户密码验证 但是 HTTP 方式每次 Push 操作都需要验证用户名和密码 当然 HTTP 方式更方便开源
  • 互联网摸鱼日报(2023-09-13)

    互联网摸鱼日报 2023 09 13 36氪新闻 节能减排 科技降碳 上海打造绿色商场的N种实践 36氪独家 美团管理层迎来重大变化 5位业务负责人晋升为副总裁 险资牵手上市公司狂出手 800亿给了谁 没空旅行的年轻人 开始互换特产 国产手
  • 手把手教你用python一键抢12306火车票(附代码)

    哈喽 哈喽 一年一度的抢火车票大战正式拉开序幕 然饿大多数人碰到的是这种情况 当你满心期待摩拳擦掌准备抢票的时候 你会发现一票难求 想回趟家真难 那么作为程序猿的你 当然要用程序猿的方式来抢票 下面分享用python来抢票 欢迎关注公众号
  • 电脑照片,怎么把电脑照片传到iphone手机 将电脑照片传到iphone方法【图文】

    使用苹果设备的人一定知道苹果自带的iOS系统是不可以随便进行数据的交换的 必须使用iTunes软件进行传输 但是让一些对不懂苹果设备的人带来了很多困扰 电脑当中的图片如何传输到苹果设备当中呢 下面我们就一起来看看怎么把电脑照片传到iphon
  • ZOJ 1610 Count the Colors

    Problem acm zju edu cn onlinejudge showProblem do problemCode 1610 Reference blog csdn net shuangde800 article details 8
  • 单元二:全桥MOS/IGBT电路(后端全桥电路的搭建)

    本篇博客是全桥MOS IGBT电路搭建的介绍 想了解全桥电路的驱动部分请看博主的单元一 全桥驱动电路详解 感兴趣的可以添加博主QQ 2859340499 B站对应讲解本文链接 逆变电路 Inverter Circuit 是与整流电路 Rec
  • 华为荣耀七能升级鸿蒙系统吗,华为鸿蒙系统来了,你知道哪些华为手机荣耀手机可以升级吗?...

    从鸿蒙系统第一次开始登场 到现在慢慢有许多鸿蒙系统设备出现 手机市场的格局似乎又要升级变化了 科技树儿了解到 在某数码博主经过和相关人员的沟通核实之后 目前暂定的是搭载华为麒麟710芯片以上的机型 无论华为或荣耀 都会升级华为鸿蒙Harmo
  • 深入理解Java比较器(Comparable和Comparator)

    深入理解Java比较器 Comparable和Comparator 文章目录 深入理解Java比较器 Comparable和Comparator 一 Comparable 1 Comparable 接口定义 二 Comparator 比较器
  • 6.11行为型---解释器模式

    在软件开发中 会遇到有些问题多次重复出现 而且有一定的相似性和规律性 如果将它们归纳成一种简单的语言 那么这些问题实例将是该语言的一些句子 这样就可以用 编译原理 中的解释器模式来实现了 虽然使用解释器模式的实例不是很多 但对于满足以上特点
  • vue实现导出excel,pdf功能

    实现导出excel pdf功能 注 代码中res就是后端返回的是文件流 前端使用a标签实现导出excel pdf 导出pdf跟excel的区别在于new blob对象时的type类型不同 下面代码是固定写法 可以直接使用 亲测有用哦 导出p
  • 【面试题】: bs架构与cs架构的区别以及各自优缺点

    一 前言 bs架构 Browser Server Architecture 和cs架构 Client Server Architecture 是常见的软件系统架构 bs架构是一种基于Web浏览器和Web服务器互联的架构 而cs架构则是一种由
  • 【VUE】npm install报错“found * vulnerabilities( * high), run npm audit fix, or npm audit”相关问题的解决

    前言 一个vue2的项目 从mac上传到gitee 然后windows clone之后npm install报错 原因 核心问题是node版本问题 windows11下载了node v16 然后版本过高导致各种无法resolve 需要降级为
  • 牛客模拟面试7月19

    说一说常用的 Linux 命令 常用的 Linux 命令有 命令 说明 cd 切换当前目录 ls 查看当前文件与目录 grep 通常与管道命令一起使用 用于对一些命令的输出进行筛选加工 cp 复制文件或文件夹 mv 移动文件或文件夹 rm
  • AI实战:深度学习必须使用大量数据?数据量对深度学习的重要性可能超乎你的想象!

    前言 最近 几个CV相关的项目陆续暴露出识别准确率不高的问题 导致客户反应强烈 其实在项目初期时我就指出过 只有千级的训练数据是无法训练出一个准确率高的模型的 在此写一篇博文记录一下 正文 数据量不够大 别玩深度学习 2017年 Jeff