计算机视觉基础大纲

2023-05-16

计算机视觉思维导图大纲

------------------------------------------------------------------------------------------------------------------

1、GPU的概念

什么是GPU呢?首先说一下什么是GPU,GPU(Graphics Processing Unit)即图形处理器,又称显示核心,也就是显卡的核心,本来专门用于图形图像处理。

什么时候用GPU呢?GPU为什么比CPU计算能力强大?下面这张图比较直观的显示了GPU的强大计算能力。CPU计算核心少,顶多数十个,GPU计算核心多,几千个计算核心很常见。但两者的计算核心有显著不同,CPU的计算核心有复杂而强大的控制单元Control,但是有较少的计算单元ALU;GPU相反,控制单元简单,但是计算单元ALU数量众多。可以简单的理解为,GPU可以完成很复杂的任务,计算仅是其“副业”;而GPU一般仅做简单的计算任务,但是由于计算单元众多,可把计算任务瓜分,人多力量大,很快把任务做完。GPU特别适合大量并行的数据运算(高运算密度)。

image.png

GPU强于计算,但并不能独自完成复杂的任务,所以GPU通用计算通常采用所谓CPU+GPU异构模式,由CPU负责执行复杂逻辑处理和事务处理,由GPU负责计算密集型的大规模数据并行计算。CPU(加主机内存)充当主机Host的角色,GPU(加显存)充当设备Device的角色。Host与Device之间可以PCI-E总线进行通信,这样它们之间可以进行数据拷贝,协同工作。

2、计算机视觉2个主要研究维度

 

 

3、研究挑战

(1)视角变化

(2)光照变化

(3)尺度变化

(4)形态变化

(5)背景混淆干扰

(6)遮挡

(7)类内物体的外观差异

4、知识大纲

(1)计算机视觉的基础

  • 图像预处理
  • 图像特征及描述

(2)深度学习的理论基础

  • BP神经网络详解
  • 深度学习基础

(3)深度学习在计算机视觉中的应用

  • 图像分类 <————卷积神经网络CNN
  • 图像检测 <————区域卷积神经网络R-CNN
  • 图像分割 <————全卷积神经网络FCN
  • 图像描述 <————迭代神经网络RNN
  • 图像生成 <————生产对抗网络GAN

5、主要研究的问题

(1)图像预处理

  • 图像显示与存储原理
  • 图像增强的目标
  • 点运算:基于直方图的对比增强
  • 形态学处理
  • 空间域处理:卷积
  • 卷积的应用(平滑、边缘检测、锐化等)
  • 频率域处理:傅里叶变换、小波变换

(2)图像特征及描述

  • 颜色特征

          量化颜色直方图

          聚类颜色直方图

  • 几何特征

          Edge、Corner、Blob

  • 基于关键点的特征描述子

         SIFT、SURF、ORB

  • 其他特征提取(LBP、Gabor)

(3)深度学习之前的方法

  • 图像分割

       基于阈值、基于边缘

      基于区域、基于图论

  • 人脸检测

       Haar-like特征+级联分类器

  • 行人检测

         HOG+SVM

         DPM

(4)神经网络与深度学习基础

  • 神经网络

       神经元

       前馈网络

       梯度下降

       误差反向传播

  • 深度学习

       与传统神经网络的区别

       目标函数

       改进的梯度下降

       避免过适应

(5)识别——>内容是什么?

  • 人脸识别
  • 字符识别
  • 车牌识别
  • 行为识别
  • 步态识别

(6)基于深度学习的方法

         图片分类——>有没有?

(7)卷积神经网络CNN

  • 计算机视觉中的基础网络
  • 有监督深度模型时代的起点
  • AlexNet——>VGG——>GoogLeNet——>ResNet——>ResNeXt
  • GoogLeNet

        Inception V1——>V2——>V3——>V4

        Inception ResNet V1——>V2

  • 结构趋势

       更深(Depth):8层——>1000+层

       更宽(Width):1分支——>4+分支

       更多基数(Cardinality):1——>32

(8)区域卷积神经网络R-CNN

(9)全卷积神经网络FCN

(10)递归神经网络RNN

(11)生成对抗网络GAN

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计算机视觉基础大纲 的相关文章

  • 如何在 Ubuntu 20.04 上安装和使用 Docker Compose

    本文最先发布在 xff1a https www itcoder tech posts how to install and use docker compose on ubuntu 20 04 Docker Compose 是一个命令行工具
  • 如何在 Ubuntu 20.04 上安装 VirtualBox

    本文最先发布在 xff1a https www itcoder tech posts how to install virtualbox on ubuntu 20 04 VirtualBox 是一个开源的 xff0c 跨平台的虚拟化软件 x
  • 如何在 Ubuntu 20.04 启用 SSH

    本文最先发布在 xff1a https www itcoder tech posts how to enable ssh on ubuntu 20 04 Secure Shell SSH 是一个网络协议 xff0c 它主要被用来加密客户端和
  • 如何在 Ubuntu 20.04 上安装 Vagrant

    本文最先发布在 xff1a https www itcoder tech posts how to install vagrant on ubuntu 20 04 Vagrant是一个命令行工具 xff0c 用于构建和管理虚拟开发环境 默认
  • 如何在 Ubuntu 20.04 上安装 GCC(build-essential)

    本文最先发布在 xff1a https www itcoder tech posts how to install gcc on ubuntu 20 04 GNU 编译器集合是一系列用于语言开发的编译器和库的集合 xff0c 包括 C C
  • 如何在 Ubuntu 20.04 上安装和配置 Redis

    本文最先发布在 xff1a https www itcoder tech posts how to install and configure redis on ubuntu 20 04 Redis 是一个开源的在内存存储键值对数据的存储程
  • 如何在 Ubuntu 20.04 上安装 PHP

    本文最先发布在 xff1a https www itcoder tech posts how to install php on ubuntu 20 04 PHP 是世界上使用广泛的服务端编程语言之一 很多著名的 CMS 和框架 xff0c
  • 用python轻松完成一个分布式事务TCC,保姆级教程

    什么是分布式事务 xff1f 银行跨行转账业务是一个典型分布式事务场景 xff0c 假设A需要跨行转账给B xff0c 那么就涉及两个银行的数据 xff0c 无法通过一个数据库的本地事务保证转账的ACID xff0c 只能够通过分布式事务来
  • 如何在 Ubuntu 20.04 上安装 Spotify

    本文最先发布在 xff1a https www itcoder tech posts how to install spotify on ubuntu 20 04 Spotify是一个音乐流媒体服务商 xff0c 它可以让你和无数的歌曲亲密
  • SSH 操作实践指南

    本文最先发布在 xff1a https www itcoder tech posts ssh practice SSH 是我们经常要和远程服务器交互使用的工具 下面是一些实践中总结的 SSH 操作经验 xff1a 一 如何选择 SSH ke
  • 如何在 Ubuntu 20.04 上安装 R

    本文最先发布在 xff1a https www itcoder tech posts how to install r on ubuntu 20 04 R 是一门开源编程语言和自由的环境 xff0c 主要用于统计分析 绘图 它由 R 基金会
  • 如何在 Ubuntu 20.04 上安装 Mono

    本文最先发布在 xff1a https www itcoder tech posts how to install mono on ubuntu 20 04 Mono 是一个平台 xff0c 基于 ECMA ISO 标准 xff0c 用于开
  • 如何在 Ubuntu 20.04 上安装和使用 Composer

    本文最先发布在 xff1a https www itcoder tech posts how to install and use composer on ubuntu 20 04 Composer 是一个 PHP 依赖管理器 xff08
  • 3分钟在线开通优惠费率的微信支付商户号(商户收款码)

    1 问 xff1a 为什么要开通微信商户号 xff1f 答 xff1a 因为微信个人收款 xff0c 不支持信用卡支付 xff0c 无法提供经营报表 xff0c 无法支持线上支付等 关于微信个人收款码与商家码区别 xff0c 参考 xff1
  • 设置git使用vimdiff比较差异

    原文 xff1a http hi baidu com drdr blog item 57de1e95665a81047af48062 html 修改git的如下2条配置 xff1a git config global diff tool v
  • YUV图像格式

    原文 xff1a http blog csdn net zhongnanjun 3 article details 3934938 YUV xff08 亦称YCrCb xff09 是被欧洲电视系统所采用的一种颜色编码方法 xff08 属于P
  • mime types 大全--来自ubuntu /etc/mime.types

    MIME TYPES and the extensions that represent them The format of this file is a MIME type on the left and zero or more fi
  • VUE3中运用axios处理后端数据

    xff08 1 xff09 在src下新建一个http文件夹 xff0c 文件夹下新建一个index js xff08 2 xff09 在index js文件中引入axios xff08 3 xff09 在index js里面写axios实
  • leveldb性能调优

    许多的nosql都使用leveldb或者类似leveldb的系统作为存储引擎 xff0c 例如tair xff0c hbase xff0c canssandra xff0c 因此理解并调优存储引擎可以大大的提高系统的性能 前一篇大致介绍了原

随机推荐

  • Android 重启 不开机 Backtrace 分析

    此文摘自 mtk online Android 在发生crash 时可以通过 backtrace 定位发生的的位置 xff0c 方便进一步来 fix issue 1 Java Backtrace 从Java Backtrace 我们可以知道
  • SQL Server 2016 OPENJSON忽略大小写

    使用WITH子句OPENJSON将输入JSON表达式中的键与该WITH子句中的列名进行匹配 xff0c 是区分大小写 xff0c 可以使用条件聚合以忽略大小写 xff1a DECLARE 64 JSON varchar max 61 39
  • 论文解读:自适应参数控制方案介绍——Effect Assessment

    Adaptive Probabilities of Crossover and Mutation in Genetic Algorithms TCYB 1994 动机自适应 p c p c
  • SHELL自动化运维

    第1章 shell脚本 1 1 shell 简介 shell 的定义 xff1a span class token number 1 span 在计算机科学中 xff0c Shell就是一个命令解释器 span class token nu
  • iOS tableView cell高度自适应 两种方法

    最近在开发遇到cell高度不确定的情况 xff0c 主要原因是cell里面的label的高度是不确定 从而导致cell高度不确定 我找到了两种解决方案 第一种 利用iOS8的新特性 xff0c 自动计算cell的高度 第二种 自己计算每个c
  • Mysql:is not allowed to connect to this MySQL server

    Mysql is not allowed to connect to this MySQL server 如果你想连接你的mysql的时候发生这个错误 xff1a ERROR 1130 Host 39 192 168 1 3 39 is n
  • 编程题#5:细菌实验分组 C语言

    先求出繁殖率放到value 100 里 然后用bubble int arraynum int arrayvalue int nn 冒泡排序算法对繁殖率value和培养皿编号num从大到小排序 记录繁殖率高的培养皿个数bignum 从大到小输
  • 【Mysql基础】使用limit限制结果集的位置和大小

    使用下面的语句来限制结果的大小和位置 xff1a SELECT FROM table LIMIT offset rows rows OFFSET offset LIMIT 子句 指定SELECT 语句返回指定的记录数 LIMIT 接受一个或
  • 拓扑排序的实现

    拓扑排序的定义 xff1a 实现思路 xff1a 首先设置一个队列专门存储入度为0的点 xff0c 同时用vector建立邻接链表 xff1b 将邻接链表建立完成之后 xff0c 首先选取入度为0的点加入队列中 xff1b 当队列不为空时
  • 非阻塞/异步(epoll) openssl

    前段时间在自己的异步网络框架handy中添加openssl的支持 xff0c 当时在网络上搜索了半天也没有找到很好的例子 xff0c 后来自己慢慢的摸索 xff0c 耗费不少时间 xff0c 终于搞定 因此把相关的资料整理一下 xff0c
  • Centos7离线rpm安装MySQL-5.7.29【推荐】

    Centos7离线rpm安装MySQL 5 7 29 一 彻底卸载系统原装的MySQL 1 查找mysql进程 如果查到的结果不为空 xff0c 则进入第2步卸载mysql rpm qa grep i mysql 2 卸载mysql 停止m
  • 使用Flask-Script支持命令行选项

    Flask 的开发 Web 服务器支持很多启动设置选项 xff0c 但只能在脚本中作为参数传给 app run 函数 这种方式并不十分方便 xff0c 传递设置选项的理想方式是使用命令行参数 Flask Script 是一个 Flask 扩
  • 自定义alert,并添加回调函数

    需求 xff1a 一些自定义的alert只是简单的页面效果 xff0c 不能做到中断js xff0c 有了回调函数后 xff0c 自定义的弹出窗点击之后 xff0c 就能执行回调函数了 在一些登录场景很有用 xff0c 登陆失败后 xff0
  • 解决了设置了Access-Control-Allow-Origin: *还是跨域的问题。

    说起跨域请求 大家首先想到的就会是设置请求头Access Control Allow Origin 但是有时候只设置这么一样还是解决不了的跨域问题就要分的比较细的设置请求头了 xff1a access control allow heade
  • flex布局

    flex布局 一 布局 块级元素flex布局 span class token property display span span class token punctuation span flex span class token pu
  • Docker 容器启动 mysql -V 挂载数据目录 备份数据

    请大神们多多指点评论 xff0c 不胜感激 1 通过 docker 下载 mysql 8 0 1 镜像 2 创建文件备份目录 mkdir p home mysql conf logs data mysql 3 my cnf 文件 大概是这样
  • Debian6原因Debian官方删掉了8以下的文件,只能连阿里云的源

    参考https lowvps cn debian 8 apt source 404 201904 qiang外服务器 xff0c 能连上阿里云的源 xff0c 官方的源连不上了 404 修改 etc apt source list文件为 x
  • qt/qtcreator在Arm架构下的安装

    环境 xff1a 银河麒麟系统 xff0c linux arm架构 1 安装zlib zlib下载地址 xff1a http www zlib net 解压后 xff0c 看里面README文件 xff0c 编译安装分为几步骤 xff1a
  • sqlite bolb数据的写入和存储

    1 什么是BLOB数据 BLOB binary large object 即二进制大对象 xff0c 是一种可以存储二进制文件的容器 在计算机中 xff0c BLOB常常是数据库中用来存储二进制文件的字段类型 常见的BLOB文件有图片 声音
  • 计算机视觉基础大纲

    计算机视觉思维导图大纲 1 GPU的概念 什么是GPU呢 xff1f 首先说一下什么是GPU xff0c GPU Graphics Processing Unit 即图形处理器 xff0c 又称显示核心 xff0c 也就是显卡的核心 xff