2022 年您需要了解的 10 大计算机视觉框架

2023-05-16

计算机视觉是一个快速发展的科学领域,它处理从数字图像和视频中提取信息以获得对环境的高级理解。

该技术主要应用于机器人、增强现实和自动驾驶汽车中的复杂问题,例如物体检测、导航空间测量、面部识别、动作和活动识别、驱动视觉和人体姿态估计。

关键目标是了解人类视觉在 3D 世界中的工作原理,并将其转化为构建算法,以便在数码相机之前确定物体的结构和类型、控制计算机系统或为人们提供有关物体的信息.

这是计算机视觉应用的非详尽列表。

2022年主流10 大计算机视觉框架

通用场景识别使我们能够通过将照片与 Google 上的数十亿张照片进行比较以找到最佳匹配来识别照片的拍摄位置。

1、谷歌云的Vision API

Google Cloud 的 Vision API 是一种易于使用的图像识别技术,可让开发人员通过应用强大的机器学习模型来了解图像的内容。它通过 REST 和 RPC API 提供强大的预训练机器学习模型。它还使开发人员可以轻松地将关键视觉检测功能集成到应用程序中,包括面部和地标检测、图像标记、光学字符识别 (OCR) 和显式内容标记。它还允许我们为图像分配标签并快速将它们分类为数百万个预定义的类别。它可以帮助我们检测物体和面部,阅读印刷和手写文本,并将有价值的元数据构建到您的图像目录中。

2.YOLOv3

YOLO(You Only Look Once)是最先进的实时对象检测系统,是最广泛使用的基于深度学习的对象检测方法之一。它将对象检测视为一个回归问题,使用单个前馈卷积神经网络直接从完整图像预测类别概率和边界框偏移。它使用 k-means 聚类方法来估计预测边界框的初始宽度和高度。YOLOv3 消除了区域提议生成和特征重采样,并将所有阶段封装在单个网络中,形成真正的端到端检测系统。

3. TensorFlow

Tensorflow 是一个免费的开源框架,用于创建算法以开发用户友好的图形框架,称为 TensorFlow 图形框架 (TF-GraF),用于对象检测 API,广泛应用于农业、工程和医学领域的复杂任务的高效解决. TF-GraF 为业余爱好者和初学者提供独立的虚拟环境来设计、训练和部署机器智能模型,而无需在客户端进行编码或命令行界面 (CLI)。

TF-GraF 支持 SSD、Faster-RCNN、RFCN 和 Mask-RCNN 的灵活模型选择,包括卷积神经网络(inceptions 和 ResNets)。TF-GraF 负责设置和配置,允许任何人在他们的项目中使用深度学习技术,而无需安装复杂的软件和环境。

4. Libfacedetection

libfacedetection 是一个用于图像中人脸检测的开源库。它为图像中基于 CNN 的人脸检测提供了预训练的卷积神经网络,使用户能够检测尺寸大于 10×10 像素的人脸。在 C 源文件中,CNN 模型已转换为静态变量。源代码不依赖于任何其他库。您需要一个可以在 Windows、Linux、ARM 和任何平台下编译源代码的 C++ 编译器。SIMD 指令用于加速检测。如果您使用 Intel CPU 或 NEON for ARM,您可以启用 AVX2。

5.Raster Vision

Raster Vision 是一个开源 Python 框架,用于在卫星、航空和其他大型图像集(包括倾斜的无人机图像)上构建计算机视觉模型。它允许没有任何深度学习或机器学习工作流专业知识的用户快速重复配置实验,包括分析训练数据集、创建训练芯片、训练模型、创建预测、评估模型、捆绑模型文件和部署。

Raster Vision 内置支持使用 PyTorch 和 Tensorflow 进行芯片分类、对象检测和带有后端的语义分割。用户可以在内置支持使用 AWS Batch 在云中运行的 CPU 和 GPU 上执行实验。该框架还可以扩展到新的数据源、任务(例如,对象检测)、后端(例如,TF 对象检测 API)和云提供商。

6.SOD

SOD 是一个嵌入式的、现代的跨平台计算机视觉和机器学习软件库。它公开了一组用于深度学习、高级媒体分析和处理的 API,包括在计算资源和物联网设备有限的嵌入式系统上进行实时、多类对象检测和模型训练。

SOD 旨在为计算机视觉应用程序提供通用基础架构,并加速机器感知在开源和商业产品中的使用。SOD 专为提高计算效率而设计,重点关注实时应用,包括一套全面的经典和最先进的深度神经网络及其预训练模型。

7.Face_recognition

Face_recognition 是世界上最简单的 Python 和命令行面部识别 API。使用 dlib60 最先进的人脸识别技术构建深度学习,它可以从 Python 或命令行识别和操作人脸。该模型在 Wild61 基准中的 Labeled Faces 上的准确率为 99.38%。它提供了一个简单的 face_recognition 命令行工具,可让您从命令行对图像文件夹进行人脸识别!

8. DeepFaceLab

DeepFaceLab 是一个开源深度伪造系统,它利用机器学习在视频中进行照片般逼真的人脸交换。它提供了一个命令式且易于使用的管道,包括数据加载和处理、模型训练和后处理,供人们在不全面了解深度学习框架或不编写复杂样板代码的情况下创建深度伪造视频。这个最先进的框架提供了一个完整的命令行工具,其中包含管道的各个方面和功能,如傻瓜相机。值得注意的是,超过 95% 的深度伪造视频是使用 DeepFaceLab 创建的。

9. JeelizFaceFilter

JeelizFaceFilter 是一个轻量级且强大的人脸跟踪库,专为增强现实人脸过滤器而设计。这个 JavaScript 库可以从使用 WebRTC 捕获的网络摄像头视频源中实时检测和跟踪人脸。用于为增强现实应用叠加 3D 内容,它可以支持 Three.js、Babylon.js、FaceSwap、Canvas2D、CSS3D 等各种集成,使开发人员能够直接从浏览器解决计算机视觉问题。关键功能包括人脸检测、人脸跟踪、人脸旋转检测、张口检测、多人脸检测与跟踪、具有高清视频能力的视频采集等。

10.OpenCV

OpenCV 是一个开源计算机视觉和机器学习软件库,旨在为计算机视觉应用程序提供通用基础架构并加速机器感知在商业产品中的使用。获得 BSD 许可的产品 OpenCV 使企业可以轻松地使用和修改代码。该库拥有 2500 多种优化算法,包括一整套经典和最先进的计算机视觉和机器学习算法。

这些算法可用于检测和识别人脸、识别对象、对视频中的人类行为进行分类、跟踪摄像机运动、跟踪移动对象、提取对象的 3D 模型以及从立体摄像机生成 3D 点云。它可以将图像拼接在一起以生成整个场景的高分辨率图像,从图像数据库中查找相似图像,从使用闪光灯拍摄的图像中去除红眼,跟踪眼球运动,识别风景并建立标记以将其与增强现实叠加。

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

2022 年您需要了解的 10 大计算机视觉框架 的相关文章

  • Numpy二维数组遍历与二维数组切片后遍历效率比较

    在python numpy使用中 xff0c 可以用双层 for循环对数组元素进行访问 xff0c 也可以切片成每一行后进行一维数组的遍历 代码如下 xff1a span class token keyword import span nu
  • STM32外部中断给AB相编码器计数异常处理

    现象 楼主想实现的功能是使用编码器来实现电机旋转固定的圈数 xff0c 做一个位置闭环 在电机排线 xff08 电源线 43 编码器线 xff09 为30cm时 xff0c 计数正常 xff0c 当线长到40cm时会出现无法到达指定的位置
  • LINUX绑定usb设备名称

    LINUX绑定usb设备名称 起因 xff1a USB转TTL串口通信模块 xff0c USB摄像头模块连接linux电脑时 xff0c 其端口号一般是ttyUSB0 ttyUSB1 ttyUSB2 或video0 video1 video
  • KEIL中查看程序的存储空间的大小

    Program Size Code 61 86496 RO data 61 9064 RW data 61 1452 ZI data 61 16116 Code是代码占用的空间 xff0c RO data是 Read Only 只读常量的大
  • Mysql安装教程5.7(理论通用)

    1 首先在官网下载 mysql 地址 2 下载完成解压 默认在 C Program Files MYsQL 我下面统一使用该地址 想安装到 D 盘就提前建个文件夹命名为 MYSQL 解压进去 3 在MYSQL安装目录下 xff08 C Pr
  • Debia安装和配置dns服务

    首先下载dns服务 接着查看本机的ip地址 xff08 本机为172 16 100 201 之后统一为此ip xff09 设置本地的主服务器地址 xff0c 本机即是主服务器 xff0c 如在其他设备上在这里将namserver修改成其他设
  • Debian安装和配置chrony服务器

    首先准备两台或者两台以上debain进行配置 服务器 apt install chhrony nano etc chrony chhrony conf 添加以下内容 server 172 16 100 201 iburst 此处是chron
  • 锂电池充电(TP4056A芯片)电路分享

    描述 xff08 资料来源文档 特点 封装 引脚功能 应用电路分享 检测电池温度 xff0c 电池温度异常指示和充电状态指示应用 适合需要充电状态指示 xff0c 但不监测温度 xff08 左边 xff09 xff0c 既不需要充电状态提示
  • 利用snapper实现archlinux的系统还原

    首先 xff0c 安装snapper和btrfs progs pacman S snapper btrfs progs 创建配置文件 snapper c cfg home create config f btrfs home snapper
  • --secure-file-priv为Null且修改无效问题

    试过很多方法 xff0c 发现修改无效的根本原因是我的my ini在data文件夹中 xff0c 应该放在有效文件夹里 在命令行输入 mysql help 发现有这样一行 它的意思是c盘或者D Program Files MySQL mys
  • 在python利用代码进行简单的数学运算

    在这里我们会简单说一下在python中用代码进行数学运算 python的运算顺序 和数学里是一样的 xff1a 加减乘除 xff0c 在键盘上加减符号都有 xff0c 而乘除我们用星号 和正斜杠 表示 xff0c 次方用 表示 比如2的三次
  • Linuxshell脚本之菜单以及函数

    目录 一 菜单 1 查看菜单格式 2 简单菜单小脚本 二 函数 1 作用 2 基本格式 3 查看函数 4 删除函数 5 函数的返回值 6 函数的传参数 7 函数变量的作用范围 8 递归 三 数组 1 定义数组格式 2 数组类型包括 四 总结
  • ECS基本概念 一

    基本概念 ECS xff08 Entity Component System xff09 由三部分组成 Entity 是一个id xff0c 目的是将Component逻辑地分组在一起 xff0c 在源码中是一个结构体 xff0c 包含一个
  • cas开发遇到bug总结

    1 keytool工具java io IOException Keystore was tampered with or password was incorrect 原因有两种 xff1a 1 密码被修改过了 xff0c 所以证书无法通过
  • 【Unity游戏开发】SDK接入与集成——小白入门篇

    阅读目录 一 简介二 浅谈常用的两种接入方案三 开始接入 xff01 Unity与Android的交互四 结语 回到顶部 一 简介 通常一款游戏开发到后期 xff0c 一般都会涉及到第三方SDK的接入与集成 xff0c 对于不熟悉SDK接入
  • Unity 音频从某一时间开始播放

    最近在做一个音乐类的项目 xff0c 遇到了音乐追帧问题 xff0c 记录一下 挺简单的一个问题 xff0c 在百度上搜了好久 xff0c 然后跟着看到的唯一一篇博客试了试 xff0c xff08 当时还以为终于找到了 xff09 xff0
  • GameFramework框架解读(AB打包、加载、热更流程 基于《Star Force》Demo)

    目录 1 单机模式 xff08 1 xff09 先打包进行设置 xff1a xff08 2 xff09 Start Build Resources 得到文件 2 热更 流程 xff08 1 xff09 修改第一步中的Resource 如图
  • Unity 改变物体顶点色

    扩展方法 xff1a Mesh的部分信息展示 xff1a Mesh挂上顶点采样shader xff1a
  • java对字符串数组进行排序

    import java util Arrays import java util Random public class Arrays o3 public static void main String args 自定义字符串 String
  • 判断某一点是否在包围盒内:Bounds.Contains

    蒙皮网格获取方法 xff1a SkinnedMeshRenderer xff1a m Bounds 61 colliderTran GetComponent lt SkinnedMeshRenderer gt sharedMesh boun

随机推荐

  • 关于协程记录一下

    void Start Print 61 Prints private IEnumerator Print void Update if Input GetKeyDown KeyCode S StartCoroutine Print if I
  • Android 10 安装兼容

    android exported 61 true
  • Unity 查Crash

    首先获得堆栈信息 xff0c AS 然后找Unity的NDK目录下的arm linux androideabi addr2line xff08 对应arm v7 xff09 xff0c 或者aarch64 linux android add
  • Unity TextMeshPro 毛边问题

    如图所示 xff1a 边缘像素透明度拉高了 结果是因为开了主相机的Post Processing 加低级抗锯齿 xff08 FXAA xff09 导致的 如图 xff1a 关闭Post Processing 或者关闭抗锯齿可解决 也可采用高
  • UnityWebRequest 本地读StreamingAssets写入persistentDataPath(坑啊)

    下文为自己以前写的 博客 xff0c 可谓打脸啊 xff08 知其然不知其所以然 xff09 以下为 Android 环境 本地读写数据 xff08 踩的坑 xff09 xff1a UnityWebRequest 加载本地文件的时候需要加
  • Application.logMessageReceived

    监听Unity的打印事件 xff0c 如常规打印 xff0c 报错等等 如下代码为自制的打印日志 xff1a List lt string gt mWriteTxt 61 new List lt string gt void OnEnabl
  • Unity编辑器篇(一)Scene界面

    xff08 一 xff09 xff0c 向屏幕中心发射一条射线 lastActiveSceneView 类似于 Game场景的相机 xff0c xff08 其实我也没搞懂是什么东西 xff09 Ray ray 61 SceneView la
  • 计蒜客-炮台实验

    蒜头君在玩一个战争模拟游戏 xff0c 他有高度为 1 2 3 ldots n1 2 3 n 的炮台各一个 xff0c 他需要把这 nn个炮台从左往右排成一行 xff0c 并且炮口都朝向右边 在这个游戏中 xff0c 所有炮台发射的炮弹会摧
  • Dockerfile详解超全

    Dockerfile详解 环境介绍指令介绍FROMMAINTAINERLABELADDCOPYEXPOSEENV在Dockerfile中使用变量的方式 RUNCMDRUN amp amp CMDENTRYPOINTVOLUMEUSERWOR
  • Debian8 修改root密码

    1 当系统启动进入GNU GRUB界面 xff0c 按esc停留在此页面 xff0c 按上下的方向键可以进行选择 2 选中要修改的系统 xff0c 按e进入编辑状态 xff0c 在linux开头的这一行末尾加上 init 61 bin ba
  • debian10 配置ntp服务

    debian10 配置ntp服务 1 安装ntp2 配置3 验证 服务器不能连外网 xff0c 内网中有一台授时服务器 xff0c 内网也搭建了debian10的本地镜像源 1 安装ntp apt install ntp 2 配置 sudo
  • STL priority_queue使用

    转自 xff1a http www cnblogs com lvpengms archive 2010 04 05 1704669 html 包含priority queue 的头文件是 lt queue gt priority queue
  • GNU 简单介绍(含glibc 源码下载)

    GNU是什么 xff1f 先放网址 xff1a https www gnu org GNU是一个自由软件操作系统 就是说 xff0c 它尊重其使用者的自由 GNU操作系统包括GNU软件包 xff08 专门由GNU工程发布的程序 xff09
  • P1591 阶乘数码 【高精】

    题目描述 求 n n n 中某个数码出现的次数 输入格式 第一行为 t t 10 t t leq 10 t t 10 xff0c 表示数据组数 接下来 ttt 行 xff0c 每行一个正整数 n n 1000 n n leq 1000 n
  • P1825 [USACO11OPEN]Corn Maze S 【BFS】

    题目描述 This past fall Farmer John took the cows to visit a corn maze But this wasn t just any corn maze it featured severa
  • P1002 过河卒 【DP】

    题目描述 棋盘上 AAA 点有一个过河卒 xff0c 需要走到目标 BBB 点 卒行走的规则 xff1a 可以向下 或者向右 同时在棋盘上 CCC 点有一个对方的马 xff0c 该马所在的点和所有跳跃一步可达的点称为对方马的控制点 因此称之
  • [论文笔记-6]Discrete Opinion Tree Induction for Aspect-based Sentiment Analysis

    题目 作者 abstract 1 依赖树 dependency trees 缺点 xff1a 依赖于外部解析器 xff0c 而这些解析器对于低资源的语言来说是不可用的 xff0c 或者在低资源的领域表现更差 xff1b 没有为基于方面的情感
  • hexo搭建——debian 环境变量设置

    1 问题描述 首先需要明白所谓git部署到服务器的原理 Hexo g 会生成一个静态网站 xff08 第一次会生成一个public目录 xff09 xff0c 这个静态文件可以直接访问 需要将hexo生成的静态网站 xff0c 提交服务器重
  • 将13位图书条码转换为ISBN-10(2007年以前图书)的方法

    将13位图书条码转换为ISBN 10 2007年以前图书 的方法 lt summary gt 2007年前图书13条码转换成ISBN 10位方法 lt summary gt lt param name 61 34 Isbn13 34 gt
  • 2022 年您需要了解的 10 大计算机视觉框架

    计算机视觉是一个快速发展的科学领域 xff0c 它处理从数字图像和视频中提取信息以获得对环境的高级理解 该技术主要应用于机器人 增强现实和自动驾驶汽车中的复杂问题 xff0c 例如物体检测 导航空间测量 面部识别 动作和活动识别 驱动视觉和