深度相机进行目标检测

2023-05-16

1.介绍

国外博客,这个博客还行,可以下载源码。

CSDN

目标检测采用YOLOv5,已经搭建好。相机采用realsense d435i。

官网有文档,示例代码,工具等。看官网是最好的选择。

官方GitHub

SDK没有用到

2. python库的搭建

进入conda环境后,以下命令安装。可以选择从源代码进行构建(一种安装方式),但是我还是用最简单的

pip install pyrealsense2

用以下命令即可导入

import pyrealsense2 as rs

 官网的文档中没有给出比较详细的pythonAPI使用方法,主要还是看github中的一些examples,以及pyrealsense2库的document 

3.代码

初始化相机开始收集数据流是第一步:用以下代码完成

config.enable_stream()一个是配置深度通道,一个是配置图像通道,其中的参数为分辨率、色彩格式,帧率。当然这些参数不能乱选,可以打开viewer看看有哪些选项,自己设定。(深度通道与图像通道的最大分辨率也不同)

    # 进行一些初始化化
    pipeline = rs.pipeline()
    config = rs.config()
    # D435i的分辨率只能是()()()
    config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 60)
    config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 60)
    # Start streaming
    pipeline.start(config)

训练好的模型可以用以下语句直接加载。(预测也可以用detect.py,不过文件比较臃肿,因此就直接加载比较方便,不过缺点也很明显,少了一些设置阈值、iou之类的)

model = torch.hub.load('D:/company/py/yolo', 'custom', path='mymodels/yolov5l_terminal.pt', source='local')
model.eval()

总体代码如下:

import pyrealsense2 as rs
import numpy as np
import cv2
import random
import torch


model = torch.hub.load('D:/company/py/yolo', 'custom', path='mymodels/yolov5l_terminal.pt', source='local')
model.eval()


def get_mid_pos(frame, box, depth_data, randnum):
    distance_list = []
    mid_pos = [(box[0] + box[2]) // 2, (box[1] + box[3]) // 2]  # 确定索引深度的中心像素位置
    min_val = min(abs(box[2] - box[0]), abs(box[3] - box[1]))  # 确定深度搜索范围
    # randnum是为了多取一些值来取平均
    for i in range(randnum):
        bias = random.randint(-min_val // 4, min_val // 4)
        dist = depth_data[int(mid_pos[1] + bias), int(mid_pos[0] + bias)]
        # 画出深度搜索范围
        cv2.circle(frame, (int(mid_pos[0] + bias), int(mid_pos[1] + bias)), 4, (255, 0, 0), -1)
        if dist:
            distance_list.append(dist)
    distance_list = np.array(distance_list)
    distance_list = np.sort(distance_list)[randnum // 2 - randnum // 4:randnum // 2 + randnum // 4]  # 冒泡排序+中值滤波
    return np.mean(distance_list)


# 这个函数主要是在原图上画框,标出深度信息
def dectshow(org_img, boxs, depth_data):
    img = org_img.copy()
    for box in boxs:
        cv2.rectangle(img, (int(box[0]), int(box[1])), (int(box[2]), int(box[3])), (0, 255, 0), 2)
        dist = get_mid_pos(org_img, box, depth_data, 24)
        cv2.putText(img, box[-1] + str(dist / 1000)[:4] + 'm',
                    (int(box[0]), int(box[1])), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
    cv2.imshow('dec_img', img)


if __name__ == "__main__":
    # 配置摄像机参数,用opencv的时候,颜色通道是bgr
    pipeline = rs.pipeline()
    config = rs.config()
    config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 60)
    config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 60)
    # 开始采集
    pipeline.start(config)
    try:
        while True:
            # 获取深度图以及彩色图像
            frames = pipeline.wait_for_frames()
            depth_frame = frames.get_depth_frame()
            color_frame = frames.get_color_frame()
            if not depth_frame or not color_frame:
                continue

            # 转化成numpy格式
            depth_image = np.asanyarray(depth_frame.get_data())
            color_image = np.asanyarray(color_frame.get_data())

            # 开始预测
            results = model(color_image)
            boxs = results.pandas().xyxy[0].values
            dectshow(color_image, boxs, depth_image)

            # 在深度图像上应用colormap(图像必须先转换为每像素8位)
            depth_colormap = cv2.applyColorMap(cv2.convertScaleAbs(depth_image, alpha=0.03), cv2.COLORMAP_JET)

            # 水平堆叠深度图和彩色图
            images = np.hstack((color_image, depth_colormap))
            # 展示,刷新时间为1ms
            # cv2.namedWindow('RealSense', cv2.WINDOW_AUTOSIZE)
            # cv2.imshow('RealSense', images)
            key = cv2.waitKey(1)

            # Press esc or 'q' to close the image window
            if key & 0xFF == ord('q') or key == 27:
                cv2.destroyAllWindows()
                break
    finally:
        pipeline.stop()

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度相机进行目标检测 的相关文章

  • 数据结构与算法(一)复杂度分析(下):不同情况下的复杂度变化

    最好 最坏情况时间复杂度 span class token comment n表示数组array的长度 span span class token keyword int span span class token function fin
  • Windows开发:鼠标操作

    本文为作者原创 xff0c 转载请注明出处 一般情况下 xff0c Windows平台下可以使用mouse event函数实现鼠标操作 我们这里使用更新后的SendInput函数 span class token keyword bool
  • RawInput 输入流程【Windows操作系统】

    转载请注明出处 除了键盘和鼠标以外 xff0c 还有很多其他的用户输入设备 xff0c 比如手柄 触摸屏 麦克风等等 xff0c 这些设备统称为人机接口设备HID xff08 Human Interface Device xff09 xff
  • Win10 键盘输入法消失后如何恢复

    原创文章允许转载 xff0c 转载请著明出处 xff0c 不得用于商业用途 xff0c 否则保留法律追责权力 一般Win10 系统在不断地更新过程中 xff0c 会造成一部分数据不同步的问题 xff0c 有时候会发现设置好的英文输入法不见了
  • Windows10安装WDK

    安装包下载 xff08 5 11 2022 xff09 官网地址 xff1a 下载 Windows 驱动程序工具包 WDK Windows drivers Microsoft Docs 点击蓝体字样即可下载 问题汇总 问题1 xff1a 安
  • Windows 无法打开启动配置数据存储拒绝访问

    在我们输入一些命令时会遇到如下报错 xff0c 一般情况下是由于运行cmd的账户权限导致的 方法1 xff1a 1 在系统盘C windows system32 xff08 当前系统安装所在磁盘盘符 xff09 下查找到cmd命令提示符可执
  • 人机交互设备(HID)

    人机交互设备 xff08 HID xff09 是一个设备类型 xff0c 为了使用通用USB接口支持HID设备来代替PS 2接口类型的设备 xff0c 例如键盘 鼠标和游戏控制器等等 在 HID 之前 xff0c 设备只能使用规定好的鼠标或
  • ubuntu服务器安装可视化桌面(Gnome)

    作者 xff1a 锕琅 原文链接ubuntu服务器安装可视化桌面 xff08 Gnome xff09 知乎 目录 基础环境配置和安装 1 切换用户为Root 2 更新获取软件及版本信息 3 安装VNC4Server 4 启动VNC Gnom
  • CocosCreator新手教程——cc.Node基础常用接口(API)

    CocosCreator开发笔记 cc Node基础常用接口 xff08 API xff09 一 常用属性 cc Class extends cc Component properties sprite default null type
  • 终端命令行新手教程——shell脚本

    终端命令基础 摘自 xff1a 菜鸟教程 本文精简自原文章 xff0c 总结了常用部分 xff0c 如需深入学习请点击上方链接 一 运行环境 打开文本编辑器 可以使用 vi vim 命令来创建文件 xff0c 新建一个文件 test sh
  • 面试:如果程序崩溃,可能的原因是什么?

    You are given the source to an application which crashes when it is run After running it ten times in a debugger you fin
  • Mac 安装 nodejs方法——新手教程

    访问nodejs官网 xff0c 点击蓝色选框区域稳定版 xff0c 并下载官网链接 我们这里选择了右面的12 8 1 current xff0c 点击下载 双击刚下载的文件 xff0c 按步骤默认安装就行 安装完成后打开终端 xff0c
  • module.exports用法

    module exports 对象是由模块系统创建的 在我们自己写模块的时候 xff0c 需要在模块最后写好模块接口 xff0c 声明这个模块对外暴露什么内容 xff0c module exports 提供了暴露接口的方法 转自博客 1 返
  • 八 关于电机驱动芯片L298N使用心得

    车模套件的选择 当时由于是第一次做某个东西 xff0c 所以购买车模的时候不是很有信心 xff0c 就买了一个比较廉价一点的 xff0c 事实证明一分价钱一分货 xff0c 组装的时候发现轮子有点松动 xff0c 这就意味着跑的时候 xff
  • 解决Ubuntu网络调试助手安装后无法打开问题

    通常很多初学者在学习和开发网络相关程序时 xff0c 基本上都会用到NetAssist这个网络调节助手 xff0c 该工具简洁实用 xff0c 对于初学网络编程的人员特别友好 xff0c windows系统下该调节助手在任何系统版本中都能正
  • IP地址与二进制的转换

    以192为例 以192 168 100 7为例 192的二进制为11000000 168的二进制为10101000 100的二进制为01100100 7的二进制为00000111 192 168 100 7的二进制为11000000 101
  • 根据子网掩码求最大主机数(面试被问过)

    如子网掩码255 255 240 0 化成二进制11111111 11111111 11110000 00000000 子网号中里面的1代表网络号 xff0c 0代表主机号 xff0c 有12个0 xff0c 即最大主机数为2的12次方 又
  • 麒麟系统安装bin类型文件

    在终端 xff08 windows的cmd xff09 运作命令修改文件属性 xff0c 使其可以被执行 chmod a 43 x file bin 运行 sudo file bin
  • 深度和追踪最好use the D415 and the T265 in parallel.

    All SLAM solutions and there are many good ones are limited by the information they receive It is possible to run host b

随机推荐

  • 树莓派上编译安装realsense经验

    1 树莓派系统一定要用realsense官方指定的ubuntu mate xff0c 树莓派B3 43 只能装18 0 4 xff0c 树莓派B3和以前的只能装16 0 4 2 不要妄想装realsense的非编译版本 xff08 官网说打
  • 树莓派安装realsense自己的步骤梳理

    树莓派3B 43 装上ubuntu 18 0 4的内核亲测是 4 15的 xff0c 跟ubuntu官网一致 目前最新的也就是4 15 xff0c 不知道realsense官网瞎扯什么4 16啥的干啥 xff1f 都还没有的东西 xff0c
  • Opencv快速入门(C++版)

    Opencv快速入门 C 43 43 版 Excerpt Opencv快速入门 C 43 43 版 xff09 前言1 图像的读取与显示所使用的API接口 xff1a 代码演示 xff1a 2 图像色彩空间转换所使用的API接口 xff1a
  • 搭建elsticsearch集群遇到的错误

    错误一 xff1a 报错with the same id but is a different node instance解决办法 原因 xff1a 是因为复制虚拟机时 xff0c elsticsearch时 xff0c 将elsticse
  • PX4无人机控制

    1 PX4安装 安装主要是配置环境 xff0c 我是按照官网配置的 xff1a PX4 自动驾驶用户指南 特别是对于英语不好的我来讲 xff0c 配置了好几天也没有配置成功 找到了比较靠谱的参考文献 xff1a Ubuntu18 04配置搭
  • 吃透计算机组成原理

    文章目录 博主杂谈计算机概论计算机发展历程计算机的分类计算机的结构体系冯诺依曼体系现代计算机体系 计算机的层次与编程语言程序翻译与程序解释计算机层次 计算机计算单位与字符编码计算机计算单位计算机字符编码字符编码种类与历程 计算机内部结构计算
  • 远程显示docker运行结果

    查找本地IP 服务器中的docker环境操作步骤 xff1a span class token function export span DISPLAY span class token operator 61 span 10 100 12
  • 笔试——Linux操作系统

    1 Linux内核的组成部分 Linux内核主要由五个子系统组成 xff1a 进程调度 内存管理 虚拟文件系统 网络接口 进程间通信 xff1b 2 Linux系统的组成部分 主要是4个部分 xff1a 内核 shell 文件系统和应用程序
  • WIN11打开照片 浏览器 office等软件启用硬件加速后总黑屏

    解决 WIN11打开照片 浏览器 office等软件启用硬件加速后总黑屏 问题描述 xff1a 电脑为暗影精灵6 xff08 OMEN 6 xff0c 在更新intel显卡驱动程序后或者更新win11后 xff08 自动更新最新驱动 xff
  • linux执行程序运行命令失败,提示找不到命令

    安装虚拟机时提示找不到命令 sudo VMware Workstation Full 17 0 0 20800274 x86 64 bundle xff1a 找不到命令 经检查 xff0c sudo命令正常 xff0c 该脚本文件的确存在于
  • 用自己的设备(realsense d435i)跑VINS-Fusion 还是有一些坑

    操作环境 设备 xff1a MacBook pro 2019 xff0c realsense d435i 系统 xff1a Ubuntu 16 04 lts 准备工作 标定 首先标定摄像头 xff0c 这里用kalibr对摄像头和imu进行
  • realsense d435i获取与rgb图像对应的深度值

    设置 realsense ros 的rs camera launch文件 lt arg name 61 34 align depth 34 default 61 34 true 34 gt 就能得到与图像对应的深度图 比如rgb对应的深度图
  • OpenVINS 配置,并用自己的设备跑起来~

    OpenVINS 下载编译 span class token function mkdir span p workspace catkin ws ov src span class token function cd span worksp
  • 用realsense d435i传感器在实际环境中跑ORB_SLAM3,顺带解决一部分编译问题

    是的ORB SLAM3 来了 xff0c 时隔五年 xff0c 它来带的惊喜到底是啥呢 xff1f 一个完全依赖于最大后验估计 xff08 MAP xff09 的单 双目惯导融合系统高回召的地点识别功能 xff08 High recall
  • ubuntu安装vnc server-x11vnc并设置开机自动启动

    安装x11vnc 打开终端 xff0c 使用如下命令女装x11vnc sudo apt get install x11vnc 手动启动x11vnc 按组合键CTRL 43 ALT 43 T打开终端 xff0c 输入 xff1a sudo u
  • Jetson nano 的三种供电方式

    1 首先最简单的就是USB供电 xff0c 使用数据线 xff0c 连接Jetson nano 的MicroUSB接口进行供电 xff0c 拔掉J48跳线帽 MicroUSB 的供电为 5V 2A xff0c 仅能支撑5W低功率模式 Mic
  • 在docker容器中运行Ubuntu桌面版,并通过vnc连接

    拉取镜像 xff1a docker pull dorowu span class token operator span ubuntu span class token operator span desktop span class to
  • keil5写入程序时显示Error.Flash Download failed -‘CortexM4’

    keil5写入程序时显示Error Flash Download failed CortexM4 我所遇到问题的芯片是STM32F429IGT6 xff0c 可能F1系列或者其他的STM芯片都可能遇到这样的问题 xff0c 网上目前比较多的
  • slam松耦合紧耦合调研

  • 深度相机进行目标检测

    1 介绍 国外博客 xff0c 这个博客还行 xff0c 可以下载源码 CSDN 目标检测采用YOLOv5 xff0c 已经搭建好 相机采用realsense d435i 官网有文档 xff0c 示例代码 xff0c 工具等 看官网是最好的