DQN代码-ROS-turtlebot3

2023-05-16

DQN代码解析

代码来自turtlebot3_qdn/environment_stage_4.py
发布话题：cmd_vel
订阅话题：odom
服务话题:
gazebo/reset_simulation,gazebo/unpause_physics
gazebo/pause_physics\

def:
getGoalDistace（计算获得目标距离）:
return goal_distance

getOdometry（读取里程信息计算航向角）:
self.position=odom.pose.pose.position
goal_angle=math.atan2(self.goal_y - self.position.y, self.goal_x - self.position.x)
#欧拉变换
heading = goal_angle - yaw
if heading > pi:
heading -= 2 * pi
elif heading < -pi:
heading += 2 * pi
self.heading=round(heading, 2)

getState(判断是否到达目标的，返回get_goalbox，碰到障碍物返回done)：
return
scan_range+[heading,current_distance,obstacle_min_range,obstacle_angle],done

setReward(奖励设置：碰撞-500，到达目标1000)：
return reward

step（）：
发布一个线速度和角速度
等待激光雷达信息
state, done = self.getState(data)
reward = self.setReward(state, done, action)
return np.asarray(state), reward, done
reset(重新开始):
等待尕gazebo重置返回gazebo/reset_simulation
接受激光雷达信息
如果到达目标点就不重置小车位置
return np.asarray(state)

#!/usr/bin/env python
#################################################################################
# Copyright 2018 ROBOTIS CO., LTD.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
#################################################################################

# Authors: Gilbert #

import rospy
import numpy as np
import math
from math import pi
from geometry_msgs.msg import Twist, Point, Pose
from sensor_msgs.msg import LaserScan
from nav_msgs.msg import Odometry
from std_srvs.srv import Empty
from tf.transformations import euler_from_quaternion, quaternion_from_euler
from respawnGoal import Respawn

class Env():
    def __init__(self, action_size):
        self.goal_x = 0
        self.goal_y = 0
        self.heading = 0
        self.action_size = action_size
        self.initGoal = True
        self.get_goalbox = False
        self.position = Pose()
        self.pub_cmd_vel = rospy.Publisher('cmd_vel', Twist, queue_size=5)
        self.sub_odom = rospy.Subscriber('odom', Odometry, self.getOdometry)
        self.reset_proxy = rospy.ServiceProxy('gazebo/reset_simulation', Empty)
        self.unpause_proxy = rospy.ServiceProxy('gazebo/unpause_physics', Empty)
        self.pause_proxy = rospy.ServiceProxy('gazebo/pause_physics', Empty)
        self.respawn_goal = Respawn()

    def getGoalDistace(self):
        goal_distance = round(math.hypot(self.goal_x - self.position.x, self.goal_y - self.position.y), 2)

        return goal_distance

    def getOdometry(self, odom):
        self.position = odom.pose.pose.position
        orientation = odom.pose.pose.orientation
        orientation_list = [orientation.x, orientation.y, orientation.z, orientation.w]
        _, _, yaw = euler_from_quaternion(orientation_list)

        goal_angle = math.atan2(self.goal_y - self.position.y, self.goal_x - self.position.x)

        heading = goal_angle - yaw
        if heading > pi:
            heading -= 2 * pi

        elif heading < -pi:
            heading += 2 * pi

        self.heading = round(heading, 2)

    def getState(self, scan):
        scan_range = []
        heading = self.heading
        min_range = 0.13
        done = False

        for i in range(len(scan.ranges)):
            if scan.ranges[i] == float('Inf'):
                scan_range.append(3.5)
            elif np.isnan(scan.ranges[i]):
                scan_range.append(0)
            else:
                scan_range.append(scan.ranges[i])

        obstacle_min_range = round(min(scan_range), 2)
        obstacle_angle = np.argmin(scan_range)
        if min_range > min(scan_range) > 0:
            done = True

        current_distance = round(math.hypot(self.goal_x - self.position.x, self.goal_y - self.position.y),2)
        if current_distance < 0.2:
            self.get_goalbox = True

        return scan_range + [heading, current_distance, obstacle_min_range, obstacle_angle], done

    def setReward(self, state, done, action):
        yaw_reward = []
        obstacle_min_range = state[-2]
        current_distance = state[-3]
        heading = state[-4]

        for i in range(5):
            angle = -pi / 4 + heading + (pi / 8 * i) + pi / 2
            tr = 1 - 4 * math.fabs(0.5 - math.modf(0.25 + 0.5 * angle % (2 * math.pi) / math.pi)[0])
            yaw_reward.append(tr)

        distance_rate = 2 ** (current_distance / self.goal_distance)

        if obstacle_min_range < 0.5:
            ob_reward = -5
        else:
            ob_reward = 0

        reward = ((round(yaw_reward[action] * 5, 2)) * distance_rate) + ob_reward

        if done:
            rospy.loginfo("Collision!!")
            reward = -500
            self.pub_cmd_vel.publish(Twist())

        if self.get_goalbox:
            rospy.loginfo("Goal!!")
            reward = 1000
            self.pub_cmd_vel.publish(Twist())
            self.goal_x, self.goal_y = self.respawn_goal.getPosition(True, delete=True)
            self.goal_distance = self.getGoalDistace()
            self.get_goalbox = False

        return reward


    def step(self, action):
        max_angular_vel = 1.5
        ang_vel = ((self.action_size - 1)/2 - action) * max_angular_vel * 0.5

        vel_cmd = Twist()
        vel_cmd.linear.x = 0.15
        vel_cmd.angular.z = ang_vel
        self.pub_cmd_vel.publish(vel_cmd)

        data = None
        while data is None:
            try:
                data = rospy.wait_for_message('scan', LaserScan, timeout=5)
            except:
                pass

        state, done = self.getState(data)
        reward = self.setReward(state, done, action)

        return np.asarray(state), reward, done

    def reset(self):
        rospy.wait_for_service('gazebo/reset_simulation')
        try:
            self.reset_proxy()
        except (rospy.ServiceException) as e:
            print("gazebo/reset_simulation service call failed")

        data = None
        while data is None:
            try:
                data = rospy.wait_for_message('scan', LaserScan, timeout=5)
            except:
                pass

        if self.initGoal:
            self.goal_x, self.goal_y = self.respawn_goal.getPosition()
            self.initGoal = False

        self.goal_distance = self.getGoalDistace()
        state, done = self.getState(data)

        return np.asarray(state)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DQN代码-ROS-turtlebot3 的相关文章

gazebo通过sdf搭建仿真环境和机器人Husky

具体格式要求可参考 http sdformat org spec ver 1 6 elem sdf
ROS系统基本功能的使用详解（基本指令/节点/服务/启动文件/动态参数）

ROS系统基本功能的使用详解一创建工作空间二创建与编译ROS功能包三 ROS的基本命令 3 1 节点 3 2 主题 3 3 服务 3 4 参数服务器四节点的创建与运行 4 1 创建源文件 4 2 修改CMakeLists tx
ROS2踩坑记录

Vscode 显示找不到module 以此选择设置 Python 在setting json中编辑在 python autoComplete extraPaths 中添加额外的第三方库路径如 opt ros foxy lib pyt
线速度和角速度

转自 https baike baidu com item E7 BA BF E9 80 9F E5 BA A6 1532652 fr aladdin https baike baidu com item E8 A7 92 E9 80 9F
Ubuntu16.04安装ROS Kinetic详细步骤

文章目录 ROS安装配置Ubuntu软件仓库设置sources list 设置密钥更新Debian软件包索引安装ROS 初始化 rosdep 环境配置构建工厂依赖测试安装开发环境 ROS安装 ROS Kinetic只支持Wil
Ubuntu下vscode配置ROS环境

摘要最近准备放弃用clion开发ROS使用更主流的vscode 整理一下在ubuntu18 04下的VSCode安装和ROS环境配置流程安装方法一软件商店安装个人还是推荐使用ubuntu软件下载vscode 简单不容易出错方法二
ROS rosdep update 出错方法不需要翻墙切换之类的解决方法 ‘https://raw.githubusercontent.com/ros/rosdistro/master/inde

系统 ubuntu18 rosdep update参考的这篇文章 https blog csdn net weixin 43311920 article details 114796748 utm source app app versio
Ubuntu16.04及ROS Kinetic环境下安装使用RealSense SR300

Ubuntu16 04及ROS Kinetic环境下安装使用RealSense SR300 1 准备条件需要安装Ubuntu16 04及ROS Kinetic 2 安装驱动安装realsense的驱动流程可以根据Github上的官方推荐
局域网下ROS多机通信的网络连接配置

1 在路由器设置中固定各机器IP地址在浏览器中输入路由器的IP地址例如TP LINK路由器的IP为 192 168 1 1 进入登录页面后输入用户名和密码登录用户名一般为admin 密码为自定义在基本设置 gt LAN设置 gt
程序“catkin_init_workspace”尚未安装。您可以使用以下命令安装： sudo apt install catkin

程序 catkin init workspace 尚未安装您可以使用以下命令安装 sudo apt install catkin 问题如图先贴上解决后的效果运行环境 ubuntu 16 04 ros版本 kinetic 问题解释这个
《学习篇》学会这18个常用ROS命令集合就能入门ROS了

常用ROS命令概述 ROS常用命令可以按照其使用场景分为ROSshell命令 ROS执行命令 ROS信息命令 ROS catkin命令与ROS功能包命令虽然很难从一开始就很熟练地使用所有的命令但是随着使用的次数增多你会发现常用的几个R
ROS1 ROS2学习

ROS1 ROS2学习安装 ROS ROS1 ROS2 命令行界面 ROS2 功能包相关指令 ROS 命令行工具 ROS1 CLI工具 ROS2 CLI工具 ROS 通信核心概念节点 Node 节点相关的CLI 话题 Topic 编写发
如何将视频或图像序列转换为包文件？

我是 ROS 新手我需要转换预先存在的视频文件或者large可以连接到视频流中的图像数量 bagROS 中的文件我在网上找到了这段代码 http answers ros org question 11537 creating a ba
ROS AsyncSpinner 的多线程行为

我试图了解 ROS 中的 AsyncSpinner 是如何工作的因为我可能有一些误解你可以找到类似的问题here As seen here它的定义提到异步旋转器产生几个线程可配置将并行执行回调同时不会阻塞执行该操作的线程叫它
我的代码的 Boost 更新问题

我最近将 boost 更新到 1 59 并安装在 usr local 中我的系统默认安装在 usr 并且是1 46 我使用的是ubuntu 12 04 我的代码库使用 ROS Hydro 机器人操作系统我有一个相当大的代码库在更新之前
如何访问 Heroku 中的 docker 容器？

我已按照此处构建图像的说明进行操作 https devcenter heroku com articles container registry and runtime getting started https devcenter her
ROS安装错误（Ubuntu 16.04中的ROS Kinetic）

中列出的步骤顺序http wiki ros org kinetic Installat 已被关注尝试在Ubuntu 16 04中安装ROSkinetic 输入以下命令时出错 sudo apt get install ros kinetic
catkin_make 编译报错 Unable to find either executable ‘empy‘ or Python module ‘em‘...

文章目录写在前面一问题描述二解决方法参考链接写在前面自己的测试环境 Ubuntu20 04 一问题描述自己安装完 anaconda 后再次执行 catkin make 遇到如下问题 CMake Error at opt
ROS 从 python 节点发布数组

我是 ros python 的新手我正在尝试从 python ros 节点发布一个一维数组我使用 Int32MultiArray 但我无法理解多数组中布局的概念谁能给我解释一下吗或者还有其他方式发布数组吗 Thanks usr bi
ROS 问题：libQt5Core.so.5：无法打开共享对象文件：没有这样的文件或目录

当我跑步时 rosrun turtlesim turtlesim node 在 Ubuntu 上我收到以下消息 opt ros noetic lib turtlesim turtlesim node 加载共享库时出错 libQt5Core

随机推荐

C++常见问题的总结

1 C语言跟C 43 43 的关系 xff1a xff08 1 xff09 C语言跟C 43 43 的本质区别 xff1a 1 xff09 c更倾向于面向过程 xff0c c 43 43 是面向过程 43 面向对象 43 泛型编程 2 xf
Nginx Rewrite

Nginx Rewrite 前言一 nginx rewrite概述 1 概述 2 跳转场景 3 跳转实现 4 rewrite实际场景 nginx跳转需要的实现方式 rewrite放在server if location 段中对域名或参数字
Dockerfile概念简介

Dockerfile概念简介前言一 dockerfile概念二 Docker镜像的创建 1 基于现有镜像创建 2 基于本地模板创建 3 基于dockerfile创建 dockerfile结构 xff08 四部分 xff09 构建镜像命令
【云原生之k8s】k8s基础详解

云原生之k8s k8s基础详解前言一 kubernetes介绍 1 kubernetes简介 2 应用部署方式的演变二 kubernetes组件 1 kubernetes架构 2 master组件 apiserver controlle
【云原生之k8s】kubeadm搭建k8s集群

云原生之k8s kubeadm搭建k8s集群前言一集群介绍 1 集群搭建方法 2 集群架构二集群部署 1 环境部署所有节点 xff0c 关闭防火墙规则 xff0c 关闭selinux xff0c 关闭swap交换修改主机名 xf
【云原生之k8s】k8s管理工具kubectl详解

云原生之k8s k8s管理工具kubectl详解前言一陈述式管理 1 陈述式资源管理方法 2 k8s相关信息查看查看版本信息查看节点信息查看资源对象简写查看集群信息配置kubectl自动补全查看日志基本信息查看1 查看ma
关于结构体指针与STM32外设的笔记

96 define RCC RCC TypeDef RCC BASE xff09 96 逐步分解这句代码的含义 RCC TypeDef RCC BAS 其中 RCC BAS定义为 define RCC BASE AHBPERIPH BASE
visual studio与visual c++ 6.0的区别

xfeff xfeff Visual Studio支持多种语言 xff0c Visual C 43 43 6 0 只支持C和C 43 43 Visual C 43 43 6 0 是Visual Studio 6 0的一个组成部分 xff0c
GD32F303 移植 FreeRTOS

文章目录 1 准备工作1 1 软件版本1 2 源码下载1 3 基础工程 3 FreeRTOS 移植3 1 复制需要的内核文件3 2 添加文件到 Keil 工程3 3 添加 FreeRTOSConfig h 内核配置文件3 4 配置任务调度相
FreeRTOS 之 heap_4 踩坑之路

参考博文连接 xff1a FreeRTOS系列 heap 4 c 内存管理分析FreeRTOS Heap 1 2 3 4 5 比较示例工程代码库地址如下 xff1a GiteeGit 1 问题描述博主在使用 heap 4 的 pvPor
GD32F30x Keil 环境下在 FreeRTOS 任务中使用浮点运算报 HardFault 异常的问题（二）

文章目录 1 问题描述1 1 环境1 2 问题 2 参考资料3 来龙去脉3 1 定位问题3 2 xPortPendSVHandler3 3 EXC RETURN3 4 寄存器3 5 探索真像3 5 1 浮点任务切换到空闲任务3 5 2 空闲
辛勤劳作

本文只有在12月27日可以学习到我对敬业的体会是 xff1a 正在从事的工作就是自己的生命 xff0c 它意味着每周7天 xff0c 每年52周一心扑在上面写下上面这句话 xff0c 我的泪水差一点儿就涌了出来 14年的寿险生涯 xff
无人机开发资料推荐

作者 xff1a BlueSky 链接 xff1a https www zhihu com question 30084079 answer 52762050 来源 xff1a 知乎著作权归作者所有商业转载请联系作者获得授权 xff0c
STM32移植使用mbedtls-2.24.0

STM32移植使用mbedtls 2 24 0 目录 STM32移植使用mbedtls 2 24 0 xff08 1 xff09 关于PolarSSL xff08 2 xff09 mbedtls移植 xff08 3 xff09 移植测试扫
C++中的 ::

C 43 43 中的双冒号第一种 xff0c 类作用域 xff0c 用来标明类的变量函数 Human span class token operator span span class token function setName sp
算法的类型：

所有的算法可以大概分为以下三种类型 xff1a 1 xff0e 贪婪算法 greedy algorithm 该算法每一步所做的都是当前最紧急最有利或者最满意的 xff0c 不会考虑所做的后果 xff0c 直到完成任务这种算法的稳定性很差
平衡三棱柱原理

先用一个例子来解释角动量守恒大家一定都知道直升机 xff0c 直升机除了机身上方有一个大的螺旋桨外其尾部也有一个螺旋桨这个螺旋桨的作用就是用来保持机身不会转动的 xff0c 如果没有它 xff0c 当直升机上方的螺旋桨转动时 xff0c
自抗扰控制（ADRC）

1 ADRC控制原理和结构 xff08 1 xff09 最速跟踪微分器 TD xff08 2 xff09 扩张状态观测器 ESO xff08 3 xff09 非线性状态误差反馈 NLSEF 2 ADRC控制仿真 xff08 1 xff09
深度学习算法归类

监督式学习 xff1a 逻辑回归 xff08 Logistic Regression xff09 和反向传递神经网络 xff08 Back Propagation Neural Network xff09 非监督式学习 xff1a Apri
DQN代码-ROS-turtlebot3

DQN代码解析代码来自turtlebot3 qdn environment stage 4 py 发布话题 xff1a cmd vel 订阅话题 xff1a odom 服务话题 gazebo reset simulation gazebo

DQN代码-ROS-turtlebot3

DQN代码解析

DQN代码-ROS-turtlebot3 的相关文章

随机推荐

热门标签