飞道的博客

【ROS机器人系统】自主导航+YOLO目标检测+语音播报

371人阅读  评论(0)

一、总体功能设计

完成自主导航功能,并在小车移动至指定地点的过程中,通过机器人的摄像头检测导航途中所见物体,识别出物体的种类(框选出不同物体并标注识别结果),结合科大讯飞语音合成模块对识别结果进行语音播报。

(注:目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。)

二、实验环境

Windows10
VMware虚拟机 ubuntu18.04
Ros melodic

三、演示

演示地址:https://www.bilibili.com/video/BV1tB4y1Y7UH

四、场景搭建、建图与导航模块

4.1 场景搭建

  • gazebo Building Editor
  • gazebo Building Editor

    由于官方的模型库中没有我所使用的YOLO模型中能够检测到的特征鲜明的物体,如猫、狗、大象、马、苹果、香蕉等,所以部分物体(如图中的香蕉)放在相框中的图片中进行识别。
  • 设置的小车主要识别的区域

4.2 小车模型

本次课设使用的是TurtleBot3中的Waffle小车,下图中的中间一个(含有雷达与摄像头)

小车模型在rviz中展示

4.3 导航模块

  • 注:对应github文件中的test_ws工作空间

gmapping 通过粒子滤波将激光距离数据转化为珊格地图。

  • 优点:在长廊及低特征场景中建图效果好;构建小场景地图所需的计算量较小且精度较高。缺点:依赖里程计,无法适用无人机及地面小车不平坦区域;无回环;大的场景,粒子较多的情况下,特别消耗资源。

主要参考:我在github上传的这个文件:导航模块参考.pdf

(1)安装依赖

在开始该部分设计之前,我们先安装相关支持的功能包,包括建图、导航以及机器人仿真的功能包(克隆下载后仅保留turtlebot3_gazebo文件夹),相关命令如下:

sudo apt-get update  
sudo apt-get install ros-melodic-turtlebot3-*  
sudo apt-get install ros-melodic-navigation  
sudo apt-get install ros-melodic-slam-gmapping  
git clone https://github.com/ROBOTIS-GIT/turtlebot3_simulations.git  
sudo apt-get install ros-melodic-dwa-local-planner  
  • 在使用仿真机器人之前先利用以下命令确定机器人类型,在 test_ws 目录下运行:
echo “export TURTLEBOT3_MODEL=waffle” >>~/.bashrc

(2)从github下载的文件中的test_ws目录下

先 catkin_make编译然后刷新工作空间,最后在运行 launch文件即可完成整体功能的启动,建图流程:
在test_ws目录下运行以下两条命令

roslaunch turtlebot3_gazebo turtlebot3_world.launch  
roslaunch my_navi build_map.launch  

运行完上述前两条命令之后会出现一个仿真的场景,然后rviz中会显示当前建图结果,然后运行下面的命令会出现键盘控制界面,

rosrun turtlebot3_teleop turtlebot3_teleop_key  

可以利用“w”,“a”,“s”,“d”来控制机器人移动,这四个按键分别控制向前移动、向左自旋、停止和向右自旋,合理的控制机器人移动来建立环境地图,结果如图3所示,最后利用下面的命令保存建图结果,

rosrun map_server map_saver -f map2  

产生图片名为“map2.pgm”和名为“map2.yaml”的地图参数,相关建图结果如图所示

  • 开始建图的时候
  • 建图完成
  • 控制小车建图的时候各个节点之间的通信情况

(3)运行导航功能

导航相关命令如下,在 test_ws 目录下执行命令之后会出现仿真场景和 rviz,点击 rviz 导 航栏的“2D Nav Goal”,然后点击地图上的任意空白地点之后机器人会自动导航至目标点, 并且 rviz 和仿真地图中机器人的动作在没有系统延时的时候会保持一致。

roslaunch turtlebot3_gazebo turtlebot3_world.launch  
roslaunch my_navi turtlebot_navigation.launch  

五、YOLO目标检测模块

注:对应github文件中的yolo_ws工作空间
主要参考:小车yolo机械臂(一)ros下gazebo搭建小车(可键盘控制)安装摄像头仿真 加载yolo检测识别标记物体

5.1 YOLO介绍

YOLO(You Only Look Once) 是一种基于深度神经网络的对象识别和定位算法,其最大的特点是运行速度很快,可以用于实时系统。

5.2 本课设尝试使用过的YOLO模型

注:本课设使用的是yolov2_tiny.weights(能识别80种类别的物体)

六、语音合成模块

sudo apt-get install sox
为了不要每次运行都souce,把x64目录下的共享库文件拷贝到/usr/lib/,先cd到voice/libs/x64目录下
cp libmsc.so /usr/lib/

七、小车摄像头与YOLO模块的通信

7.1 小车摄像头模块发布话题消息

找到导航模块中小车的摄像头对应的话题名称:
打开小车导航模块的时候在rviz中添加camera(可以用来查看小车摄像头的实时画面),然后选择话题名称:/camera/rgb/image_raw
(也可以在rqt_image_view中查看话题名称)

  • rviz中添加camera
  • 选择topic
  • rqt_image_view中查看摄像头话题名称

7.2 YOLO模块模块订阅话题消息

在YOLO模块中订阅该话题:

  • 通信过程

八、YOLO模块与语音合成模块的通信

8.1 YOLO模块模块发布话题消息

YOLO检测模块中的ros.yaml文件中,发布话题/darknet_ros/bounding_boxes

rostopic echo /darknet_ros/bounding boxes,展示发布到topic上的消息数据,Class是需要获取到的识别结果

8.2 语音合成模块订阅话题消息

  • 语音合成模块节点
  • 在回调函数中获取话题/darknet_ros/bounding boxes消息中的Class内容:
  • 通信过程

九、演示时各模块的启动命令

(在test_ws路径下)启动gazebo:roslaunch my_navi xinyang.launch
(在test_ws路径下)启动导航模块:roslaunch my_navi turtlebot_navigation.launch
(在yolo_ws路径下)启动YOLO模块:roslaunch darknet_ros darknet_ros.launch
(在catkin_ws路径下)启动语音合成模块:rosrun voice_system xf_tts_node
  • 全局:各节点会之间的通信情况

注意事项;

实验的过程中遇到了许多的bug和问题,例如:

  • YOLO模块检测物体的时候检测框的左上角不出现文字(后来发现是缺少labels文件);
  • gazebo打开的时候可能会崩溃(后来发现是虚拟机的问题,需要关闭vmware的3D图形加速选项);
  • 关闭gazebo的时候尽量使用ctrl+C去关闭,直接关闭窗口可能不能完全关闭gazebo的全部进程(此时需要重启);
  • 使用语音模块去订阅YOLO模块发送的消息的时候要处理好/darknet_ros/bounding boxes话题信息,在回调函数中提取其中的识别结果。

源码:

github源码地址:https://github.com/xinyangwy/ROS_DesignCode


转载:https://blog.csdn.net/weixin_45912291/article/details/125803475
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场