-
点击上方“小白学视觉”,选择加
"星标"或“置顶”
-
重磅干货,第一时间送达
车道检测模型
简介
未来十年,自动驾驶将彻底改变人们的出行方式。目前,自动驾驶应用程序目前正在测试各种案例,包括客车,机器人出租车,自动商业运输卡车,智能叉车以及用于农业的自动拖拉机。自动驾驶需要计算机视觉感知模块来识别和导航环境。此感知模块的作用是:
车道检测
检测环境中的其他物体:车辆,行人,动物
跟踪检测到的对象
预测他们可能的运动
一个好的感知系统应该能够在各种驾驶条件下(白天/晚上、夏天/冬天、下雨/下雪等)实时完成这项工作。在本文中,我们将探究一个实时模型,用于检测车道、其他车辆等以及生成警报。
训练实时车道检测
车道检测问题通常被构造为语义或实例分割问题,目的是识别属于车道类别的像素。TUSimple是用于车道检测任务的常用数据集,这个数据集有3626个道路场景的注释视频剪辑,每个剪辑有20帧,数据都是从安装在汽车上的摄像机所捕获的。下面分享一个示例图像及其注释。
TUSimple数据集的样本图像和车道注释
在此数据集中,我们可以训练语义分割模型用于分割出属于车道类别的像素。U-Net模型是一个理想的模型,因为它是具有实时推理速度的轻量级模型。U-Net是一种编码器-解码器模型,具有跳过连接编码器和解码器块。模型架构如下所示。
U-Net论文中的U-Net模型架构
但是,损失函数应修改为骰子损失系数。车道线分割问题是一个极不平衡的数据问题,图像中的大多数像素都属于背景类。Dice Loss基于Sorenson-Dice系数,它对假阳性和假阴性具有相似的重要性,这使它在数据不平衡问题的处理上表现更好。你可以在他们的论文中阅读有关Dice Loss的更多信息。Dice Loss尝试匹配地面真实情况和预测模型中的车道像素,并能够获得清晰的边界预测。个人非常喜欢这个关于使用骰子进行边界预测的博客。
LaneNet模型
对于本文,我使用LaneNet模型生成车道线。LaneNet模型是两阶段车道线预测器。第一阶段是编码器-解码器模型,以创建车道线分割掩码。第二阶段是车道定位网络,该车道网络将从掩码中提取的车道点作为输入,并使用LSTM学习预测车道点的二次函数。
下图显示了操作的两个阶段。左图是原始图像,中间图像是第1阶段车道注释的输出,右图是第2阶段的最终输出。
LaneNet模型的解释(论文图片-https://arxiv.org/pdf/1807.01726.pdf)
我使用了这个repo中的LaneNet模型实现。代码维护良好,运行无错误。
生成智能警报器
我将车道的预测与对象检测相结合,以生成智能警报。这些智能警报可以:
检测车辆的自我车道中是否存在其他车辆并测量与它们的距离
检测相邻车道中的车辆
识别弯曲道路的转弯半径
在这里,我使用YOLO v5来检测道路上的汽车和人。如果您有兴趣测试YOLO v5,请在此处查看我的博客(https://towardsdatascience.com/yolov5-compared-to-faster-rcnn-who-wins-a771cd6c9fb4)
YOLO v5在检测道路上的其他车辆方面表现出色,而且推断时间也非常快。接下来,我们使用YOLO v5来测量我方车辆与前面最近的车辆之间的距离。模型返回以像素为单位的距离,可以根据相机参数将其转换为米。由于TUSimple数据集的相机参数未知,因此我根据车道的标准宽度估算了像素到米的转换。
距离测量警报
我们同样可以计算车道的曲率半径,并将其用于汽车的转向模块。
曲率半径测量
结论
在本文中,我们探讨了针对自动驾驶中如何准确而快速地检测车道线的问题。然后,我们使用YOLO v5建立对道路上其他对象的识别,用于生成智能警报。在深度学习分析中,我们非常热衷于使用机器学习解决现实世界中的问题。我们已经帮助许多企业部署了基于AI的创新解决方案。如果您发现合作的机会,请通过此处的网站与我们联系。
参考文献
YOLO v5
LaneNet
U-Net
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2:Python视觉实战项目31讲
在「小白学视觉」公众号后台回复:Python视觉实战项目31讲,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
下载4:leetcode算法开源书
在「小白学视觉」公众号后台回复:leetcode,即可下载。每题都 runtime beats 100% 的开源好书,你值得拥有!
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
转载:https://blog.csdn.net/qq_42722197/article/details/113156909