YOLO

  • YOLO的简介
  • YOLO的优势
  • YOLO为什么这么快
  • @YOLO 的作者:
  • @YOLO 的历史:

YOLO的简介

YOLO是当前目标检测领域性能最优算法的之一,几乎所有的人工智能和计算机视觉领域的开发者都需要用它来开发各行各业的应用。

YOLO的优势在于又快又准,可实现实时的目标检测。

关于YOLO的介绍,可以看再2016年CVPR以及2017年的TED,这两个都是作者本人大佬亲自介绍,而且对YOLO的讲解非常简单清晰,时长很短,分别为13分钟以及7分钟。推荐首先观看TED视频,基础无需前置知识。链接如下:

2016-CVPR:
Youtube:https://www.youtube.com/watch?v=NM6lrxy0bxs

B站:https://www.bilibili.com/video/BV16W41197K4/?spm_id_from=333.337.search-card.all.click&vd_source=0430935ec172299adfb0bef974e9022a

2017-TED
Youtube:https://www.youtube.com/watch?v=Cgxsv1riJhI

B站:https://www.bilibili.com/video/BV1Rx411b7vN/?spm_id_from=333.337.search-card.all.click&vd_source=0430935ec172299adfb0bef974e9022a


YOLO的优势

在2016年JR大佬的CVPR中,首先阐述的,是YOLO算法相比于R-CNN速度的提升:

【YOLO】P1 YOLO简介
上图通过对比阐述的意思在于2016年同一个机器根据不同的算法去处理一张图片是什么所需要的时间以及FPS。结合实际应用来看,若我们将其与自动驾驶领域相结合,我们必须选择最快识别的方案,因为自动驾驶领域对路况的实时识别与处理,对于时效性的要求极高。

图1:2017年TED-Joseph现场实测一个2秒钟才能检测出图片的算法的视频目标识别效果
【YOLO】P1 YOLO简介
上图可以明显的发现,在这个算法做出预测时,Joseph已经走出了很远;

图2:2017年TED-Joseph现场实测YOLO算法对视频做目标检测的效果
【YOLO】P1 YOLO简介
对比上一个算法,YOLO算法在Joseph移动时,可以顺利地追踪,而且可以适应不同地大小、姿势以及前后变化。

所以YOLO可以做到的是,对视频做实时目标检测。


YOLO为什么这么快

在过去,目标检测系统会将一张图片分成很多小区域,然后在每一块区域运行一下识别器,在识别器中获得最高分数的输出会作为这张图片的结果。但是一张图片上,需要识别上千次,以及上千次的神经网络评估才得到最终的结果。

而YOLO,可以同时生成边界盒和类别概率,不再需要上千次的识别与卷积,只需要一次,即 You Only Look Once。这也是YOLO名字的由来。而YOLO是如何实现的,请关注后续的博文!

【YOLO】P1 YOLO简介
【YOLO】P1 YOLO简介
一个运用YOLO V3检测目标的视频链接:https://www.bilibili.com/video/av39987782/?vd_source=0430935ec172299adfb0bef974e9022a

剩余部分将简单介绍一下YOLO的作者Joseph以及他的故事和YOLO的历史~


@YOLO 的作者:

【YOLO】P1 YOLO简介

Joseph Redmon 在西雅图的华盛顿大学,代表作 YOLO V1 & V2 & V3,该图片是 Joseph 在 TED 上的演讲,而正如图片所示,YOLO的全称是 You Only Look Once。同时,Joseph 也是一名热爱生活的爱狗人士,他有一只阿拉斯加雪橇犬 😃 同时就在这场 TED 演讲中,Joseph 退出了计算机视觉界的研究,所以 YOLO 的 V4与V5不再是他的更新内容。


@YOLO 的历史:

从2016年到2021年,YOLO已经更新换代有了五个版本,后面的版本都是在YOLO V1的基础上改进升级的,所以弄明白 YOLO V1是非常重要的,可以提一句的是,YOLO的V1到V3版本都是作者本人的成果。
【YOLO】P1 YOLO简介


2022.11.3
理工大学计算机系机房

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。