自由Man

检测 - TLD算法翻译文稿(首创公开)

检测

本章将讨论我们所采用的目标检测方法。通过目标检测,可以实现对递归跟踪器的再初始化。从上章知,跟踪器自身是无法得到目标模型的,所以一旦跟踪失败,便无法恢复。递归跟踪是根据前一帧中目标所在位置进行的,而本文采用的寻找目标的方法是穷举法。由于对每张输入图像都有几千个子窗口用于目标检测评估,所以我们整个过程的大部分时间都花在了目标检测上。

我们的目标检测是使用如图3.1所示的滑动窗方法[49,16]进行的。对每幅(如对图3.1中最上面的图)输入图像中预先确定好的子窗口使用分类函数来评估目标存在的可能性。对于一幅分辨率为VGA(640*480)的图像,根据初始目标的大小,我们通常要用50,000200,000个子窗口。对每一个子窗口,无论其中是否存在感兴趣目标,我们都将对其进行独立的检测。对任何子窗口,只有它被上一级分类器接受,才能进入下一评估阶段。级联分类器的目的是使用最小的计算量排除掉尽可能多的不相关子窗口[43]。本文采用了4个分类器来对一幅输入图像进行目标检测。首先,我们采用前景提取的方法来保证我们的搜索是严格地在前景中进行的;该阶段需要背景建模,如果背景模型不可用的话,就跳过本分类评估阶段。其次,所有方差低于一个预定阈值的子窗口都将被抛弃;第3个分类器是基于随机蕨的集成分类器;第4个是使用作为相似性测量的归一化自相关系数来进行模板匹配。本文采用非最大抑制法来处理那些被最终接受为感兴趣目标窗口中的重叠子窗口。

本章的组织结构为:3.1 详细介绍滑动窗实现过程;3.2 介绍如何使用背景模型来把搜索区域限制到前景区域;3.3描述方差分类器;3.4 介绍能够迅速判断出包含感兴趣目标子窗口的集成分类器;3.5 详述模板匹配算法;3.6 介绍如何把重叠的检测结果融合成一个;3.7 对本章内容做一个小结。


3.7总结

本章描述了如何对一张输入图像中所有可能的子窗口进行级联目标检测,表述了级联检测器的所有组成部分,还介绍了如何使用非最大抑制法将重叠的包含目标的边界框融合成一个边界框。本章还说明了前景检测和需要一步预处理但可以快速滤除不可信边界框的方差分类器。集成分类器的计算复杂度相对较高,但它提供了一种更细致的检测机制。我们使用模板匹配的方法来对所有剩下的边界框进行最后判决。表3.1说明了每部分检测一个子窗口所需要的内存访问次数。

表3.1 检测一个子窗口所需内存访问次数比较。使用方差分类器和集成分类器所需次数为定值(M、S是定值);前景提取取决于前景面积C;模板匹配取决于已学习的模板的数量。

     Alg.3给出了一个该级联分类器的实现算法。第1行对存放可信检测结果的集合进行初始化;第24行为前景检测、方差分类器做准备工作;第516行进行真正的级联分类器分类处理;在第11行中,把那些通过了所有分类器的子窗口添加到可信检测集合中。

 



发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.5.2 Zero Theme By 爱墙纸

Copyright ZiYouMan.cn. All Rights Reserved. 蜀ICP备15004526号