自由Man

检测:集成分类器 - TLD算法翻译文稿(首创公开)

3.4 集成分类器

对级联检测的第三级,我们采用文献[38]提出的随机蕨分类(random fern classification)集成分类器。该分类器是基于多像素点像素值比较来做判决的。对每一个子检测窗,计算其包含目标的可能性。如果这个概率值小于0.5,我们就认为在该子窗口中不存在目标而抛弃该窗口。这种分类方法比方差分类器慢,但与使用SIFT特征来进行分类还是快非常多的,这一点可以从文献[38]中的实验得到证实。

本文采用的是文献[31]中所提出的特征。图3.6描绘了对一张待分类的样本图像进行特征提取的过程。样本图像下方的4个框中分别有一白一黑两个点,这两个点对应于原图像中的两个像素点。这些点的位置是随机地从原图像中抽出来的,且一旦选取,就不再做任何改动。对每一个边界框,计算其原始图像中的白点所在位置的像素值是否比黑点位置的大,数学表达式为:

其中,为两个随机位置的像素值。从上式可知,亮度的均匀变化对这个比较结果是没有影响的。从每一个比较结果得到一位二进制数,所有这些数串起来就形成了一个二进制数。例如,图3.6得到的二进制数为1101,把它转换成10进制数就是13。第i个特征决定了二进制数据的第i位。Alg.2描述了这种计算方法的一个变种算法。其中,I表示输入图像;F表示计算得到的特征值;S表示待计算的特征个数。S的大小决定了特征值的取值范围,其值不得超过。图3.6所示的S位特征即为文献[38]中所谓的一个蕨。用得到的特征值来计算该图像块中包含目标的可能性P(y=1|F)y=1表示子窗口中存在目标。我们将在第4章中进一步讨论这些概率值。

图3.6 单个蕨的特征计算过程。第i个像素的像素值决定了特征中的第i位的值。最后使用这个特征的值来计算目标存在概率

 

 

图3.7 三个随机蕨组成的集成分类器。对每一个蕨存在目标的可能性求均值来得到最终的目标存在可能性概率

当使用一个蕨时,为了获得令人满意的结果,需要使用大量的特征[38]。然而,特征数的增加,又将导致需要计算概率的训练数据的量的增加,这就导致了所谓的维数灾难[36]。当Amit 和Geman[3]使用随机决策树来进行字符识别的时候,也遇到了同样的问题。他们采取的解决方法是使用几棵更小的树,然后取这些决策树结果的均值,而不使用一棵层数很高的树。文献[38]也借用了这种方法,得到图3.7所示的分类器。在待检测的样本图像下面有三个蕨,每个由不同的特征(所取的位置不同)集组成,得到一个不同的概率值。最后,对这些概率求均值,便得到了目标存在的概率

其中,M表示使用的蕨的个数。M、S的经验值估算将在5.3中介绍。


发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.5.2 Zero Theme By 爱墙纸

Copyright ZiYouMan.cn. All Rights Reserved. 蜀ICP备15004526号