分类筛选
分类筛选:

关于静态图像论文范文资料 与基于HOG—LBP特征的静态图像中的行人检测有关论文参考文献

版权:原创标记原创 主题:静态图像范文 科目:硕士论文 2024-03-02

《基于HOG—LBP特征的静态图像中的行人检测》:这篇静态图像论文范文为免费优秀学术论文范文,可用于相关写作参考。

摘 要:为实现复杂背景下快速、精准的行人检测,研究了方向梯度直方图(Histogram of OrientedGradient,HOG)特征描述子和局部二值模式(Local Binary Pattern,LBP)特征描述子.通过融合HOG特征和LBP特征,然后利用支持向量机(Sup-portVectorMachine,SVM)和自适应增强(AdaptiveBoosting,AdaBoost)算法对样本特征进行训练获得分类器,最后在IN-RIA行人数据库进行了三组对比试验.实验结果表明,HOG特征描述子在行人特征描述中要优于LBP特征描述子,本设计使得行人检测的实时性和识别率都有一定的提高.

关键词:行人检测;方向梯度直方图;局部二值模式;支持向量机;自适应增强

无人驾驶汽车的快速发展,使得行人检测技术显得尤为重要.行人检测技术有两个核心的问题:行人特征提取和分类检测.Dalai等提出了HOG特征描述子,并利用SVM分类器进行行人检测.HOG特征是目前使用最广泛的行人特征描述子,通过计算梯度或边缘的方向密度,可以很好地描述局部目标的表象和形状.虽然Dalai等基于HOG的行人检测系统在行人姿态单一的MIT数据库上检测率接近最优,但是实际应用中的行人检测系统容易受到行人姿态、人物遮挡以及光照等因素影响.因此,多姿态以及复杂背景下的行人检测仍然是目前的研究热点.0jala等提出LBP特征描述子,然后又针对原始LBP特征的优化,提出了具有旋转不变性的LBPROT以及等价模式(Uniform Pattern)ULBP特征描述子.针对HOG特征在描述局部纹理特征的不足,利用LBP特征来描述图像局部纹理特征,据此,Wang等提出了基于HOG-LBP融合特征的行人检测.

行人图像的特征向量提取出来后,就利用分类器进行行人的检测.SVM是一种有监督式的学习模型,其定义为把训练样本贴好标签,然后找到最优化的分隔超平面,一般用于二类分类问题.Freund等改进了Boosting算法,提出了AdaBoost算法.针对AdaBoost算法,Jones等提出了由若干个AdaBoost分类器串联组合而成的AdaBoost级联分类器,成功实现了第一个实时人脸检测系统.Schapire证明了AdaBoost算法的收敛性.

通过融合HOG-LBP特征,利用开源计算机视觉库(OpenSource Computer Vision Hbrary,OpenCV)在Visual Studio 2012平台上实现了静态图像中的行人检测.在INRIA数据库进行了三组对比实验,第一组实验通过融合HOG-LBP特征提取行人特征,并采用SVM分类器进行行人分类检测.第二组和第三组实验为单一特征,并采用AdaBoost分类器进行行人分类检测.从实验数据中观察到,第一组实验的识别率明显比另外两组高,并且训练分类器的时间也明显少于另外两组实验.

1特征提取

1.1 HOG特征提取

提出HOG特征描述子,它通过计算和统计图像局部区域的梯度方向直方图来构成特征,广泛应用于图像处理中进行物体检测.提取HOG特征包括以下几个步骤:

1)归一化图像.首先把输入的彩像转灰度图像,然后对图像进行平方根Gamma压缩,从而达到归一化效果.这种压缩处理能够有效地降低图像局部的阴影和光照变化,从而提高HOG特征对于光照变化的鲁棒性.

2)计算图像梯度.首先用一维离散微分模版[-1,0,1]及其转置分别对归一化后的图像进行卷积运算,得到水平方向的梯度分量以及垂直方向的梯度分量.然后根据当前像素点的水平梯度和垂直梯度,得到当前像素点的梯度幅值和梯度方向.公式如下:

3)为每个细胞单元构建梯度方向直方图.首先把尺寸为64x128的图像分为8x16个cell,即是每个cell为8x8个像素.然后把梯度方向限定在[0,],并将梯度方向平均分为9个区间(bin),每个区间20度.最后对cell内每个像素用梯度方向在直方图中进行加权投影,也就是说cell中的每个像素点都根据该像素点的梯度幅值为某个方向的bin进行,这样就可以得到这个cell的梯度方向直方图,也就是该cell对应的9维特征向量.

4)把细胞单元组合成大的块(block),块内归一化梯度直方图.把相邻的2x2个cell形成一个block,这样每个block就对应着36维的特征向量.由于局部光照的变化以及前景和背景对比度的变化,使得梯度强度的变化范围非常大.为了进一步消除光照的影响,最后对block内的36维特征向量进行归一化.公式如下:

其中,v是未经归一化的描述子向量,v2是v的2范数,是一个极小的常数.

5)收集HOG特征.如图1所示,采用滑动窗口的方法,用block对样本图像进行扫描,扫描步长为一个cell,所以block之间其实是有重叠的.最后把所有归一化后的block特征串联起来就得到3780维特征向量.

1.2 LBP特征提取

文献[2-5]提出LBP特征描述子,并针对原始LBP特征进行了优化.LBP描述子是一种用来描述图像局部纹理特征的算子,具有灰度不变性和旋转不变性等显著的优点.提取LBP特征的基本思想是:利用中心像素點的灰度值作为阈值,其相邻像素点的灰度值与之进行大小比较得到二进制编码来表示局部的纹理特征.

原始的LBP算子定义在3x3的窗口,根据编码的思想,一共有256种编码.为了适应不同尺度的纹理特征,提出了圆形LBP算子.并且允许在半径为R的圆形邻域内有任意多个像素点.为达到旋转不变性的要求,又提出旋转不变模式的LBP,即不断旋转圆形邻域得到一系列初试定义的LBP值,取其中最小值作为该邻域的LBP值.为了解决二进制模式过多的问题,提高统计性,又提出了采用一种等价模式来对LBP算子的模式种类进行降维.LBP特征提取流程如图2所示,具体步骤如下.

静态图像论文参考资料:

结论:基于HOG—LBP特征的静态图像中的行人检测为关于静态图像方面的论文题目、论文提纲、静态图像论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

和你相关的