CVPR2005【行人检测】HOG+SVM用于人体检测的梯度方向直方图

it2022-05-05  184

目录

CVPR2005-用于人体检测的梯度方向直方图 Histograms of Oriented Gradients for Human Detection使用的数据集研究方法数据流程 双对数坐标上的评价曲线DET结果综述算法实现和性能研究检测器参数 算法实现细节1.伽马/颜色规范化2.梯度计算3.空间/方向bin统计归一化和描述子块R-HOGC-HOG归一化策略

CVPR2005-用于人体检测的梯度方向直方图 Histograms of Oriented Gradients for Human Detection

使用的数据集

MIT行人数据库 共924张行人图片(ppm格式,宽高64*128),肩到脚的距离约80像素只有正面和背面两个视角无负样本,未区分训练集和测试集 INRIA数据集 目前使用较多的静态行人检测数据库有原始图片和相应的标注训练集有正样本614张(包含2416个行人);负样本1218张测试集有正样本288张(包含1126个行人);负样本453张途中人体大部分为站立姿势且高度大于100像素。部分标注不正确图片主要来源GRAZ-01、个人照片及Google图片

研究方法

数据

正样本:1239个行人图片及左右翻转的图片,即共2478个负样本:1218个没有行人的图片中随机选取12180个检测窗口大小的子图作为负样本

流程

检测出来的是错误分类的负样本 正负样本训练分类器 初始SVM分类器在负样本原图上进行行人检测 难例 加入到初始负样本集,重新训练分类器 最终的分类器

双对数坐标上的评价曲线DET

纵坐标: 漏检率(miss rate, 1-recall rate(查全率,命中率)),FalseNeg(漏检)/(TruePos(检测到)+FalseNeg(漏检))

横坐标: 每个窗口的误报率(FPPW, False Positives Per Window ),两个值越低越好 经常使用10E-4时漏检率作为结果性能的参考点

结果综述

HOG检测器 矩形块ROH 环形极坐标块C-HOG 线性SVM 核函数SVM

算法实现和性能研究

检测器参数

检测器参数 无Gamma校正的RGB颜色空间 梯度算子-1,0,1,无平滑 梯度方向离散到0-180度之间的9个bin中 块block大小为16*16 细胞单元cell大小为8*8 高斯滤波参数theter为8 L2HYs块归一化 块移动步长8个像素 检测窗口为64*128

结论:

1.要想检测器好,需要精细尺度的微分(不需要平滑)

2.梯度方向直方图的bin尽量多,尺寸适度、归一化的重叠的描述子块

算法实现细节

1.伽马/颜色规范化

结论:

1.次论文中,伽马变换对结果影响很小

2.对每个通道进行平方根Gamma压缩(gamma参数1/2),会在10-4FPPW时有1%的性能提升

伽马变换补充

s=cr γ

其中,r为输入图像像素;c为常数;γ为幂,变换的参数

说明:

1.γ>1时,伽马变换将拉低图像灰度值

2.γ<1时,伽马变换将提高图像灰度值

2.梯度计算

使用的模板:

最紧凑的中心二维微分模板 2*2 2*2 模板 一维 -1,1 -1,0,1 1,-8,0.8,-1 3*3sobel模板 2*2对角线模板 0,1,-1,0 -1,0,0,1

结论:

1.[-1 0 1]模板在theter=0(即无平滑)时表现最好

2.更大的模板或增加搞死平滑会降低性能

3.空间/方向bin统计

1.减少混叠现象,梯度投票在相邻bin的中心之间进行方向位置上的双线性差值

2.权重根据梯度幅值计算(可以根据幅值、幅值平方、幅值平方根,但幅值本身最好)

对于行人检测来说:

无符号梯度方向直方图(0-180度)比较有用,符号信息降低性能无符号方向梯度直方图前提下,增加方向bin的个数能够显著提高检测器性能,大约9个bin

对于其他目标检测来说:

梯度符号信号是有用的,如汽车、摩托等

归一化和描述子块

作用:

消除光照消除前景背景对比度

结论:

块重叠从0增加至3/4时,10-4FPPW下有4%的性能提升

R-HOG

稠密的网格空间中进行计算,无主方向R-HOG有三个参数:块大小;细胞单元大小;每个细胞的bin方向个数

R-HOG结论:

细胞单元为6-8个像素宽是性能最优每个块内含22或33个细胞单元时最优在统计直方图bin前用搞死加权降低块边缘像素权重,10-4FPPW下,使用theter=0.5$\times$block_width的二维高斯核提高1%

C-HOG

C-HOG参数 角度bin个数,4个 半径bin个数,2个 中心圆的半径,以像素为单位,4个像素最好 子半径的伸展因子

完整细胞单元的形式: 中心单元被分为4个90°扇形的形式:

归一化策略

结论:

L2-Hys、L2-norm、L1-sqrt的表现差不多一样好简单的L1-norm会使性能下降5%如果完全不进行归一化会导致性能下降27%(都是指10-4FPPW时) SophiaCV 认证博客专家 AI专家 中科院学霸 博客专家 微信搜索【计算机视觉联盟】,回复关键字【西瓜书手推笔记】获得Github标星2000+的机器学习笔记PDF版本。我的微信:PursueWin 一起进步学习

最新回复(0)