纵坐标: 漏检率(miss rate, 1-recall rate(查全率,命中率)),FalseNeg(漏检)/(TruePos(检测到)+FalseNeg(漏检))
横坐标: 每个窗口的误报率(FPPW, False Positives Per Window ),两个值越低越好 经常使用10E-4时漏检率作为结果性能的参考点
结论:
1.要想检测器好,需要精细尺度的微分(不需要平滑)
2.梯度方向直方图的bin尽量多,尺寸适度、归一化的重叠的描述子块
结论:
1.次论文中,伽马变换对结果影响很小
2.对每个通道进行平方根Gamma压缩(gamma参数1/2),会在10-4FPPW时有1%的性能提升
伽马变换补充
s=cr γ其中,r为输入图像像素;c为常数;γ为幂,变换的参数
说明:
1.γ>1时,伽马变换将拉低图像灰度值
2.γ<1时,伽马变换将提高图像灰度值
使用的模板:
最紧凑的中心二维微分模板 2*2 2*2 模板 一维 -1,1 -1,0,1 1,-8,0.8,-1 3*3sobel模板 2*2对角线模板 0,1,-1,0 -1,0,0,1结论:
1.[-1 0 1]模板在theter=0(即无平滑)时表现最好
2.更大的模板或增加搞死平滑会降低性能
1.减少混叠现象,梯度投票在相邻bin的中心之间进行方向位置上的双线性差值
2.权重根据梯度幅值计算(可以根据幅值、幅值平方、幅值平方根,但幅值本身最好)
对于行人检测来说:
无符号梯度方向直方图(0-180度)比较有用,符号信息降低性能无符号方向梯度直方图前提下,增加方向bin的个数能够显著提高检测器性能,大约9个bin对于其他目标检测来说:
梯度符号信号是有用的,如汽车、摩托等
作用:
消除光照消除前景背景对比度结论:
块重叠从0增加至3/4时,10-4FPPW下有4%的性能提升R-HOG结论:
细胞单元为6-8个像素宽是性能最优每个块内含22或33个细胞单元时最优在统计直方图bin前用搞死加权降低块边缘像素权重,10-4FPPW下,使用theter=0.5$\times$block_width的二维高斯核提高1%完整细胞单元的形式: 中心单元被分为4个90°扇形的形式:
结论:
L2-Hys、L2-norm、L1-sqrt的表现差不多一样好简单的L1-norm会使性能下降5%如果完全不进行归一化会导致性能下降27%(都是指10-4FPPW时) SophiaCV 认证博客专家 AI专家 中科院学霸 博客专家 微信搜索【计算机视觉联盟】,回复关键字【西瓜书手推笔记】获得Github标星2000+的机器学习笔记PDF版本。我的微信:PursueWin 一起进步学习