论文部分内容阅读
正则化方法通过引入人类的先验信息,能有效地增强分类器的泛化性能,避免过拟合现象的发生。支持向量机(SVM)利用大的最小间隔来正则化模型,提高了模型的泛化能力,具有重要的理论和应用价值。最近的理论研究结果表明,相对于最小间隔或者单个间隔,间隔分布能更好地刻画泛化性能。在此理论基础上,基于间隔分布正则化的大间隔分布机(LDM)通过最大化间隔分布增强了模型的泛化性能,并取得了优于SVM等先进方法的分类性能。因此,间隔分布学习成为了一个新的研究热点,本文对此展开了相关的理论和应用研究,设计了具有强泛化性能和鲁棒性的分类算法,并探索将其应用到行人检测和场景分类中,主要包括在以下几个方面:(1)针对样本不平衡条件下的分类问题,提出了一种包含代价敏感性间隔分布和错分惩罚的大代价敏感性间隔分布机。在分析大间隔分布机中的间隔均值和间隔方差的基础上,定义了代价敏感性间隔均值和间隔方差,建立了代价敏感性的间隔分布正则化模型。深入研究了模型中代价敏感参数的特性,通过理论推导得出了代价敏感参数的约束条件。在此基础上设计了代价敏感参数符合约束条件的大代价敏感性间隔分布机,通过调整代价敏感参数,实现了对间隔分布的调整,进而实现了分类面的动态调整和少数类样本检测率的提升。大代价敏感性间隔分布机是基于间隔分布正则化设计的,而间隔分布对泛化性能具有决定性作用,所以大代价敏感性间隔分布机既能调节检测率又具有很强的泛化性能。(2)为提高间隔分布学习对间隔数量和噪声的鲁棒性,提出了一种新的基于间隔分布正则化的通用分类算法—二重间隔分布机。在有效特征的分类问题中,样本统计特征通常具有很重要的标示作用。通过研究样本统计特征和间隔分布之间的关联性,本文用两类样本均值间隔的均值和均方差来刻画样本的间隔分布,既实现了类间间隔数量的平衡,又使模型的几何意义更加直观。在此基础上,我们设计了二重间隔分布机通过最大化两类样本均值的间隔分布来提高模型的泛化能力。二重间隔分布机引入的样本均值不仅使两类间隔的数量均衡还可以有效地抑制噪声等不良影响,具有很好的泛化性能和鲁棒性。(3)针对间隔代价的不均衡问题,提出了几何意义明确的代价敏感性二重间隔分布机。在分析二重间隔分布机的基本结构和几何意义的基础上,本文定义了代价敏感性二重间隔分布,并建立了基于代价敏感性二重间隔分布正则化的优化模型。该模型可以利用其中的代价参数调整间隔分布,进而调整分类面和不同代价样本的检测率。本文对代价参数的数学意义进行了深入的研究,推导了代价参数对对偶变量和分类面调整的机制,并得出了代价参数应满足的约束条件。在此基础上,设计了符合代价参数约束条件的代价敏感性二重间隔分布机,用于解决代价不平衡的二分类问题。(4)为实现快速和代价敏感性的行人检测,设计了基于BING框架和代价敏感性二重间隔分布机的行人检测模型。通过行人与非行人图像的HOG特征训练本文提出的二重间隔分布机。为减小二重间隔分布机的搜索区域,本文首先根据BING框架进行快速目标筛选,在此基础上提出了启发式的目标区域定位算法,通过目标选择和区域定位策略来获得行人的区域定位。只需将二重间隔分布机对定位区域进行目标检测即可获得行人检测的结果,提高了行人检测的效率和速度。除此以外,还可以根据检测率的需要使用代价敏感性二重间隔分布机来进行行人检测,获得代价敏感性的的行人检测结果。(5)针对场景识别中的多类目标分类问题,推广了二分类二重间隔分布机来解决多类场景分类问题。以场景识别为应用背景,本文采用邻域编码和推广二重间隔分布机的方法来解决识别中的多类场景分类问题。通过邻域编码对图像进行特征表达,这种表达方法具有很强的表达能力,后续分类只需要线性核即可获得高的预测准确率。在邻域编码特征的基础上,本文采用一对其他(One Vs Rest,OVR)的方案推广二重间隔分布机用来解决多类场景分类问题。实验结果表明,邻域编码特征和多类二重间隔分布机的场景识别框架,能够显著地提高场景识别的速度和稳定性。