间隔分布正则化机器学习理论及其应用研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhaofaqiang0124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正则化方法通过引入人类的先验信息,能有效地增强分类器的泛化性能,避免过拟合现象的发生。支持向量机(SVM)利用大的最小间隔来正则化模型,提高了模型的泛化能力,具有重要的理论和应用价值。最近的理论研究结果表明,相对于最小间隔或者单个间隔,间隔分布能更好地刻画泛化性能。在此理论基础上,基于间隔分布正则化的大间隔分布机(LDM)通过最大化间隔分布增强了模型的泛化性能,并取得了优于SVM等先进方法的分类性能。因此,间隔分布学习成为了一个新的研究热点,本文对此展开了相关的理论和应用研究,设计了具有强泛化性能和鲁棒性的分类算法,并探索将其应用到行人检测和场景分类中,主要包括在以下几个方面:(1)针对样本不平衡条件下的分类问题,提出了一种包含代价敏感性间隔分布和错分惩罚的大代价敏感性间隔分布机。在分析大间隔分布机中的间隔均值和间隔方差的基础上,定义了代价敏感性间隔均值和间隔方差,建立了代价敏感性的间隔分布正则化模型。深入研究了模型中代价敏感参数的特性,通过理论推导得出了代价敏感参数的约束条件。在此基础上设计了代价敏感参数符合约束条件的大代价敏感性间隔分布机,通过调整代价敏感参数,实现了对间隔分布的调整,进而实现了分类面的动态调整和少数类样本检测率的提升。大代价敏感性间隔分布机是基于间隔分布正则化设计的,而间隔分布对泛化性能具有决定性作用,所以大代价敏感性间隔分布机既能调节检测率又具有很强的泛化性能。(2)为提高间隔分布学习对间隔数量和噪声的鲁棒性,提出了一种新的基于间隔分布正则化的通用分类算法—二重间隔分布机。在有效特征的分类问题中,样本统计特征通常具有很重要的标示作用。通过研究样本统计特征和间隔分布之间的关联性,本文用两类样本均值间隔的均值和均方差来刻画样本的间隔分布,既实现了类间间隔数量的平衡,又使模型的几何意义更加直观。在此基础上,我们设计了二重间隔分布机通过最大化两类样本均值的间隔分布来提高模型的泛化能力。二重间隔分布机引入的样本均值不仅使两类间隔的数量均衡还可以有效地抑制噪声等不良影响,具有很好的泛化性能和鲁棒性。(3)针对间隔代价的不均衡问题,提出了几何意义明确的代价敏感性二重间隔分布机。在分析二重间隔分布机的基本结构和几何意义的基础上,本文定义了代价敏感性二重间隔分布,并建立了基于代价敏感性二重间隔分布正则化的优化模型。该模型可以利用其中的代价参数调整间隔分布,进而调整分类面和不同代价样本的检测率。本文对代价参数的数学意义进行了深入的研究,推导了代价参数对对偶变量和分类面调整的机制,并得出了代价参数应满足的约束条件。在此基础上,设计了符合代价参数约束条件的代价敏感性二重间隔分布机,用于解决代价不平衡的二分类问题。(4)为实现快速和代价敏感性的行人检测,设计了基于BING框架和代价敏感性二重间隔分布机的行人检测模型。通过行人与非行人图像的HOG特征训练本文提出的二重间隔分布机。为减小二重间隔分布机的搜索区域,本文首先根据BING框架进行快速目标筛选,在此基础上提出了启发式的目标区域定位算法,通过目标选择和区域定位策略来获得行人的区域定位。只需将二重间隔分布机对定位区域进行目标检测即可获得行人检测的结果,提高了行人检测的效率和速度。除此以外,还可以根据检测率的需要使用代价敏感性二重间隔分布机来进行行人检测,获得代价敏感性的的行人检测结果。(5)针对场景识别中的多类目标分类问题,推广了二分类二重间隔分布机来解决多类场景分类问题。以场景识别为应用背景,本文采用邻域编码和推广二重间隔分布机的方法来解决识别中的多类场景分类问题。通过邻域编码对图像进行特征表达,这种表达方法具有很强的表达能力,后续分类只需要线性核即可获得高的预测准确率。在邻域编码特征的基础上,本文采用一对其他(One Vs Rest,OVR)的方案推广二重间隔分布机用来解决多类场景分类问题。实验结果表明,邻域编码特征和多类二重间隔分布机的场景识别框架,能够显著地提高场景识别的速度和稳定性。
其他文献
<正>大明嘉靖青花五彩"四季有鱼"罐,高35mm,口沿绘不同色彩,两个回纹相连一圈。肩部绘"四季花卉"开光,绘有钱纹和鱼鳞片纹。腹部为荷花,水藻、游鱼,主体纹饰为"四季有鱼图",
银行卡收费的“双刃剑”效应,可能使银行在增加收益的同时流失大量客户,而持卡量的减少将直接影响我国银行卡产业的发展。本文从银行卡收费这一现象出发,以顾客价值论为切入点,探
在构建和谐社会的进程中,媒体对民生新闻的关注度越来越高,有的开通了民生热线,有的定期推出“民生在线”等专题、专栏,还有的辟出专版来做民生新闻。但是在关注民生问题的同时,如
图像稀疏分解是一种新的图像分解方法,可以将图像分解为很简洁的近似表达形式.在图像稀疏分解的基础上,对分解出的数据进行压缩.通过对分解结果数据分布规律进行分析,提出了
本文为《星球/浪潮》《破碎》以及《争执系列贰》日用花器设计进行创作总结,结合装饰设计内容,利用简单几何元素,以及融合西方现代日用瓷设计理念,表达自己对于现代花器与花艺产品设计的个人见解。作品加入现代社会受用人群的审美观感,着重于对现代陶艺日用陶瓷设计之花器的研究。系列作品分别以泥条盘筑建立模种、注浆翻模、湿坯拼接等方法,重点研究个人对于自然现象,人与自然的感悟,以及对于中期展览作品《破碎》的思考延
本文从分析现代性的角度入手,认为中国美术自20世纪以来有两次大的转型,第一次转型是进入二十世纪后从传统的以文人绘画为代表的中国传统艺术逐步转型为新古典主义(中国式的
物资保障制约着登陆作战行动。我军登陆作战物资保障的主要问题是:储备种类、数量不合理;装、运、卸设备落后;港、场、站及保障基地容量小,设施简陋;保障方式方法滞后等。因
通信技术是一种非常重要的信息传输技术,具有传输速度快、大容量、高效率等特征。光纤通信是一种基于通信技术进步而产生的通信方式,比起传统的通信技术,在信息传输上更及时
对12个台农菠萝品种进行试种,比较各品种特性。结果表明:12个菠萝品种的株高变幅为47.60-92.40 cm;叶长变幅为54.40-97.00 cm,叶宽变幅为4.28-6.48 cm;大多数为无刺品种,各品
随着当前环境质量状况的恶化,我们国家对于环境法学人才的需求不断扩大。环境法律人才的培养离不开环境法学教育,然而当前本科教学模式无法真正体现出其实践性和应用性的特点