基于EM改进算法的高斯混合模型参数估计

来源 :浙江大学 | 被引量 : 0次 | 上传用户:shlices
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跟随“大数据”与“人工智能”的热潮,高斯混合模型由于能够很好地刻画数据的空间分布及其特性,受到了统计学界和计算机界的重视.它可以使用在监督、无监督、半监督学习中,并在很多领域都得到了广泛应用.EM算法是高斯混合模型参数估计的经典迭代算法,具有简单实用、性质优良等特点,但其本身也存在着一些缺点,比如:对参数初始值敏感、不能确保收敛到全局最优、需要提前给定隐变量的所有可能取值等.因此,本文基于高斯混合模型,针对无监督学习和半监督学习任务,从两个方面分别对EM算法做了改进并得到了以下成果.首先,针对无监督学习任务,本文从三个方面对FCM算法进行了改进——基于密度确定算法初始聚类中心、增加惩罚项以加快算法收敛速度、使用Xie-Beni指数确定最佳聚类数,提出了 IFCM算法.然后,基于无监督高斯混合模型,使用IFCM算法为EM算法提供迭代过程中的参数初始值和隐变量的所有可能取值,进而得到了 IFCM-EM算法,并分析了该算法的优势.最后,从模拟和实证两方面验证了相比于其他EM改进算法,IFCM-EM算法估计参数的效果和性能均更好,迭代次数少,得到的参数估计值对应的无监督高斯混合模型的聚类效果也最好.其次,针对半监督学习任务,基于高斯混合模型,本文将最大熵原理应用到EM算法中,解决了隐变量的后验概率估计过度依赖于待估参数的问题,进而提出了 ME-EM算法,并证明了该算法的本质是确定性退火算法,即在一定条件下,其可以收敛到全局最优.当标记样本不能大致反映出数据的真实分布时,相比于EM算法,ME-EM算法提高了收敛到全局最优的概率,提升了估计参数的效果及稳健性.最后,从模拟和实证两方面验证了该算法优于EM算法,其得到的参数估计值对应的半监督高斯混合模型的聚类效果也得到了提升.
其他文献
《儒林外史》"以功名富贵为一篇之骨",而对待功名富贵的态度是人性的试金石。作者又用春秋笔法"寓褒贬,别善恶","爱而知其丑,憎而知其善",写出真实的人物,至今人人还是可以"取以自镜
1992-2000年河南省在校学生发生多起结核病流行,对其中6起发生结核病流行学校的学生进行结核菌素试验和胸透,对结核菌素强阳性和胸透异常者拍胸片、做痰结核菌检查,结果发现
根据防护林体系配置特点,以小流域为单元,采用定位和半定位研究方法,分层次探讨要体系的保土功能,研究表明:不同地类及用地方式,不同森林类型及不同林龄阶段,土壤侵蚀差异较大,农耕地
本文针对水文地质工作中需要判断断裂破碎带水文地质性质的实际问题,以模糊数学理论与灰色系统理论为基础,提出了用灰关联度替代权系数;用模糊综合评价的结果来定量描述断裂破碎
目的探讨原生家庭干预对产妇婚姻质量及抑郁的影响。方法选择2017年10月至2018年1月在南通大学附属妇幼保健院就诊的8~12周早孕期妇女123例,采用随机数字表法分成2组,观察组6
说明文要求写作者抓住说明对象的特点,按合理的顺序说明事物,并适当运用多种说明方法。我们可以用以下一些方法分析说明文的结构。一、说明顺序分析法说明顺序是组织材料的准
为推动机器视觉技术在工程机械上的应用发展,以典型系统为例分析了机器视觉技术在工程机械上的应用,并对应用中应注意的关键技术问题进行了简要讨论。
近年来,森林资源丰富的国家纷纷出台限制或者禁止原木出口的政策,这对研究原木贸易的可持续性非常重要。首次采用生态信息法定量分析原木贸易的可持续性。先详细介绍生态信息
大学生的生态道德养成的目标应符合生态道德教育的相关要求。生态道德养成教育有别于生态德育,生态道德素质重在养成。大学生生态道德养成教育应遵循科学性、综合性、实践性
为了制备高质量、少层数的石墨烯薄膜,分别用25%HCl、2 mol/L FeCl_3腐蚀液及电化学抛光法处理铜箔,改善其表面平整度,然后利用化学气相沉积法在其表面生长石墨烯。通过调整2