HMM基本原理及其在聚类中的应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:zhudamiao_72
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐马尔可夫模型(Hiddell Markov Model)是一种双随机过程,被广泛地应用于模式识别和聚类中并取得了不小的成功。HMM有坚实的统计学基础和有效的学习算法,从而在应用科学中成为一种基础及易于理解的工具。 在实际应用中,对HMM的训练是一个十分重要的问题,特别是在面对非完整数据的情况下。训练的优劣关系到最后聚类效果的好坏。 对HMM的训练就是不断地调整HMM的参数,在已知的观测值序列下,得到最大的似然度。而由于该问题的复杂性,现在还没有高效的,全面的,能得到全局最优化的程序。 在训练过程中,用得最多的是Baum-Welch算法。这是一种处理不完全数据的算法。我们关注的就是如何改进该算法,以此来提高聚类的效果。主要研究工作如下: 1.提出了一种基于频率敏感和HMM的聚类算法。它能有效得避免出现空类或类中数据过少的现象。实验结果证明了该算法的有效性。 2.将自劈分合并竞争学习运用于HMM,提出了一种新的算法。该算法在自劈分过程中,利用熵使每一类中尽可能多的含有同类数据;然后在合并过程中,将含有同类数据的类进行合并,从而提高聚类的效果。
其他文献
随着Internet的迅速发展和日益普及,电子文本信息迅速膨胀,任何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息是当前信息科学和技术领域面临的一
图形用户界面GUI,作为人机交互技术的重要内容,提供了丰富的图形图像信息、直观的表达方式与用户交互。使用GUI系统作为人机界面的软件系统简洁、美观、力一便好用,更加人性
随着Web Services应用的深入,企业对服务的速度、服务范围、服务质量等都提出了更高的要求,寻找一个满足客户需求的服务也是越来越难。基于语义的Web服务组合的出现,为解决这
随着Internet和电子商务的不断发展,跨企业应用的日益复杂,单个Web服务的实现己经无法满足复杂业务的需求,需要通过将多个具有不同业务功能的Web服务按照一定的业务流程逻辑
随着计算机软件业和互联网的迅猛发展,针对软件的盗版与破解也随之泛滥起来。因此,如何对软件版权以及软件程序核心内容进行保护,已经成为软件安全领域中的一些棘手问题。目前的
学位
交通在国民经济和社会发展中起着举足轻重的作用。车速检测是交通管理系统中的一个重要组成部分。随着图像处理技术的发展,视频检测技术在车速检测中的应用越来越广泛。本文着
频繁模式挖掘是数据挖掘领域的一个基本问题,其研究范围包括事务、序列、树和图。其方法被广泛应用于许多其它数据挖掘任务中,如相关性分析,周期分析,最大模式,闭合模式,查询,分类,索
20世纪末以数字化为核心的高速发展的信息技术,促使了教育信息化的迅速发展。在国内外高校教育中产生了前所未有的教学模式和教学方法的创新。上世纪90年代问世的大学物理仿真
电子邮件和网络上的文件传输已成为生活一部分,但是随网络技术突飞猛进,黑客技术也蓬勃发展,使得邮件的安全问题日益突出。总所周知,Internet传输的数据是不加密,如不保护自