基于遗传算法的汉语基本词汇自动提取研究

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:ayun33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基本词汇是词汇的核心,也是各项语言研究的基础。自从基本词汇这一概念被提出,国内学者掀起了一股研究基本词汇的热潮。经过半个世纪的研究,已经取得了相当大的成绩,提出汉语基本词汇的多种鉴定方法,为我们综合考虑基本词汇的三大特征提供可借鉴的方法。遗传算法是生命科学与工程科学的相互交叉、相互渗透和相互作用而成的新的计算方法。它不仅具有自组织、自适应、和自学习性的智能特性,而且还具有内在的本质并行特性。算法通过适应度来评估个体的优劣。经过三十多年的研究、应用,遗传算法已成为非线性优化和系统辨识的一个有效工具。被广泛的应用于函数优化、组合优化、生产调度、自动控制、机器学习、图象处理、人工生命、机器学习等领域。在自然语言处理方面,遗传算法也受到重视,应用于信息提取、文本分类、文本聚类、数据挖掘、自动生成知识库,手写体字符识别等并取得了很好的效果。实践证明,遗传算法作为现代最优化的手段,它应用于大规模、复杂空间领域离散值情况下的全局最优化问题是合适的。在求解速度和质量上远超过常规方法,是一高速近似算法。汉语基本词汇提取是自学习的过程。首先,利用遗传算法分析语言学家列举的基本词汇的三大特征,从中学习并总结出这些词语遵循的规律。然后,根据获得的规律在“工程现代汉语通用词”词表的基础上进行计算。文中详细的叙述了遗传算法的操作过程。
其他文献
多源传感器图像融合就是将来自多个信息源的图像数据加以处理与综合,产生比单一传感器数据更精确、更可靠的描述和判决,使融合图像更符合人和机器的视觉特性,更有利于诸如目标检
随着因特网和个人电脑应用的不断普及,信息安全问题受到人们越来越多的关注。日益增多的各类黑客攻击、木马和计算机病毒严重地威胁着全球的计算机信息系统。其中,个人电脑又是
随着IEEE 802.11等无线接入技术的发展,无线Mesh网络已经逐步成为企业界和消费者瞩目的焦点之一。如何提高无线Mesh网络的容量来满足用户日益增长的带宽需求(如实时音频、视频
随着我国信息化发展进程加快,信息化覆盖面扩大,信息安全问题也就随之增多,其影响和后果也更加广泛和严重。同时,信息安全及其对经济发展、国家安全和社会稳定的重大影响,正日益突
在这个信息化时代,由于互联网的迅速发展和电脑的普及,万维网已成为具有无穷潜力的信息索取和信息交换能力的全球信息资源中心,它对人类的各方面行为将产生日益重要的影响。
缺陷管理作为软件项目管理中的重要环节,目前其管理模式依然是:找出缺陷、修改缺陷、进行回归测试这种面向流程处理的传统模式。如何有效的对软件缺陷进行管理?如何对缺陷进行
信息检索是中文信息处理中的一项重要课题,其内容涉及到术语抽取、词义消歧、句法分析等方方面面,同时在机器问答、自动文摘、统计机器翻译等各领域又有着广泛的应用。为了减小
随着信息技术的飞速发展,Internet已经发展成为当今世界最大的信息库,并且成为全球范围内传播信息和获取信息的最主要途径之一。Internet上出现越来越多的信息,同时也出现了越来
随着无线通信技术的发展,提供移动Intemet接入的无线网络正逐步改变着人们的日常生活。目前得到广泛应用的无线局域网(Wireless Local Area Network,WLAN)是一种单跳的无线接入
每年在汽车交通事故中死亡的行人数目庞大,基于保护行人、避免交通事故的目的,行人检测系统已成为目前国内外智能交通领域公认的一个研究热点。 行人检测系统是一种车载辅助