一种改进的统计与后串最大匹配的中文分词算法研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:guocheng19896230801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确性、效率以及生词辨识上取得了良好的效果。
其他文献
自行研制的三维并行全电磁PIC模拟软件UNIPIC-3D具有模拟高功率微波器件的能力。软件实现了并行的三维FDTD、粒子推进算法以及边界条件处理。软件通过读入输入文件进行规则与
针对模糊聚类神经网络FCNN原有学习算法对初值敏感性、吸引域不灵活和稳定点不合理等局限性。本文提出基于统计检验的模糊聚类神经网络FCNN-ST。通过引入T平方抽样的单峰分布
在技术创新扩散过程中很少创新是一进入市场就被立刻采用的。当具备采纳创新技术所需的财务条件时,企业主要考虑何时及如何配置各资源比例达到效用最大化的问题,这是一个多阶段
2005年以来,成都市新都区认真贯彻落实《中共中央关于进一步加强中国共产党领导的多党合作和政治协商制度建设的意见》,结合实际制定了《关于聘请党外人士担任特约人员实施意
嵌入式系统的发展和普及应用使得在嵌入式系统平台下设计虚拟仪器成为构建仪器系统的新思路。本文提出了使用AD7864与ARM S3C2410构成数据采集系统的方案,设计了AD7864与S3C24
信息社会的需求促进了软件工程专业的发展。在行业型高校内建设软件工程专业,所面临的问题和机遇具有其独特性。本文根据中国地质大学(北京)多年来教学工作经历,从学科定位、