基于动态自适应语言模型的手机中文输入系统的研究与实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户:huangshuhui1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手持设备的广泛应用对汉字输入技术的要求越来越高。本文通过对智能输入技术的研究,构建了动态自适应语言模型,并将此模型与输入系统实现技术相结合,实现了一个基于动态自适应语言模型的中文输入系统,最终将此系统应用于手机平台上。首先,本文讨论了数码输入法的编码方案,介绍了智能输入技术中普遍采用的n元语法模型以及本文为了解决数据稀疏问题所使用的数据平滑算法和评价系统优劣的性能测试指标。在此基础上提出了一个动态自适应语言模型框架。其次,为了使语言模型具有领域特征,本文提出了构造领域语言模型的方法,确定了加载领域语言模型的策略和领域语言模型的初始规模;同时改进了用户语言模型,使其能够动态适应不同的用户;提出了一种模型融合方法,此方法不仅有效融合了动态自适应语言模型,而且能解决领域语言模型的数据稀疏问题。然后,将融合了领域语言模型的动态自适应语言模型应用于中文输入系统中,并且测试领域语言模型的加载对中文输入系统性能的影响。结果显示,该系统的性能有了明显提高,这表明本文提出的动态自适应语言模型具有较好的实用价值。最后,本文在分析了Android的系统架构以及其输入法接口和输入特性的基础上,详细描述了基于该平台实现一个中文输入系统的过程。
其他文献
温室环境调控是一个多输入、多输出、非线性强的控制过程,用常规的控制方法来处理有时很难获得比较理想的效果,因此,对温室的控制需要引入智能控制的方法来解决那些难以用传
随着机器翻译技术的迅速发展,命名实体识别与翻译研究取得了突破性的进展,它是在自然语言处理中的关键性研究分支。如今,汉语-维吾尔语机器翻译领域中开展了大量的研究工作。
随着模型驱动开发技术的逐渐成熟以及代码自动生成技术的出现,基于模型驱动的开发方法在软件开发领域被广泛应用。模型驱动开发使得开发人员可以更多地关注于系统逻辑设计,即在
蛋白质-蛋白质对接是指在两个蛋白质分子之间试图找到最好匹配,蛋白质-蛋白质相互作用过程中通常会发生骨架构象变化,蛋白质-蛋白质骨架柔性对接就是设计相应的对接算法和协议
现代DSP(Digital Signal Processor)处理器大多使用VLIW(Very Long Instruction Word,超长指令字)体系结构,它主要通过挖掘指令级并行性,即将多条指令放在同一时钟周期发射来
电子技术、计算机技术、通信技术的飞速发展为我们的生活带来了便利,也为医疗体系的发展带来了新的机遇。无线通信技术已经在医疗监护领域取得广泛应用,主要包括远程医疗、跟
微弱信号检测是一门新兴的学科,从噪声背景中提取微弱有效信号是近代信息论中的一个重要内容,也历来是信号处理领域的核心问题和前沿课题之一。利用传统的功率谱,线性滤波等
在我国,由于人口众多、地区发展不平衡,教育资源分配也不均衡。在某些地区教育资源还是非常缺乏,东部沿海开放地区集中了大量的优势教育资源,而广大的西部地区教育资源却非常
H.264/AVC是最新的国际视频编码标准,该标准具有更强的网络适应能力,代表了未来多媒体数据压缩编码的发展趋势。及时跟踪和掌握H.264/AVC的核心技术,并结合实际应用在某些关
随着Internet的快速发展,关于某一主题的信息会通过不同渠道充斥着整个互联网。面对大量内容相近的主题文档集,有效地获取到真正需要的信息变得越来越困难。如何向用户提供全