【摘 要】
:
该文提出了一个应用n元语法模型(N-Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一
【机 构】
:
中国科学院计算技术研究所软件研究室
【基金项目】
:
国家863高技术研究发展计划资助(编号:2002AA142110)
论文部分内容阅读
该文提出了一个应用n元语法模型(N-Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni-Gram,建立在语料库的基础上,仅用输入前N个字的字频计算输入串的生成概率,可以高速、准确识别。
其他文献
在骨干网中,BGP/MPLSVPN使用MPLS进行包转发,用BGP进行路由信息的分发,是设计未来虚拟专网的必然趋势。论文主要分析了BGP对VPN路由的分发过程,并针对在CISCO路由器上进行MP-
边界网关协议(BGP)是目前域间路由事实上的标准,但是该协议缺少必要的安全机制,存在很多漏洞,面临许多安全威胁,如某个被误配置或控制的BGP路由器可能会导致大规模网络中断。
就像面膜为补充水分和营养一样,发膜是头发的"面膜",能够滋润、加强及帮助重组头发的纤维组织,修护和改善发质,尤其是干枯的头发,以及电烫、漂染等受损的发质。定期使用,能令
目前企业对绩效考核的重视程度日益趋增,在绩效考核方面也出现了多种方法如平衡计分卡、360度考核等,本文通过对X公司销售部原有的绩效考核体系说明并指出不足之处。在此基础
介绍了一种基于GSM网络的智能家居控制系统的功能、工作原理及实现。采用PIC单片机为系统控制核心,对家居中可能出现的意外情况用各种传感器进行采集,利用GSM模块的短消息收
长期以来,我国人才培养存在着“三类、四化”状况,即:学外语不会讲话,学经管不会做商务谈判方案;学了商务单证却不会做单。课程设置非专业化,教师匮乏化,教学模式传统化,教学
该论文的工作基于一个已完成的部级科研项目,在这个项目中,研制出了可实用的IP同关。该文讨论了该网关的路由解决方案。首先说明了路由协议的不同形式,接着讨论了RIP协议所使用
随着教育改革的不断深入,给学生减负、提高教学效率越来越受到重视,笔者认为可以从三个方面入手:(1)做好课前准备,这是提高教学效率的前提。课前准备要发挥集体备课的力量,形
初次分配和再分配是解决收入分配问题的“两个轮子”,缺一不可。在初次分配中拉开的收入差距,需要通过再分配予以“调节”或“收敛”。本文针对我国再分配中存在的“逆向调节”
脑出血系指非外伤性脑实质内的出血,是临床上常见的一种血管疾病,致残率、病死率高,严重威胁患者的身心健康和生命安全,易并发多种并发症。肺部感染是脑出血患者常见而严重的