【摘 要】
:
缩略语在汉语中的高频使用,使得缩略语的识别成为中文信息处理不可回避的问题。利用规则对初分词后形成的散串进行缩略语的识别,然后利用缩略语相对稳定的抽取规律这一特性,
【基金项目】
:
基金项目:国家自然科学基金项目(60473139、60775041).
论文部分内容阅读
缩略语在汉语中的高频使用,使得缩略语的识别成为中文信息处理不可回避的问题。利用规则对初分词后形成的散串进行缩略语的识别,然后利用缩略语相对稳定的抽取规律这一特性,通过统计生成缩略语字对应原语言词的词典,利用匹配概率和共现概率进行缩略语对应原语言的还原。在实验中,经封闭测试,缩略语的识别正确率为93.0%,召回率为94.3%,缩略语的还原正确率为72.3%。
其他文献
基于资源的信誉度,提出一种经济模型下的网格资源调度策略。由用户自己设定各因素的重要性,调度器根据用户提交任务的需求不同,将任务放到对应的任务队列中,各队列调用不同的调度
智能变电站以全站信息数字化、信息传输通道网络化、基于IEC 61850的统一建模为根本特点,智能变电站继电保护的“系统”属性更明显,体现在继电保护功能的实现依赖于设备间的
UML是工业界建模的标准语言,适用于嵌入式系统的开发。工业现场总线通信协议栈是一个典型的嵌入式系统,通过研究现场总线通信协议的通用抽象模型,可为通信协议栈的开发与验证
伴随着科学技术的飞速发展,互联网已随着多媒体技术的应用并发展起来。在高校的美术教学中,多媒体技术被广泛应用,它不仅丰富了课堂教学形式提高了教学质量,而且提升了学生的
介绍了Ad hoc网络中使用的AODV及DSR路由协议,针对Ad hoc网络移动的机动性、分组发送的随机性、节点数目的不确定性及发送分组大小的可变性,对文献[1]所采用的仿真场景进行了
在分析了RBAC、TBAC等模型存在局限性的基础上,结合单点登录的高校综合信息管理系统的特点,提出了一种新的基于动态目录树、权限匹配码的权限管理模型,并在高校综合信息管理系统