基于既定词表的彝文自动分词技术研究

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:bo0316
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动分词是彝文信息处理中一项不可缺少的基础性工作,彝文信息处理只要涉及到检索、翻译、校对等,就需要以词为基本单位.根据彝文的特点,介绍了彝文分词规范与分词词表的设计,提出了实现基于既定词表的彝文自动分词技术的算法选择、系统结构,以及实现流程;而且进行了抽样测试,其分词准确率和速度都比较令人满意.最后结合彝文的特点对实现彝文自动分词的难点进行了分析.
其他文献
目的 探讨MCV、RDW和红细胞计数在地中海贫血筛查中的临床价值和意义.方法 采用回顾性分析方法,分析地中海贫血患者及健康体检人员的MCV、RDW和红细胞计数的变化情况.结果 地
目的:探讨慢性牙周炎患者与其口腔中的幽门螺杆菌(helicobacter pylori,HP)的相关性。方法:依据HP特异的尿素酶C和cagA基因设计引物,建立PCR方法。检测37例牙周炎患者口腔菌
目的对术前放化疗(新辅助放化疗,CRTS)与单纯手术(S)治疗食管癌的随机对照试验研究(RCTs)进行Me-ta分析,探讨CRTS对食管癌手术及预后的影响。方法 PubMed及手工检索所有已发
该文以卡拉胶为原料,采用双氧水降解,制备出一种低密度脂蛋白净化剂.考察了净化剂浓度、净化体系pH值对血浆低密度脂蛋白胆固醇(LDL-C)净化效果的影响,得到较优化的诱导沉淀
目的探讨急性白血病患者化疗前、后外周血T淋巴细胞亚群变化及临床意义。方法采用流式细胞术对30例急性白血病患者及18例正常人外周血T淋巴细胞亚群进行检测,并对急性白血病
例1 女,46岁,病程2年,缓慢进行性言语减少、生活懒散、反应迟钝,偶有走楼梯摔倒.2h前突然意识丧失,四肢抽搐,呈强直阵挛抖动,静注安定2次共20mg抽搐无明显缓解于2011年4月27
医学生人文素质的养成受家庭、社会和学校教育等各方面因素的影响,其中家庭影响起直接作用,社会环境起决定作用,学校教育起主导作用.必须重视并协调各方面的影响因素,充分发
目的 研究人类免疫缺陷病毒(humam immunodeficiency virus,HIV)感染者中合并结核(tuberculosis,TB)感染的流行病学特征和相关影响因素.方法 对1139例HIV感染者或艾滋病(AIDS
文章利用FDS软件建立柳塔煤矿井下12煤通风系统巷道的三维模型;在矿井采空区域遗留矿柱设置火源,采用混合分率燃烧模型模拟火灾烟气蔓延过程;通过对FDS模拟结果进行分析,得到
基于无线传感器网络技术的面向综采工作面的矿井瓦斯监控系统。采用Zigbee无线网络技术、射频集成芯片技术和802.15.4协议,结合无线网络传输技术,以及数据库管理、数值分析等