【摘 要】
:
在维吾尔语中,词缀的数量有限且构词具有一定的规律性.为了提高维吾尔语词切分算法的性能,在一个词缀库的基础上,通过分析维吾尔语的基本构词规则,提出了一种改进的非监督维
【机 构】
:
中国科学院新疆理化技术研究所,中国科学院研究生院
论文部分内容阅读
在维吾尔语中,词缀的数量有限且构词具有一定的规律性.为了提高维吾尔语词切分算法的性能,在一个词缀库的基础上,通过分析维吾尔语的基本构词规则,提出了一种改进的非监督维吾尔语词切分方法.该方法对词进行规则切分,采用MAP切分评价模型对规则切分打分,选取得分最高的规则切分作为该词的最终切分形式.在一个5000词的测试语料上进行了实验,实验结果表明,使用该方法进行维吾尔语词切分具有更高的准确率.
其他文献
目的:观察健康教育对高原地区产褥期母婴健康的影响,以提高产科护理质量.方法:对产后1周、2周、6周母婴健康调查登记,主要内容为产褥期病史、生活习俗,对母婴健康状况进行评
目的:通过对本院输血患者进行聚凝胺法配血,探讨聚凝胺配血实验在保障临床输血安全有效方面的重要作用.方法:对本院986例输血患者与ABO同型献血者进行盐水法及凝聚胺法交叉配
目的:了解不同孕期健康妇女血清CYsC的动态变化。方法:血清半胱氨酸蛋白酶抑制剂C(CYsC)采用免疫比浊法。结果:正常对照组血清CYsC的结果为(0.81±0.11)mg/L。早孕为(0.61±0
目的:了解我院2010年1月—2011年12月院内临床分离菌对各种常见抗菌药物的耐药性.方法:采用微孔板稀释法进行体外药敏试验,按照CLSI标准判断耐药、中介、敏感.结果:2010年1月
目的:探讨超声在乳腺结节性病变中良恶性鉴别的诊断价值.方法:回顾性分析病理已证实为小乳腺癌和乳腺增生结节的二维声像图及彩色多普勒特征.结果:恶性肿块表现为边界欠清,纵
目的:分析长期生活在高原4 500m地区藏族人群血脂水平.方法:对治多地区藏族与西宁(海拔在2260m地区)藏族人群进行TC、TG、HDL-C、LDL-C四项指标进行分析.结果:治多地区藏族居
目的:了解造成血液报废原因,采取有效措施和预防手段降低血液报废率。方法:收集2009年1月1日—2011年12月31日海东地区血液报废情况统计分析。结果:造成血液报废主要原因是转
目的:探讨影响麻风病人治愈出院的相关因素及护理.方法:针对存在的问题实施护理健康教育、心理护理、畸残康复指导.结果:2002年—2011年10例麻风患者治愈出院心理状况稳定.结
目的:了解和掌握贵德县居民户碘盐食用情况,为制定防治策略提供依据。方法:根据《全国碘盐监测方案(修订)》和《全国碘缺乏病监测方案(试行)》中规定的方法进行干预,盐碘测定
目的:探讨中药保留灌肠治疗慢性肾功能衰竭的临床疗效。方法:将76例慢性肾功能衰竭患者随机分为两组,各38例,对照组采用抗感染、保肾排毒、降压利尿、纠正酸中毒等综合治疗;