词义标注一致性检验系统的设计与实现

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:tp153c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义消歧是自然语言处理领域的一个重要研究课题。词义标注的一致性将直接影响语料库的建设质量,进而直接或间接影响到其相关的应用领域。由于语言本身的复杂性与发展性以及算法设计的难点和缺陷,目前各种词义标注的算法与模型还不能百分之百正确地标注词义,即不能保证词义消歧的正确性与一致性。而人工校验在时间、人力方面的投入是个难题。该文在对《人民日报》语料、语句相似度算法和语义资源《知网》研究的基础上,提出了对《人民日报》语料词义标注进行一致性检验的方法。实验结果表明,此方法是有效的。
其他文献
<正>21世纪,社会环境和市场竞争状况发生了前所未有的剧烈变化,全球一体化成为一种不可逆转的趋势体现在社会的各个领域,多媒体技术的迅猛发展,也使得传统媒体走向多样化,整
目的探讨花粉浓度对过敏性鼻炎临床症状及抗过敏治疗效果的影响。方法 2010年3~4月采用RotorodModel 40容量法花粉采样器每日监测空气中悬铃木属花粉的浓度;3月份选择30例法
目的:研究锁阳多糖抗胃溃疡的作用及其机制。方法:采用乙酸烧灼法建立大鼠胃溃疡模型,给予锁阳多糖进行治疗12天后检测大鼠溃疡指数及血清中超氧化物岐化酶(SOD)、丙二醛(MDA
相对文化软实力研究而言,文化软实力数量评价硬指标体系的构建是一项严谨而又复杂的科学事项。本文正是基于这一目的,在构建文化软实力的硬指标体系及其统计评价模型上作个从
我国农、林业虫害危害范围和程度日益加剧,给生态环境和国民经济带来严重影响。本文根据文献记录和野外调查,系统整理了全国农、林业植物检疫性害虫分布特征,并用主成分分析
<正>迄今为止,就宁夏青年作家群创作的整体状况而言,尽管也取得了一些不错的成就,但也存在着不少问题,比如创作题材的相对偏狭,长篇创作的相对薄弱,创作风格的相对
分解方法是处理复杂问题常用的一种手段,而差分进化算法被广泛地应用于多目标优化问题(multiobjective optimization problems,MOP),为了克服经典差分进化算法和分解方法的缺
<正>弋舟:看过你的一些短篇小说,先说说我粗略的感觉。我觉得你是那种非常鲜明的"经验型"的作家。当然,我们所有的写作,都有关自己的经验,但的确有一部分作家,写作的基本驱动
藓类植物的无性繁殖方式复杂多样,在多变、极端或不可预测的环境中具有明显优势。按形态特点,藓类植物的无性繁殖方式分为营养繁殖和特化的无性繁殖方式2种,特化的无性繁殖体
运用种间联结测定方法研究了天山北麓中段拟南芥(Arabidopsis thaliana)生存群落24个主要种群的种间联结特征。结果表明:群落内物种总体联结方差比率(VR)为1.55,表现为显著正