一种基于义原信息量的词语相似度计算方法

来源 :电脑与信息技术 | 被引量 : 0次 | 上传用户:qq912214209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国内利用知网计算中文词语相似度通常采用基于义原距离和深度的方法,计算结果依赖于公式的设计和参数的选取。针对词语相似度的计算,文章提出采用知网义原信息量来计算中文词语相似度,根据信息论中计算两个事物相似度的思想,利用知网的分类体系来计算义原信息量,从词语概念的主类义原信息量、义原及其角色关系的信息量及义原结点相似度三个方面来综合计算词语的相似度,与刘群和知网在线的方法进行比较,实验结果显示本文方法与人的判断更为接近。
其他文献
在视频监控中,经常会出现画面模糊及叠加噪点等现象,必要时需要对画面进行复原处理。针对这一问题,对于图像复原的经典算法逆滤波和维纳滤波进行了深入分析与仿真,比较两种算法的复原效果以及各参数对效果的影响。仿真分析结果表明,在退化相同情况的情况下,维纳滤波比逆滤波的复原效果要好;在维纳滤波中,对于退化系统的参数已知的越多,估计的越精确,复原效果越好。因此,对退化模型进行精确的估计是精确复原的重要前提。
指出了通过遗传育种手段,可使母猪的繁殖潜力得到极大提高。但母猪日粮的能量水平与脂肪酸平衡,之前一直没有受到足够重视。进行了两组试验:分别在哺乳期日粮中添加等量(3%)
资本市场的快速发展,我国上市公司已经形成规模庞大、行业分布广泛,经济运行中的优势群体。盈利较强的上市公司逐渐成为资本市场的骨干力量,而处于成长期的中小上市公司的发
矢量数据结构编码有多种方法,其中多边形矢量编码方法使用简单,数字化操作容易,数据编码直观,但相邻多边形的公共边界别数字化两次,造成数据冗余,引起数据不一致,同时难以检查出多边形边界的拓扑关系是否正确,而索引式矢量编码表要人工建立,工作量大且容易出错。文章结合多边形编码和索引式矢量编码方法并借鉴Morton码的原理,提出关于矢量数据结构编码的改进方法。
目的:探讨新式剖宫产术的效果。方法:采用新式以色列术式对208例有手术指征的产妇进行了剖宫产手术。结果与结论:新式剖宫产术手术操作简便,损伤少,顺应人体解剖结构,术后恢复快,预
通过对静态背景下多运动目标监控视频的研究,分析得到了视频图像序列中运动目标的特性,实现了背景预测目标检测法。在此基础上,实现了Mean Shift目标跟踪算法,取得较为满意的跟踪结果,并给出了形心多目标跟踪方法的具体实现。通过实验证明该方法可同时实现对多个人体运动目标的实时跟踪,具有一定的理论和实用价值。
目的:通过临床观察及分析,客观分析以健脾除湿化瘀为治则的自拟方对2型糖尿病前期属脾虚痰湿瘀阻证的临床疗效及安全性,进而探讨其作用机理。方法:收集2014年5月到2015年10月
识字教学是小学语文教学的基础部分,是培养学生综合素质的前提,我们在指导小学语文识字教学活动的过程中,需要合理选择教学方法,为小学生的综合素质培养和能力提升提供助力。