基于语境框架的文本相似度计算

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lizhiguo518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了一种新的文本形式化的语义模型——语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。
其他文献
文章以秦皇岛市海港区为例,全面剖析了秦皇岛市海港区的区域经济核心竞争能力。
该文论述了实时网络入侵检测系统现有的缺陷,并通过对系统审计数据的分析,提出了一种基于小波变换时序分析的入侵检测方法。将该算法运用于入侵检测的时序分析中,可以较好地解决
文章结合实际,谈了穿沙公路路基施工技术中的几个方面,较好地反映出施工过程中应注意的问题,具有一定指导施工的参考意义。
该文在笔者以往研究的基础上,针对二值图像的特点,提出了一种结合数字水印和数字签名的算法,将该算法应用于二值图像内容验证。算法先从二值图像中提取签名值,然后把签名值信息作
文章提出建筑设计、细部构造设计和环境控制设备及系统设计等三种节能设计策略。充分利用自然能,降低不可再生能源消耗,促进我国建筑的可持续发展。
文章以对重庆工学院花溪校区图书馆新馆建设的设想为例,提出了高校图书馆应如何进行科学的划分和管理,以及信息时代对图书馆员的要求。
文章阐述了新疆地区县域经济的发展现状,对制约县域经济发展的因素作了比较深刻的分析,并就这一问题提出了建议。
网络流测量是网络性能分析和网络流量建模的基础。该文分析了网络流测量的方法及特点。针对高速网络流测量中的关键问题进行了研究,并在此基础上提出了高速网络流测量模型。随
介绍了某莹石矿尾矿高氟废水处理的试验成果,试验研究了除氟剂、混凝剂、助凝剂、pH值,投药次序与搅拌时间等影响因素,确定了废水处理流程和药量。该研究成果已用于生产实践,取得了