基于词同现频率的文本特征描述

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：tezon1

【摘要】

：

文本的特征描述是文本自动处理的基础工作之一,目前的文本特征描述一般采用加权VSM模型,该模型大都使用统计的和经验的加权算法,该算法方便了计算机对中文文本的相似度计算,

【作者】

：

余刚陈华月朱征宇高原

【机构】

：

重庆大学

【出处】

：

计算机工程与设计

【发表日期】

：

2005年8期

【关键词】

：

向量空间模型文本挖掘词同现频率权重计算匹配 VSM （vector space model） text mining word co-occurrenc

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本的特征描述是文本自动处理的基础工作之一,目前的文本特征描述一般采用加权VSM模型,该模型大都使用统计的和经验的加权算法,该算法方便了计算机对中文文本的相似度计算,但不能很好地揭示文本中词与词的关系.针对此缺点,提出了一种基于词同现频率的加权算法,使得文本的特征向量蕴涵了词与词的相关信息,最后用实验对该算法的效果进行了证明.

其他文献

对轧钢加热炉排烟系统大修改造的技术效果分析

1前言加热炉是热轧厂的重要热工设备,它所消耗的主要能量--热能的来源,是依赖于燃料的燃烧.凡是利用各种燃料燃烧后放出的化学热作为热能来源的炉子,统称为燃料炉.由于燃料燃

期刊

轧钢加热炉排烟系统大修改造技术效果分析

努力推动新时代教育高质量发展——全国教育大会精神学习体会

教育发展应当把握方向、找准问题、谋划措施,全面落实好全国教育大会精神和习近平总书记对教育工作的一系列重大论断,抓住问题提质量、盯住质量促公平、提高质量为发展,为推

期刊

教育主要问题质量公平发展

TNFα介导钙离子内流促进肝癌细胞凋亡的作用及机制研究

临床前研究结果表明TNFα诱导肿瘤细胞凋亡呈剂量依赖性。然而,临床试验发现,在肿瘤治疗过程中,TNFα治疗诱发了显著的全身性毒性,并且患者对TNFα的最大耐受剂量较低,这严重

学位

TNFα细胞凋亡钙离子内流肝癌

基于互联网的中小企业信息化业务平台探讨

文章从中小企业信息化现状出发，讨论了基于互联网的中小企业信息化业务平台的特点和基本架构，阐述了基于互联网的中小企业信息化业务平台的实现方案，包括系统架构、主要功能等。

期刊

中小企业信息化ASP系统架构

舰载武器系统综合信号源的设计

在舰载武器系统综合信号源的设计中,利用串行总线RS232C和ISA总线完成了系统硬件的构建,利用面向测控领域的软件开发平台Lab Windows/CVI进行了软件的开发.

期刊

RS232CLABWINDOWS/CVIISA总线串行通讯舰载武器系统综合信号源RS232 Lab Windows/CVI ISA bus ser

照片的电视新闻传播效应探析

从传播学的视角，分析了照片在电视新闻中的作用与优势，并就照片作为电视新闻传播符号应该树立的观念进行了探讨，以提高电视新闻质量。

期刊

新闻照片电视新闻传播效应news pictures TV news transmission effect

中小企业实施ERP过程中存在的问题

ERP作为一种现代化的企业管理软件，正在被许多企业所认可，文章主要阐述了中小企业在实施ERP过程中所存在的问题，给中小企业实施ERP起到了一个指示灯的作用。

期刊

ERP系统数据库结构供应链

基于词同现频率的文本特征描述

其他学术论文