基于句子成分的微博热点主题挖掘模型研究

来源 :情报科学 | 被引量 : 0次 | 上传用户：baiawquqf

【摘要】

：

由于传统聚类分析中文本相似度计算方法不适用于短文本,本文选用基于句子成分的相似度计算方法来计算微博文本之间的相似度。首先对文本进行句子划分,再通过句法分析获取微博

【作者】

：

肖璐唐晓波

【机构】

：

南京大学信息管理学院,武汉大学信息管理学院,

【出处】

：

情报科学

【发表日期】

：

2015年11期

【关键词】

：

句法分析知网热点主题句子成分

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于传统聚类分析中文本相似度计算方法不适用于短文本,本文选用基于句子成分的相似度计算方法来计算微博文本之间的相似度。首先对文本进行句子划分,再通过句法分析获取微博的句子成分,选择构成句子成分的词语为特征词。利用知网计算两个微博文本之间相同成分词语的语义相似度,将语义相似度值按句子成分种类加权相加得到微博文本之间的相似度值。据此,构建文本相似矩阵,进行聚类分析,找到微博热点主题。最后,用实验证明本文方法的可行性。 Because the method of text similarity calculation in traditional cluster analysis is not suitable for short texts, this paper chooses the similarity calculation method based on sentence elements to calculate the similarity between Weibo texts. First of all, the text is divided into sentences, and then through the syntax analysis to obtain the composition of the sentence of Weibo, select the words that make up the sentence composition as feature words. The semantic similarity of the same constituent words between two Weibo texts is calculated by using the known network, and the similarity values between the two Weibo texts are obtained by weighting the semantic similarity values according to the types of the sentence components. Based on this, we construct a text similarity matrix and perform cluster analysis to find the hot topics of Weibo. Finally, the feasibility of this method is proved by experiments.

其他文献

校园贷变相加息套路多

“利率低至0．99％每月，真的低吗？”广东银监局等部门主办的2017年“送金融知识进校园”活动日前正式启动，广东省金牌讲师、交行工作人员史家宁在第一节金融课堂上起底，校园贷还款方

期刊

校园贷等额本息

关于5G传输网络的建设策略分析

在5G时代,相关技术的应用优势愈加明显,加快5G传输网络建设,成为了新时期的一项重要工作,也是一个研究热点。本文先对传输网络的特点和优势进行简析,然后在优化网络结构和加

期刊

5G传输网络建设策略

合力论视域下中西方文化价值观的差异及其根源

本文从合力论视角来分析中西文化价值观的形成、演进以及影响因素。中西文化价值观受到各自独特的环境、历史进程、哲学背景、经济形态和社会结构等因素变化的影响，这些因素对

期刊

中西文化价值观差异根源

顽固性呃逆的中医治疗进展

呃逆,俗称打嗝,是一种临床常见症状,由于膈肌不自主的阵发性痉挛收缩,气流突然流向肺内,声门突然关闭,声带震动所发出的短促响亮声音。呃逆中枢在脊髓颈段,膈肌、膈神经、迷

期刊

顽固性呃逆中西医结合治疗尿毒症中医治疗进展旋覆代赭汤加减疗效显著中风后呃逆总有效率

胸围、臂根围与袖窿深相关关系的比较

以分析胸围、臂根围与袖笼深的关系为例,通过建立数学模型,对数据的线性相关关系进行科学的研究.提出一种,对服装结构中数据进行研究的新方法.

期刊

胸围臂根围袖窿深相关关系科学方法

经尿道输尿管镜气压弹道碎石术的护理体会

目的：探讨经尿道输尿管镜气压弹道碎石术的护理方法及其效果。方法：对59例输尿管镜下行气压弹道碎石术的输尿管结石患者进行术前心理护理,常规术前准备和术后常规及相应的并发

期刊

输尿管结石输尿管镜气压弹道碎石术护理

光控频率可重构天线的研究与设计

可重构天线能够动态改变辐射特性,使其成为下一代无线通信系统中射频前端必不可缺的一部分。本文主要对光控微波开关及其在可重构天线中应用进行了研究,设计了多款光控频率可

学位

分层等离子模型光控微波开关频率可重构单极子天线光可重构天线

网络社会与老龄问题:机遇与挑战

人类进入网络社会，人口老龄化将与其相互伴生、相互影响。信息技术革命、新经济、缺场空间与经验传递方式等网络社会议题无不与老龄问题密切相关，可以说网络社会为我们应对人口

期刊

网络社会科技恐惧症缺场空间积极老龄化

夏季欧亚地区阻塞活动的年代际变化特征及其与中国降水年代际变化的可能联系

利用观测资料对夏季欧亚地区阻塞活动的年代际变化特征及其与我国降水年代际变化的可能联系进行了分析。结果表明: (1)夏季四个阻塞区域的阻塞活动都具有明显的年际变化。其

学位

阻塞高压中国夏季降水年代际变化

经尿道输尿管镜气压弹道碎石术的围手术期护理休会

目的分析经尿道输尿管镜气压弹道碎石术的护理对策。方法选择2013年12月至2014年8月在我院接受经尿道输尿管镜气压弹道碎石术的患者60例作为研究对象,随机分为对照组（30例）和

期刊

输尿管镜气压弹道碎石术围手术期泌尿外科

基于句子成分的微博热点主题挖掘模型研究

其他学术论文