基于WBLDA的学术文献摘要主题聚类

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:tutu321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为使科研人员节省时间,高效阅读学术文献信息,提出一种学术文献摘要的主题聚类模型——优化主题数目作者层主题聚类模型(WBLDA)。首先在预处理阶段,自定义符合学术文献摘要特点的分词词典和停用词词典,解决学术文献摘要分词不准确的问题;在特征提取阶段,提出增大词频特征提取方法(ITF-IDF),使用词频放大法来增大词频,弱化文本长度对特征权重的影响,提取出更加符合学术文献摘要方向的特征词;最后,针对传统主题模型忽略作者这一重要属性的缺点,在主题聚类模型中引入学术文献摘要的作者信息,构建文档—主题+作者—词的WB
其他文献
近年来,随着智能化技术的飞速发展及其在军事领域的深度应用,人们对智能武器的担忧与日俱增:智能武器发展到一定程度,会不会调转枪头指向人类?特别是在去年年底,网络上的一段假想机
报纸
目的探究重度妊娠高血压综合征患者剖宫产围手术期护理方法及效果。方法抽取在我院采取剖宫产进行分娩的100例重度妊娠高血压综合征患者作为观察对象,根据患者的入院顺序分单
关于翻译文学归属的问题存在几种不同的争论观点,本文阐述了不赞同这几种观点的原因,尤其是主流观点——翻译文学是民族文学的一部分。翻译文学应当是相对独立的部分,但与外
随着结肠镜技术的发展,越来越多的结肠息肉患儿在结肠镜下行高频电切除得到有效治疗。我院自2000年7月至2007年8月对53例患儿行结肠镜检查,查出结肠息肉36例,全部行结肠镜下手术
目的:观察血府逐瘀汤联合达因-35治疗多囊卵巢综合征的临床疗效。方法 :选择医院中医内科门诊就诊的多囊卵巢综合征患者,共72例,根据随机数字表法将患者随机分为观察组和对照组
詹姆斯·奥康纳,是20世纪90年代末期生态学马克思主义的领军人物之一,他提出的生态学马克思主义为我们看待全球生态危机,协调人与自然关系提供了一个新的视角.奥康纳认为,
该工程钢筋混凝土灌注桩施工最大桩长约67m,直径1m。此种超长钢筋混凝土桩,对于桩垂直度的控制、成孔缩径的预防、泥浆的制作、混凝土的灌注、复合后注浆工艺等施工技术与施工
离子液体以其蒸汽压低、热稳定性好、良好的溶解性和可设计性等特性在萃取分离领域应用广泛。本文就离子液体性质、离子液体-分散液液微萃取模式进行介绍,重点综述该项技术在
大宝系列护肤品自1990年诞生至今,适应了不同时期、不同层次的消费需求,已陆续形成护肤、洗发、美容修饰、香水、特殊用途共五大类100多个品种.我们这里仅对护肤品稍作探讨.
采用Aspen Plus模拟软件对连续侧线出料精馏提取纯正丁醇和异丁醇的工艺进行模拟计算,考察塔板数、回流比、原料进料位置及侧线出料位置等对分离效果的影响,经优化得到连续侧