基于词向量的中文事件发现及表示

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:aizhuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
已有的事件发现方法主要基于词频-逆文档频率文档表示,维度较高,语义稀疏,效率和准确率都较低,不适用于大规模在线新闻事件发现.因此,文中提出基于词向量的文档表示方法,降低文档表示维度,缓解语义稀疏问题,提高文档相似度计算效率和准确性.基于该文档表示方法,提出动态在线新闻聚类方法,用于在线新闻事件发现,同时提高事件发现的准确率和召回率.在标准数据集TDT4和真实数据集上的实验表明,相比当前通用的基线方法,文中方法在时间效率和事件质量上都有显著提高.
其他文献
美国新英格兰女作家玛丽·威尔金斯·弗里曼在其短篇故事《一段好时光》中讲述女主人公纳西莎·斯通将父亲遗留的保险金挥霍殆尽,最终不得不回归平淡生活。弗里
目的:本文旨在通过对比第二代杂交捕获法(HC2)和多重荧光聚合酶链反应(PCR)在口咽鳞癌患者中对高危型人乳头状瘤病毒(HPV)的检测结果,比较两种检测方法的优缺点并验证HC2技术
目的:探讨冠状动脉旁路移植术后行经皮介入治疗(PCI)患者的临床及造影特点,为冠脉旁路移植术后患者治疗策略的选择提供参考。方法:分析150例搭桥术后行PCI患者的,临床及造影特点。
近年来,公共卫生事件、自然灾害、事故灾难、社会安全事件等各类突发事件频发,对公共卫生安全构成严重威胁,卫生应急管理和决策的复杂性和难度日益增加。风险评估是卫生应急
中职教育的核心教学理念是培养一批有专业技能的高水平人才,因此要求学生在校学习的过程中,将所学的知识运用到实践的操作中。由于中职数控的专业性要求过硬和目前教学现状的
文章在分析我国机动车辆保险发展现状的基础上,运用数据包络分析方法对我国27家产险公司的机动车辆保险经营效率进行了实证分析.分析结论找出了我国机动车辆保险经营中存在的问
沟通是我们每个人每天都要运用的技能,是每个人成功的必要条件。"良言一句三春暖,恶语伤人六月寒"充分表明了有效沟通的重要性,但在现实实践中,却很少有人能够用好它。美国著
目前,我国以增材制造为代表的先进制造技术正在快速发展,已成为越来越多企业实现产业升级和技术转型的新方向。我国高度重视增材制造技术及产业的发展,《中国制造2025》"十三
卵黄抗体已广泛应用于畜禽疾病的诊治,在对病毒性疾病的治疗中具有独特优势,其在猪病防治方面的研究与应用也越来越广泛。本文主要介绍了卵黄抗体在大肠杆菌引起的仔猪腹泻、猪
为研究水上交通事故中事故严重程度的影响因素,减小水上交通事故发生时的人员伤亡及财产损失,对2015-2016年的水上交通事故统计数据的分析。选取了水上交通事故数据中的船舶