【摘 要】
:
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。
【基金项目】
:
国家社科重大基金项目(09&ZD014);国家“863”计划资助项目(2007AA01Z439)
论文部分内容阅读
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法。该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法是有效的,显著提高了生成摘要的质量。
其他文献
<正> 当前,比较方法在社会科学的研究中日益受到人们的重视。比较历史学、比较文化研究已成为当代最热门的课题。但是,如果我们去探讨目前应用较广泛的比较方法的基础,就可以
该文介绍了一种在网络机顶盒遥控器上实现的维吾尔语输入法,输入法采用遥控器上的数字键2~9和5个控制键来实现维吾尔语的字符输入。首先,对网络机顶盒、维吾尔语字母特点进行
叙述了高分子材料紫外光辐照接枝改性的方法及其应用,并对其发展作出了展望.
目的探讨西藏小型猪的生理生化指标特性。方法采用全自动血球计数仪和全自动生化仪,对1.5~5月龄西藏小型猪(♂21,♀24)血液的部分生理和生化指标进行测定和分析。结果西藏小
随着因特网的迅速发展,网络已经成为人们获得信息的必要途径和重要手段,而其中Flash动画媒体类型的资源建设作为教育技术领域的一个重要组成部分日益受到人们的重视。Flash资
医疗风险的复杂性决定了需要构建多层次的医疗风险分担机制,由政府、社会、市场各方力量共担医疗风险。其中,商业保险作为专业化的风险管理手段,不仅能够对可保医疗风险进行
通过对 12根钢筋混凝土梁的斜截面抗剪试验 ,研究了采用外加螺栓箍筋、梁侧膨胀螺栓固定钢板、梁侧粘贴钢板网、外贴 U形碳纤维布对梁进行抗剪加固的效果 ,并与未加固的钢筋
<正>利用近50年气候观测资料,统计分析了天津市日光温室发生低温灾害天气的变化特征,同时,通过对2011~2012年度三类典型日光温室小气候观测数据处理,获得低温灾害发生特点,并
建立了大位移井岩屑位移全流场几何模型,采用结构化六面体网格单元进行了适当的网格划分,应用SIMPLE算法实现速度和压力之间的耦合,完成了不同偏心距下流场与气固相体积浓度