面向特定人群的网络信息事件提取方法研究

被引量 : 0次 | 上传用户:dlzshy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的普及应用和互联网的迅猛发展,大量电子文本形式的信息呈指数级增长。为了应对信息爆炸带来的挑战,信息抽取(Information Extraction)作为一种将无结构的文本转化为结构化或半结构化的信息的研究方法受到空前的重视。事件的检测与识别(Event detection and recognition,又称事件抽取)被ACE(Automatic content extraction)评测会议定义为一项重要的基本任务,已经成为信息抽取、自动文摘等领域中的关键技术。其主要目的是把自然语言描述的事件以结构化的形式呈现,从而为后续信息处理与应用提供良好的数据条件。本体作为共享概念模型的明确的形式化规范说明,在信息处理、自然语言理解等人工智能应用领域发挥着越来越重要的作用。本文研究内容是面向特定人群相关领域网络事件的提取模型与算法。具体而言,选择公职人员这一特定群体,研究并解决涉及这一特定群体的网络事件类型识别、本体构建、事件元素抽取与处理问题。通过对这一特定主题的研究,分析并总结面向一般群体的网络事件提取的规律、模型与方法,丰富和发展面向海量网络数据的智能信息提取技术。本文的主要研究工作包括以下几个方面:1.通过对大量网络语料的分析整理和实验研究,利用事件触发词提取算法,并采用触发词聚类分析技术,提出了面向公职人员的事件本体半自动构建模型。2.在事件类型识别方面,提出了基于事件触发词与本体中概念相似度计算的事件类型识别算法,并通过与基于最大熵二元分类方法的识别技术比较,分析了本文方法的性能。3.在事件元素识别方面,提出基于事件本体的事件元素提取方法。该方法利用事件对应的事件模板结合SRL语义角色标注进行事件元素提取,并根据网页发表时间对事件的时间元素作进一步校正。所提出方法在面向公职人员事件识别和事件元素识别的平均F值均取得了较好的效果。本文研究对于面向特定人群相关网络事件分析提取具有普遍意义,在舆情分析等相关系统构建中能够发挥重要作用。
其他文献
在食用菌生产中,链孢霉是食用菌中恶性传染菌中比较常见的一种,其感染率高,感染迅速。分析了链孢霉的生活习性以及发生原因,提出了链孢霉预防和防治的措施,减少其造成的损失,
【目的】通过检测血清总胆汁酸(TBA)水平,确立该指标在婴幼儿肝炎综合征诊治中的意义。【方法】采用全自动酶法分析技术对65例婴幼儿肝炎综合征患儿及65例正常对照的婴幼儿进
【目的】探讨肝性脑病患者的临床特征和预后的影响因素。【方法】回顾306例肝性脑病患者的临床资料,对其诱因、复发、转归等进行分析。【结果】306例肝性脑病患者中C型占97.4
在电力建设日趋激烈的情况下,电力工程管理中出现了一系列问题。从电力工程项目管理的基础出发,对其特点、存在问题进行分析,并举出具体对策,希望对我国解决电力工程项目管理
贫困问题是全面建成小康社会最突出的短板,党的十九大报告指出,“要打赢脱贫攻坚战”,“让贫困人口和贫困地区同全国一道进入全面小康社会”。在此过程中,以产业为抓手的减贫措施,是实现贫困人口稳定脱贫和促进贫困地区高质量发展的关键动力。其中,旅游业作为一个具有多维减贫效果和关联带动作用的朝阳产业,能够有效提升集中连片特困区的减贫效果。那么,如何有效地联动配合区域发展与区域扶贫,通过发展旅游产业来减轻贫困,
以山西"两高"煤为研究对象,考察了洗选改变灰分对添加助熔剂Ca CO3的影响。研究发现,随着洗煤灰分的降低,煤灰中二氧化硅含量及硅铝比(Si/Al)降低,煤灰流动温度降低至液态排渣气
目的 :观察阿伦磷酸钠(alendronate,ALN)联合补肾中药———肾骨安(herbs,HB)对去势小鼠椎体终板、椎间盘退变(intervertebral disc degeneration,IVDD)的影响,初步探讨ALN+H
在中国古代小说视域下,长期缺失严格意义上的女性视角。明清长篇家庭小说藉由"家庭"这个窗口提供了女性生活的丰富画面,诸多类型的女性形象从此开始鲜活地跳跃于人们的视野。
目的探讨外伤性脾破裂和门静脉高压症患者脾切除后血小板的变化情况。方法随机选取广东医学院附属廉江医院2008年1月至2012年4月分别需进行脾切除的外伤性脾破裂患者45例和门
本文对SNCR技术的工艺原理、特点、工艺流程和系统组图进行介绍与分析,并介绍了SNCR技术在新疆某电厂的1#炉和2#炉的工程应用。