基于互联网新闻的灾情信息采集系统构建

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:lm20090910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,全球范围内自然灾害频发,造成了严重人员伤亡和财产损失。灾情信息作为灾害发生时应急决策重要依据,及时、准确、全面的收集灾情信息,能够让救援力量快速的到达受灾位置,开展救灾行动。国务院办公厅颁布的《国家综合防灾减灾规划(2016—2020年)》中提到要加强基础理论研究和关键技术研发,推进“互联网+”、大数据、物联网、云计算、地理信息、移动通信等新理念新技术新方法的应用,提高灾害发生时的信息获取能力。本文借助机器学习、文本分类、文本信息挖掘、互联网爬虫等技术方法开展基于互联网新闻的灾情信息收集研究,以期能拓展灾时的信息来源,提升灾情信息收集的能力,为应急管理工作提供信息支持,并以湖南省为案例地区,开发系统原型。本文的工作主要包括以下几方面:新闻分类器构建。利用机器学习和文本分类的方法,通过采集的新闻语料构建新闻分类器,对比了不同文本分类方法、不同文本表示方法、均衡数据集与非均衡数据集以及集成模型与单个模型间的性能差异,最终的结果显示以词向量模型作为文本表示方法,基于均衡数据下所训练的四种新闻分类器所构成的集成分类器的性能最为优异,F1值为0.926,并将此分类器作为系统最终使用的新闻分类器。灾情信息提取研究。通过对新闻主体内容的分析,研究新闻内容中时间信息、地点信息、灾损信息在新闻中的结构规律,根据规律编写提取规则,最终达到文本信息结构化的目的。并借助高德地图提供的地理编码API将地点信息转换为经纬度信息,为地点信息的空间展示提供了基础。系统原型设计与开发。在设计与研究的基础上,运用Python、HTML、JavaScript、WebGIS等开发技术构建面向互联网新闻的灾情信息收集系统,实现新闻的自动化采集,基于新闻标题的新闻自动分类,新闻主体中灾损信息提取与结构化,灾害发生地点信息的地图展示,并结合系统实际运行情况对系统进行验证,检验系统的可行性。
其他文献
大港油田关家堡地区油气藏特征复杂,不同含油层系油气显示特征不同,气测录井解释符合率相对较低。针对这一情况,通过分析关家堡地区明化镇组、馆陶组和沙河街组的地质和气测显示
【正】 恩格斯在德國農民战争一書論及封建時代的農民戰争时,曾說: 雖然中世紀曾有過廣大農民的地方暴動,可是——至少在德國——在農民戰爭以前,沒有看到全國的农民暴动,况
随着《义务教育数学课程标准》(2011年版)(以下简称《标准》)的颁布实施,从2012年开始,各版本教材也相应有很大的变化.因此,从2015年开始,各地中考试题也纷纷较之往年有较大调整,
一、通过对优秀历史人物的教学提高中学生的伦理道德水平历史是最生动的伦理学教材 ,它使人心智广博 ,品德高尚。如果离开历史人物及其活动的讲授来谈伦理道德 ,那只是一种空
随着家庭渔业和休闲渔业的兴起,观赏鱼养殖倍受青睐,但要养好观赏鱼,不仅要重视日常养殖技术和管理,更要重视防病治病。由于市面上鱼病药物繁多,许多养殖者不知选用何种药物防治鱼
<正>目的:观察柴葛解肌汤治疗单纯性面神经麻痹的临床疗效。方法:柴葛解肌汤加味,由柴胡、葛根、白芷、黄芩、羌活、乌药、石膏、地龙、银花组成,并随症加减。每日1剂,煎服日
会议
基于抗原-抗体识别的免疫分析技术在小分子监测领域占有重要地位,已成功应用于生理活性物质、化学有害物、农兽药等的快速检测,在临床诊断、环境、食品以及卫生领域发挥重要
本文从学生心理需求的特点出发,从期望效价与机会公平等方面阐述了激励理论对班级管理的积极作用,并对班主任如何在班级工作中抓住有效时机、运用“激励”机制、促进学生潜能发
新闻摄影美学可以看作是新闻摄影与美学二者的有机融合。新闻是对客观存在事物的反映,这一特点对新闻摄影提出了不同于传统美学的要求。文章阐述了一张高质量的新闻摄影素材
常规地震资料的分辨率难以满足精细勘探开发的需要。在复杂的地质条件下,有效提高地震资料定量解释的精度,是成功勘探开发的关键因素。多年来,地震资料野外采集和室内处理技