【摘 要】
:
社交网络作为记录与传播大众日常生活信息的主要媒介与平台,每天产生大量数据信息,其中文本信息是其主要的信息形式。社交网络文本信息存在着短文本、多噪音以及稀疏性等特点。同时从国民安全事件角度来看,社交网络在国民安全突发事件中所扮演的角色越来越重要,本文基于社交网络国民安全突发事件的特点进行社交网络国民安全突发事件数据收集、处理与存储研究,社交网络国民安全突发事件动态画像研究,社交网络国民安全突发事件演
论文部分内容阅读
社交网络作为记录与传播大众日常生活信息的主要媒介与平台,每天产生大量数据信息,其中文本信息是其主要的信息形式。社交网络文本信息存在着短文本、多噪音以及稀疏性等特点。同时从国民安全事件角度来看,社交网络在国民安全突发事件中所扮演的角色越来越重要,本文基于社交网络国民安全突发事件的特点进行社交网络国民安全突发事件数据收集、处理与存储研究,社交网络国民安全突发事件动态画像研究,社交网络国民安全突发事件演进规律发现与预测研究,最终实现社交网络国民安全突发事件动态画像、演进规律发现与预测系统。具体完成工作如下:(1)在社交网络国民安全突发事件数据收集、处理与存储方面,针对社交网络国民安全突发事件数据的特点,提出了一种获取社交网络国民安全突发事件多属性数据方法。利用微博web平台以及爬虫工具进行数据的获取,同时构建相应的社交网络国民安全突发事件词库进行数据的噪音处理与归一化处理,利用MySQL关系型数据库进行有效的数据存储。利用微博web数据的特点获取微博文本数据、微博用户数据以及微博关注数据。文本获取了“武汉暴雨”、“北京雾霾”、“天津爆炸”、“中美贸易战”这4个社交网络国民安全突发事件共241145条微博,以及所发微博的用户信息与相应位置与时间信息。(2)在社交网络国民安全突发事件动态画像方面,针对当前神经网络动态画像的研究以及社交网络国民安全突发事件文本数据特点,利用知识图谱进行动态画像的构建,并从构建知识图谱的关键技术中提出了融合中文分词词性注意力机制的命名实体识别算法(BLTAC)与基于多重注意力机制的实体关系抽取算法(BLMA)。利用命名实体识别与实体关系抽取这两个技术进行社交网络国民安全突发事件知识图谱的构建,同时结合时间序列的属性进行社交网络国民安全突发事件动态画像的实现。其中对于命名实体识别,本文所提出的BLTAC算法相较当前流行的算法在社交网络国民安全突发事件数据集上的准确率提高了4.5%左右。同时对于实体关系抽取技术,本文所提出的BLMA算法相较当前流行的算法在社交网络国民安全突发事件上的准确率提升了4%左右。(3)在社交网络国民安全突发事件演进规律发现与预测方面,结合社交网络国民安全突发事件数据多属性的特点,提出了多维度社交网络国民安全突发事件演进规律发现的方法,从微博文本数据、微博用户数据以及微博关注数据等多维度、多属性进行社交网络国民安全突发事件演进规律的发现。同时针对社交网络国民安全突发事件热度趋势进行预测,提出了基于多粒度特征的热度趋势预测算法(MHTP),利用社交网络国民安全突发事件数据多属性的特点结合深度学习技术进行热度趋势的预测,本文所提出的MHTP算法相较于当前流行的算法在社交网络国民安全突发事件数据集上进行热度趋势预测的准确率提升2.4%,实现了针对社交网络国民安全突发事件热度趋势的准确预测。(4)设计并实现了社交网络国民安全突发事件动态画像、演进规律发现与预测系统。通过社交网络国民安全突发事件数据的收集、处理与存储模块,社交网络国民安全突发事件动态画像模块与社交网络国民安全突发事件演进规律发现与预测模块,实现了社交网络国民安全突发事件动态画像、演进规律发现与预测等功能。同时设计了方便用户调用的算法接口和简洁明了的交互界面,并对所提出的算法模型运行的结果进行全面展示。
其他文献
目的:本研究主要目的是滚针配合强力益气方治疗重症肌无力的临床疗效及炎症因子在治疗前后的变化。方法:本研究将符合中医诊断“脾气虚证”和西医诊断“重症肌无力Ⅱb型”的7
电气化铁路具有安全系数高、舒适度高、运输能力大、耗时少等特点,是解决交通不便的有效手段。但随着我国电气化铁路的飞速发展,谐波、负序等电能质量问题也受到广泛关注,同时牵引供电系统中越来越多再生制动能量无法有效利用的问题也随之出现。现在牵引变电站中根据两部制电价进行收费,再生制动能量无法有效利用的问题会造成两部制电价所收取费用较高,经济影响较大。铁路功率调节器的投入使得电能质量问题得到有效的解决,从而
改革开放40年以来,飞速发展的中国吸引愈来愈多在海外留学或工作的人才回国任职,并逐渐构成我国企业高级管理人员的重要组成部分。截至2017年,我国近2/3的A股上市公司雇佣了海归高管,成为公司治理团队中不可忽视的重要力量。海外经历背景高管对企业经营绩效的影响机制和影响程度如何,是亟待回答的问题。本文以A股2008-2017年上市企业高管海外经历数据为样本,采用温忠麟等(2004)的中介效用检验流程进
随着步入21世纪第三个十年,人工智能逐渐成为了智能时代具有代表性的产物。自1956年夏季首次提出“人工智能”这一专业术语以来,不仅标志着“人工智能”这一门新兴的学科的诞生,也标志着开启了新的一个时代。目前,人工智能并未能真正达到具有自己“灵智”的地步,但依托于大数据集合,通过程序的提前设置,能够做到“智能”的程度,如IBM公司所创造的“深蓝”或是谷歌(Google)旗下DeepMind公司创造的“
电-多相臭氧催化工艺(E-catazone)是本课题组前期开发的一种新型高级氧化工艺,该工艺将阳极、曝气装置和臭氧催化剂(TiO2纳米花(TiO2-NF)巧妙地结合在一起,构成兼备电催化、臭氧催化、臭氧曝气功能的膜曝气电极(简称TiO2-NF电极),实现了电化学和多相臭氧催化的高效协同。前期研究表明,E-catazone工艺对难降解有机污染物如药物布洛芬的降解速率上是单一电化学氧化的71倍,是单独
目的:了解不同类型肛瘘的特征及解剖结构差异,分析患者肛瘘复发的危险因素,拟从临床观察中探寻不同肛瘘患者的首选治疗方案,为临床医生选择合适的诊疗方案提供一定的方向。方法:回顾分析2016年8月至2018年6月肛漏住院患者的肛周核磁共振图像及临床资料,探讨不同患者肛瘘特征及解剖结构差异,用Cox回归分析影响肛瘘复发的危险因素。结果:本研究共纳入湿热下注型肛漏病例421例,男性378例,女性43例,其中
近年来,随着汽车内燃机缸内直喷、涡流增压等提高燃烧效率的技术广泛应用,要求制造排气门材料有更好的耐燃气腐蚀和抗氧化性能以及在高温下有更高的强度。随着未来汽车排放要
经过十余年的发展,我国以高铁为核心的快速铁路客运网络逐渐形成,伴随着大规模高铁建设的是我国“建设创新型国家”战略的推进。在我国高铁与科技创新快速发展的现实背景下,高铁对城市创新能力的影响是党和政府关心的热点话题,探讨其能否促进城市创新能力搭乘高铁速度,助力我国创新型国家建设,不仅关乎我国大规模高铁投资建设的社会经济效应评估,而且深刻影响着创新驱动背景下经济结构的转型升级。那么高铁对城市创新能力是否
轨道交通已成为我国重要的交通运输方式,我国目前是全球运营速度最快、里程最长、在建高速铁路规模最大的国家。由于线路会因列车行驶和自然条件等因素产生几何形变,并威胁到列车的安全运行,所以对轨道几何状态的检测和预警是一项至关重要的任务。目前,由于综合检测车成本高、配置少,运行线路检测周期长达15天,维修间隔期内轨道不平顺超限将严重威胁行车安全,因此有必要加强轨道运营状态监测。本文重点研究了基于深度学习和
近年来,继理论科学和实验科学之后,高性能计算成为人类科学研究的第三大范式。浮点矩阵运算作为高性能嵌入式系统中的基础运算也备受关注,因而针对浮点矩阵运算的硬件加速器的设计实现是当代高新技术领域的研究热点和难点。针对运算、访存和数据密集型矩阵运算,设计专用的ASIC芯片以及对大型矩阵运算进行细颗粒度的运算拆分提高资源的利用率是实现大规模矩阵运算加速的有效方案之一。论文在深入研究了32位RISC通用主处