基于Spark的产后访视系统的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:luo_yu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据技术衍生出的应用为我们的生活不断地提供着便利,但其在产后访视方面的应用并不活跃。产后访视指为产妇和新生儿进行健康检查,指导产妇及其家人正确护理新生儿的活动,旨在提高产妇的情绪管理和自我控制能力。但我国产后访视工作还存在不足之处:访视流程较为繁复、没有统一的标准、用户群体较为单一;对于不断增长的访视数据,缺乏灵活的定制分析和挖掘。针对目前产后访视工作存在的不足,本论文致力于规范产后访视的信息采集流程,搭建起一个大数据分析平台和任务调度平台,更好的指导访视工作的开展。系统借助JakartaEE体系架构实现了对于访视信息的采集;大数据分析平台中的Hadoop负责数据的存储;Spark计算引擎负责数据的处理与分析。用户可在任务调度平台中定制离线或实时的统计分析任务,远程触发执行Spark的业务分析代码。其中采用Spark技术栈中的SparkStreaming负责实时流的计算,SparkCore与SparkSQL协作完成对于离线访视数据的统计分析,对于访视数据的挖掘采用SparkMLlib进行。分析和计算结果存储于关系型数据库或Redis中,最后通过可视化控件对其进行渲染和多维度展现,为统计分析人员带来了便利。论文采用决策树分类模型对访视数据集进行训练,得到产妇月子期间心理状态的预测树,极大方便了访视计划的制定。实现了分布式集群中NameNode节点的失效备援,降低了集群崩溃的风险;研究了容易影响系统性能的配置项、算子、数据倾斜等问题并给出优化措施。论文对访视信息采集以及Spark任务分析系统的功能进行了白盒测试和黑盒测试,通过压力测试对Spark统计分析任务的并发性能进行了检验;在不同分类模型下对心里状态数据集进行了训练,得出了最优的产妇月子期间心理状态预测模型,并对准确率进行了对比分析,截至目前,产后访视信息采集子系统已服务于成都市天府新区,为访视工作提供了很大的便利。业务数据的传输与处理流程也为后续访视系统与推荐系统的结合提供了理论基础和技术可能,对产后访视的后续发展有着深远意义。
其他文献
本文以新加入和新剔除融资融券业务的股票为研究对象,采用事件分析法,从股票收益率偏度和极端负收益率出现频率两个角度研究卖空机制和信用交易对我国A股市场的影响。研究表
目的探讨初发弥漫大B细胞淋巴瘤(DLBCL)中医体质评分与乳酸脱氢酶(LDH)的关系,为中医治疗DLBCL提供可能的依据。方法以初诊DLBCL患者为研究对象,采集临床资料,根据2010版NCCN指南
本文提出产业创新速度的概念,分析了高技术产业创新速度与效益的互动机制并进行了实证。采用面板数据分析创新速度对效益的作用大小及作用规律,采用面板向量自回归模型分析高
手工业特色小镇是当下热门的“特色小镇”中一个非常细分的领域。本文通过对住建部公布的第一批中国特色小镇筛选的15个手工业相关特色小镇的研究,发现了其产业簇群、区位优势
林业资源对于我们人类生存真的是太重要了,我们在很多方面都是很需要它的,我们不仅在建筑业需要,在生活中也会有很多方面都需要,所以对于我们来说我们要对林业做好保护,同时
中国山水画的构图与中国古典园林的游线、视线存在着必然的联系。本文尝试探索古典园林游园流线与山水画册页呈现方式之间的联系,研究古典园林游线组织和空间转折手法及重要
在实地田野调查的基础上,结合文献史料,以乡土文化为切入点,阐述了北方现存唯一的城堡式庄园——魏氏庄园的建筑特色;研讨了在当今社会快速发展、文化交流和冲击日益频繁的大