【摘 要】
:
随着无线移动通信、互联网以及各种智能终端设备等技术的发展与进步,海量数据在呈指数爆炸式地不断地被产生和收集。如何对如此海量数据进行处理和分析,以及如何从中发现和提
论文部分内容阅读
随着无线移动通信、互联网以及各种智能终端设备等技术的发展与进步,海量数据在呈指数爆炸式地不断地被产生和收集。如何对如此海量数据进行处理和分析,以及如何从中发现和提取有用的或有价值的知识或信息是一系列值得考虑的问题。这些问题都涉及到大数据技术中的一个关键的技术即数据挖掘技术。数据挖掘与信息论之间具有一定联系。近年来,一些学者尝试从信息与通信理论这一新颖的角度去理解和解决(大)数据挖掘分析问题,相关工作已经表明信息论可以为数据挖掘提供一些方法和策略,且这些方法能取得相当不错的效果。同时,适用于大型数据集且可解释性很强。基于此,本文基于信息论分别提出了两个数据挖掘方法:基于自适应均衡器的时间序列分析模型以及基于J散度的决策树分类算法。基于自适应均衡器的时间序列分析模型假设目标时间序列和其相关时间序列之间有信息传递,因此本文在相关时间序列和目标时间序列之间建立单输入均衡器实现对目标时间序列进行预测估计。在模型构建的过程中,对均衡器进行训练得到最佳均衡器长度以及均衡器抽头系数。保持最佳均衡器长度不变同时使用梯度下降法在线更新均衡器抽头系数,最终实现对时间序列的预测估计。接着,引入历史目标时间序列作为额外输入,最终形成完整的多输入均衡器时间序列分析模型。实验结果表明,单输入的均衡器时间序列分析模型能够在一定程度上反映时间序列的相关性;而完整的多输入均衡器时间序列分析模型在误差性能RMSE表现上优于现有的带有外部输入的时间序列分析模型。基于J散度的决策树分类算法继承了决策树分类算法清晰、简洁以及可解释性强的优点。本文根据J散度倾向于扩大零值概率的影响的特点,提出新的用于样本集划分和决策树分裂的划分准则,并在此基础上进一步提出完整的基于J散度的决策树分类算法。J散度决策树每次划分倾向选择使子集中某些类别计数尽可能小或为零的特征,从而使得其结构与现有的CART分类决策树有明显的区别。如果不对决策树的最大深度加以限制,J散度决策树分类预测错误率要低于现有的CART分类决策树。综合实验结果表明,相比于其他分类算法,J散度决策树分类算法更适用于类别型特征较多的复杂的大型数据集中。本文立足于信息论提出了两个用于不同数据挖掘任务的方法,它们在各自所要解决的问题中都表现的很好。因此,本文的研究工作进一步表明了信息通信理论可以为(大)数据挖掘分析提供一些方法和策略。
其他文献
立案监督是检察机关对刑事立案主体应当立案而不立案以及刑事立案活动是否合法所进行的法律监督.它既反映了依法治国的内在要求.又体现了民主法治的最高追求。加强刑事立案监督
近年来,果品市场竞争激烈,果农增收困难,电子商务的蓬勃发展为解决这一问题提供了良好契机。本研究基于交易成本、产业链等理论,深入论证了电子商务支持果农增收的内在机理,
无线医疗传感器网络(wireless medical sensor networks,WMSNs)是一种利用传感器节点采集患者生理数据、利用无线传感器网络传输数据来实现对病人的监测和治疗的医疗系统。然
在中国学术思想史和和中国史学史上,先秦诸子及其思想是一个绕不开的话题,在学术史上,先秦诸子为了宣言自己的思想主张,著书立说,创立了儒家、道家、法家、墨家、阴阳家、兵家、纵横家等众多的学术流派,开启了中国历史上第一个学术思想大发展、大繁荣的时代,为其后中国两千多年的思想文化奠定了理论基础。在史学史上,先秦诸子在先秦史官的基础上继承和发展了天人观、古今观、天下观等历史观念,重视历史文献的整理与编撰,重
建设社会主义新农村已成为我国和谐社会构建过程中亟待解决的问题。中共中央曾多次提到我国的三农问题,特别在(2006年1号文件》中明确提出要建设社会主义新型农村。文件明确指
目的:通过使用乌头注射液来干预OA模型兔关节炎发病过程的实验研究,比较各组兔关节液中NO、iNOS含量和关节软骨中Col-2表达的变化情况,观察乌头注射液对关节液中NO、iNOS含量
无论中外,对单色画的研究就没有间断过。西方,从古代开始,作家和哲学家就开始讨论主要用黑白颜料的绘画实践。而东方,由于艺术家特定的绘画习惯和审美,对于单色绘画也有更为特殊的情感。本文由伦敦国家画廊所办的一个也是第一个完全由单色画及与单色相关的装置艺术组成的展览开始,结合展览与相关研究书籍,从单色画这一个视角入手谈“单色”在绘画历史中扮演的角色以及其在版画中的发展和运用,希望能从中获得无论是经验性或感
[摘要] 目的 探讨不同剂量腺苷蛋氨酸治疗病毒性肝炎肝内胆汁淤积临床疗效。方法 将80例病毒性肝炎肝内胆汁淤积患者分为两组各40例。在综合治疗的基础上,观察组加用腺苷蛋氨酸2 000 mg溶于5%葡萄糖注射液250 mL,每日1次静滴;对照组加用腺苷蛋氨酸1 000 mg溶于5%葡萄糖注射液250 mL,每日1次静滴。疗程均为6周。 结果 两组治疗前后TBIL、DBIL、TBA、AKP、γ-GT下
近年来大学生就业渠道愈加丰富,类别愈加繁多,但招聘过程仍旧没有发生本质变化,招聘成本高昂。而且高校培养和招聘需求之间存在脱节,招聘一个合格的岗位候选人,需要大量笔试和面试,导致招聘效率低下,并且招聘全程受人为主观因素影响。如何找到一种高效客观的解决方法是十分有意义的。随着校园数字化的普及,数字化校园信息系统不断积累学生各方面的在校信息,且内容形式日趋多样化,其中隐藏着许多有价值的信息和规律。深度挖