基于云计算的SPRINT算法研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:zhqimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树是数据挖掘中非常重要的一种技术,常用来做数据分析和预测。传统的决策树算法在处理海量数据挖掘时,受到CPU和内存的限制,导致算法存在消耗时间过长,容错性差,存储量小的缺点。面对海量数据的处理,云计算在这方面具有非常多的优势。针对决策树中优秀的SPRINT算法,首先对SPRINT算法进行了优化,然后为了让优化后的算法更好地应用于云计算,对算法实现了并行化。传统的SPRINT算法在生成决策树时,会发生多值偏向问题,在生成一个节点时,通过计算两层的Gini指数来降低多值偏向的影响。在算法并行化时,通过将数据
其他文献
真理是发现的,还是创造的,对这一问题的回答决定着我们对真理中所包含的价值维度的认可与否。通过从国外研究动态、国内研究动态两个方面阐述马克思实践真理观人文维度的研究
针对目前COX(环氧合酶)抑制剂较少且抑制效果差的问题,以及传统的化学实验筛选COX抑制剂分子的方法中成本高且效率低的问题,基于机器学习算法,提出并建立了一种COX抑制剂的预测模