缺失值填充相关论文
煤矿行业在运作发展的过程中会产生大量的数据,数据本身就代表着财富,其暗含的隐性价值更是主要的研究方向,然而,数据常因丢失、错......
线上零售额的准确预测是政府制定零售政策和发展规划的依据,也是电商和物流企业确定发展战略的基础。由于我国线上零售额数据具有样......
随着经济全球化的发展,人类社会对能源的需求达到了前所未有的水平。为减轻传统化石能源燃烧带来的生态环境污染,大力开发新能源技......
在用电信息采集系统中,由于采集和配电设备的海量接入,终端获取的分钟冻结数据普遍存在缺失。针对该问题,提出一种基于聚类的时间序列......
无论在研究领域还是工程领域,缺失数据都是一个不能忽视的严重问题。尤其随着数据收集工作从人工转向机器,数据量的急速膨胀使得各种......
学位
不完整数据分类问题是机器学习领域中的一个重要分支。随着传感器技术、信息技术等科学技术的迅猛发展,数据获取途径日益丰富,这给......
随着最近这些年来互联网的极速扩张,数据量呈指数式的增长,此时推荐系统应运而生。每个不同的领域都出现了相对应的推荐系统,极大......
在机器学习算法中分类作为数据分析的手段已被广泛的应用在工商业以及科学研究中。由于数据多元化的结构特征使得很多数据呈现了多......
在数据挖掘与机器学习、模式识别和信息检索等数据分析等理论的应用领域中,数据的缺失是一个处处存在,不可避免且具有挑战性的问题......
蛋白质分子通常由几百、几千个氨基酸组成,完全表达它的结构,需要6N维的空间,其中N是原子数。这是一个维数极其巨大的高维空间,很难利......
传统的KNN缺失值填充算法存在没有利用样本间属性的相关性,也没有考虑到保持样本数据本身的结构和去除噪声样本的问题。本文提出利......
K近邻填充算法(KNNI)对缺失数据填充时,使用K个近邻的训练样本属性值的平均值作为KNNI算法的填充值,该值偏离真实值较大,一种有效的方法......
现如今车载导航的使用越来越普及,海量的车辆行驶数据使得车辆驾驶行为分析成为一项新的研究热点,但是由于车载导航采集的行驶数据......
通过改进基于DBSCAN缺失值填充算法,实现对缺失值记录的填充。文中借助于图的强连通分量思想,改进算法可以对多密度数据集进行聚类......
在数据挖掘以及机器学习等领域,都需要涉及一个数据预处理过程。其中,缺失值的填充是一个非常具有挑战性的任务,因为填充效果的好坏会......
针对k最近邻填充算法(kNNI)在缺失数据的k个最近邻可能存在噪声,提出一种新的缺失值填充算法——相互k最近邻填充算法MkNNI(Mutualk-Ne......
推荐系统是目前在电子商务中用的较为广泛的一种技术。伴随着数据量的增大,评分矩阵的稀疏性成为了一大难题。对于评分数据较为稀......
在网络流量监控等数据流应用场景中,数据流中的IP地址等属性的值域往往很大,对于连续到达的数据流,管理系统一般不存储全体数据集,......
为解决复杂系统中单属性缺失数据填充困难问题,提出了基于动态窗口的灰色加权填充算法。该算法通过建立双向灰色预测模型,并采用模......
关联规则的研究目前已经能够从含有缺失值的数据间建立关联性,但缺失值填充的完整性仍显不足。该文利用规则回收技术,以回收组合的方......
近年来,工业界和学术界面临着非常严重的数据缺失问题,缺失值极大降低了数据可用性。现有的缺失值填充技术需要较大的时间开销,很难满......
在数据挖掘以及机器学习等领域,都需要涉及一个数据预处理过程,以消除数据中所包含的错误、噪声、不一致数据或缺失值。其中,缺失值的......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
针对中医临床在对有病个体分类时获得的数据很可能是不均衡的、缺失的,而且这种数据往往偏向于无病的个体这一问题,采用病例匹配最......
缺失值大量存在于现实数据库中,这不仅严重影响了信息查询质量,还会扭曲数据挖掘与数据分析结论,进而误导决策.解决这一问题的最佳......
期刊
不完整数据填充是数据预处理领域重要研究课题.传统数据填充算法时间复杂度高,算法不具有分布式处理特性,不满足大数据环境下对数......
期刊
当今信息化时代,由于互联网的兴起和产业的数字化,导致各种数据量的急剧增长,数据的重要性越来越不可忽视。糟糕的数据质量对数据......
随着信息技术的飞速发展,管理人员进行决策分析时对数据的依赖性越来越强。数据仓库频繁地从各种源数据中装载和刷新,这就要求数据......
不完整数据处理是数据挖掘、机器学习等领域中的重要问题,缺失值填充是处理不完整数据的主流方法。当前已有的缺失值填充方法大多......
在当今互联网时代,海量信息处理已成为我国经济建设进程中的一个重大需求。最近邻方法是海量信息处理中最重要的理论与技术之一,运......
集成聚类技术由于具有较好的泛化能力,目前引起了研究者的高度关注.已有研究主要关注数值型完备数据的集成聚类问题.然而,实际应用......
数据缺失对聚类算法提出了挑战,传统方法往往采用均值或回归方法将不完整数据进行填充,再对填充后的数据进行聚类.为解决均值填充......
随着信息技术的快速发展,数据正在爆炸式增长,数据挖掘应运而生。数据挖掘是从数据中获取知识的技术,因此数据的质量尤为重要。但......
针对K最近邻填充算法(K-nearest neighbor imputation,KNNI)的参数K值固定问题进行了研究,发现对缺失值填充时,参数K值固定很大程度......
在推荐系统中,协同过滤推荐算法往往面临数据集的高度稀疏性和推荐精度有限的问题.为了解决上述问题,在基于物品的协同过滤推荐框架下......