缺失值相关论文
目的:评估不同缺失值处理方法在不同缺失模式、缺失机制及缺失比例下双臂优效临床试验中的统计性能,筛选出相应的最优缺失值处理方式......
数据缺失发生在各个研究领域当中,若不加处理直接使用,会对模型选择、研究分析造成一定的困难。因此,对于缺失数据包含的信息进行......
随着高通量DNA微阵列检测技术的发展,产生了众多的基因相关数据,数量庞大的基因和生物网络的复杂性成为理解和解释这些数据的巨大......
在众多不同领域中,数据缺失普遍存在,这可能会影响数据挖掘工作的进展,甚至造成不同的结果。因此,缺失数据的填补是训练数据存在缺......
电力变压器是电网中能量转换和传输的核心,是电网中最重要和最关键的变电设备。为准确监控变压器的真实运行状态,大量的状态监测装......
近年来,纵向实验在体育科学研究中越来越多,如何可靠地处理在研究中出现的后测数据缺失,成为一个摆在研究者面前需要解决的难题。......
实际应用中数据经常出现的缺失值将直接影响到数据挖掘算法的准确性,因此如何处理缺失值已成为数据分析领域必须解决的重要问题。......
摘 要:针对国省干线公路采集的交通数据存在缺失值的情况,文章提出了基于拉格朗日插值法的缺失数据恢复方法。首先,找出缺失数据所在......
以大数据为背景,通过线上与线下教学的优劣比较,对教师传授知识、学生学习知识、培养学生能力、课程思政等方面的融合策略进行分析......
期刊
目的:本文旨在基于数据科学方法,构建一套可涵盖创伤临床数据、核磁共振氢谱(proton nuclear magnetic resonance,~1H-NMR)代谢组......
数据缺失是统计研究领域中普遍存在的问题。在本文中,我们扩展了Choi和Tibshirani(2013)提出的弹性网回归下的半正定方差方法,引入......
近年来,随着城市化水平持续提高、工业发展速度越来越快、人口激增,导致城市环境污染问题越来越严重。人们对于空气质量问题越来越......
节点的重要性或称“中心性(centrality)”,它作为社会网络分析的一个重要领域,在近年来获得学者的广泛关注和研究。识别出网络中的......
为了了解病人的身体状况,医生会对病人的各项生理指标进行监测,这些监测记录形成了医疗时间序列。我们可以根据这些记录对病人的住......
互联网技术的飞速发展产生了海量的数据,从这些数据中提取出对实际生活有用的信息成了研究的热点问题。聚类作为一种经典的无监督......
针对不完整数据,已经发展出很多预处理方法,如删除法和填补法,删除法会造成信息浪费,填补法会带来不确定,因此不完整数据分类成为......
信息时代的今天,数据的获取越来越容易,在数据挖掘领域,需要面对的数据量也更加庞大.在二分类任务中,我们常常遇到维度高达几百上......
进入21世纪后,互联网技术飞速发展,数据可以快速通过线上方式进行获取和存储,这为数据挖掘工作带来了机遇,但由于各种原因往往会获......
数据挖掘的目的是在复杂的数据集中发现有价值的规律或知识。这需要专业人员建立可靠的算法模型来发掘,而可靠的算法模型依赖于高......
三维重建是计算机视觉的热点之一,它的目的就是从二维图像中恢复出三维结构和运动信息。这些研究成果不仅可以使机器人具有捕捉动......
大于胎龄儿(LGA)是指出生体重在相同胎龄平均体重的第90百分位以上的新生儿。体重过高的新生儿表现出严重的新生儿和产妇并发症。......
目的 给出一种有效的处理含缺失值时间序列的方法 ,完成缺失值的内插及ARMA模型的参数估计。方法 用状态空间的Markov表达描述时......
生物信息学是连接生物数据与医学研究的桥梁,是随着人类基因组计划的启动而兴起的一门新的交叉学科。基因组学、蛋白质组学和DNA芯......
蛋白质结构预测是蛋白质结构和功能研究工作的重要组成部分,对蛋白质药物分子设计、生物制药等方面有重要的意义。若已知同源蛋白......
支持向量机是在统计学习理论基础上发展起来的一种机器学习方法。本文结合二阶锥规划对支持向量机提出了一些改进,丰富了现有支持向......
一、简介rn利用状态空间模型中的Kalman滤波可以很好地解决时间序列模型的缺失数据问题.一文(高洁,2004年,第10期)通过修改Kalman......
微阵列数据中的缺失值会对随后的数据分析造成影响.因此,正确地估计这些缺失值是很必要的.将一个k值选取算法结合到有序的局部最小......
具有缺失信息的不平衡数据,是如今分类问题面临的一个巨大挑战。针对此问题,本文提出一种基于马氏距离的自适应双权重过采样技术(A......
利用状态空间模型中的Kalman滤波可以很好地解决时间序列模型的缺失数据问题.本文通过修改Kalman滤波递推公式解决了长记忆ARFIMA......
信息技术与课程整合,既能使丰富生动的教学内容得到直观体现,又有利于优化教学效果.但是,在实际运用过程中,这种整合往往还存在着......
在数据分析领域内缺失值一直是人们关注的热点,它会对分析结果造成影响。本文以GECCO 2015行业挑战赛中提供的热力系统数据为例,探......
解决数据本身的质量问题,以某移动通信用户离网原因分析及预测为主题及为数据挖掘模型处理出需要的数据是文章的主要目的。文中运......
研究中发现,将短波远程通信中两点间的可用频率作为单特征输入,利用长短期记忆人工神经网络(LSTM)可以实现对未来几天短波频率进行......
传感器节点监测数据缺失会影响核电厂外围环境辐射监测的连续性,必须对缺失数据进行准确估计。提出一种基于最小二乘支持向量机(LS......
针对目前采用的传统时间序列缺失值估计算法对制造云服务QoS中时间序列缺失数据填补效果不佳的现状,提出了一种新算法。该算法通过......
在基因芯片实验中.数据缺失客观存在,并在一定程度上影响芯片数据后续分析结果的准确性.在不增加实验次数的情况下,缺失值估计是降......
在经济计量分析中收入变量的缺失值是一个普遍而又较难处理的问题。传统的处理方法往往导致分析结果具有系统偏差。本文提出利用基......
数据清洗是发现并纠正数据文件中可识别错误的最后一道程序,包括检查数据的一致性,处理无效值和缺失值等。本文通过对一个从相关网......
大多数统计分析方法基于完整的数据集,这些方法不能直接用于包括缺失值的数据集.此外,由于成分数据的特殊属性,传统的缺失值插补方......
数据作为现代企业的宝贵资源,占据着越来越重要的地位,它是科学管理的基础、正确决策的前提、有效调控的手段。本文介绍了数据预处......
在基因芯片实验中,数据缺失客观存在,并在一定程度上影响芯片数据后续分析结果的准确性。在不增加实验次数的情况下,缺失值估计是......
铁矿石是钢铁工业的重要原材料,我国是铁矿石进口需求型国家,是世界铁矿石消费第一大国。海关对进口铁矿石检验的主要目标是预防进......
目的以全国血吸虫病疫情监测资料为数据来源,比较不同缺失值处理方法对模拟缺失值的处理结果 ,为确定适用于处理该资料缺失值的方......
【目的】对普遍存在的时间序列缺失值进行有效估值,进而改善时间序列数据的质量。【方法】以亚热带典型小流域长期定位观测的气象(......
本文利用Rough集理论针对不一致和不完全数据,提出了一种基于匹配度和覆盖度的处理方法.数据实验证明了该方法的可行性和有效性.......
在无线传感器网络中,感知数据的缺失问题不可避免,并且给无线传感器网络的各种应用带来了巨大困难.解决该问题的最好办法是对缺失......
数据缺失是临床试验中常见但又不可避免的问题之一。由于医疗设备欠缺或者病患忽略检测白蛋白,可能造成白蛋白指标缺失。随着机器......
【提要】目的探讨诊断试验中缺失值的处理方法并进行比较。方法分别介绍诊断试验常用的4种缺失值处理方法:完整数据法(completecase,C......