【摘 要】
:
非平衡混合数据是指数据集中类别不同的样本在数量上存在着较大的差别;同时样本数据集中的数据是非单一的数据类型,即它包含多种类型,如数值型和文本型数据。在对混合型数据
【机 构】
:
中南大学信息科学与工程学院,美国中佛罗里达大学电子与计算机工程系
论文部分内容阅读
非平衡混合数据是指数据集中类别不同的样本在数量上存在着较大的差别;同时样本数据集中的数据是非单一的数据类型,即它包含多种类型,如数值型和文本型数据。在对混合型数据的分类算法中,计数最近邻分类算法(CwkNN)可以有效地对混合型数据进行分类,但该算法对数据的非平衡性处理效果不是太理想。在CwkNN的基础之上结合数据的非平衡性特点提出了基于全局密度和K-密度的分类算法来提高少数类样本的权重,从而提高数据的分类精确度。实验结果表明,全局密度分类算法和CwkNN算法的分类精度相当,K-局部密度分类算法在一定程度上
其他文献
提出了一种新型的测量图像快速亚像素边缘检测方法。首先通过计算机模拟仿真,找出图像边缘处灰度落差与边缘点偏移之间的规律性,建立了一个由灰度落差得到边缘亚像素定位点的查找表;然后结合改进的Sobel检测算子和十字窗检测法将图像边缘检测精度达到像素级,并应用查找表实现了亚像素级的检测精度。实验表明:该方法不仅得到了较高的检测精度,定位精度为0.3pixels,而且可以大大地提高检测速度。
随着水利信息化的发展,如何实现不断增加的异构系统的应用集成成为一个新的研究课题。而使用基于模型驱动架构MDA的Web服务组合技术,能够更好地实现水利领域的应用集成。按照MD
素描是一切造型艺术的基础。在现代素描教学中,素描既是思想也是方法,又是一种创造观念和思维方式,应采取科学的行之有效的方法推动素描教学改革。
由于磁共振图像(Magnetic Resonance Images,MRI)常含有偏移场,影响后继图像分割。采用Legendre多项式基函数来拟合偏移场,以去除偏移场对图像分割的影响。当使得恢复图像的信息熵达到最小时,求得的偏移场最优。求偏移场的过程中需要求解基函数的参数,由于传统的梯度下降法易陷入局部最优,将遗传算法引入到参数求解过程中,然而传统的遗传算法时间复杂度高,易陷入局部最优,对遗传算法
在党的十八大上,胡锦涛以“继续促进人类和平与发展的崇高事业”为主题,对当前的国际形势和中国外交部分做了精辟有力的论述。十八大报告的外交部分准确分析中国所处的国际环境
作为目前聚类分析的新兴研究热点,聚类组合方法能将两种或多种聚类方法集成起来以改善其性能。从聚类多样性和共识函数两方面综述了最新研究进展,探讨将神经网络组合的思想用于
提出了一种新的过程控制故障诊断规则的增量动态更新方法。根据给定的过程控制故障规则的描述,按照规则更新集与控制状态集在约束条件作用下,将规则更新问题归结为一类标准形式