基于深度学习的长尾数据集分类精度提高的研究

来源 :沈阳理工大学学报 | 被引量 : 0次 | 上传用户:lwl13751412186
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的轮胎缺陷检测过程中,由于轮胎数据集为长尾数据集,某些缺陷类别的轮胎图片数量较少,造成此类缺陷的数据分类精度不高.本文在双边分支神经网络(BBN)分类算法的基础上,通过改进特征提取网络的结构、损失函数和权衡参数提高轮胎数据集中尾类数据分类精度.以主流数据集长尾CIFAR-10、长尾CIFAR-100和本实验室自制轮胎数据集为测试数据进行实验分析,实验结果表明数据集的尾类小样本数据的分类精度提高约10%.
其他文献
以西安泾河探空站的探空数据作为参照标准,利用同址安装的国产MWP967KV型地基多通道微波辐射计温度廓线数据,通过计算相关系数、平均偏差和均方根误差等,分析了微波辐射计在雨天、阴天、晴天和雾天四类典型天气下的温度探测效果.结果 显示:微波辐射计反演的温度与探空探测的温度的相关系数为0.99,平均绝对偏差为2.17℃,均方根误差为2.75℃;均方根误差在各类天气下差异不明显,且随高度的增加误差逐渐增大;随着高度升高,微波辐射计反演温度的偏差有显著的变化.
针对传统分类算法对工业传感器的高维不平衡数据分类效果不理想问题,本文提出一种基于多重筛选的随机森林不平衡特征选择算法.首先提出基于特定因子的不平衡数据处理方法,得到平衡数据集,其次对特征进行基于相关系数图的特征筛选,最后引入最大互信息系数(MIC)计算特征与类别之间的相关性,完成最后一次筛选.采用工业冲压机温度传感器、压力传感器、三相电传感器等传感器数据集完成冲压机故障预测实验,结果表明此优化算法能有效解决高维不平衡数据分类效果不理想的问题,准确率、精确率、召回率以及G-mean系数均比单一模型更高.