论文部分内容阅读
我国棉花生产发展目标是,棉花等级相符率不断提高,异性纤维问题、掺杂使假事件、棉包一致性差现象不断减少等。严把“采摘、收购、加工”关,减少异性纤维含量是解决这些问题的主要措施。本研究把现代机器视觉和模式识别等技术引入传统的采摘作业进行田间籽棉成熟度与品级的判别,为采摘机器人具备精确的作业能力奠定基础,以适应棉花品种的多样性、避免农业化学品引起的环境污染、降低劳动强度、减少农业投入成本等。取得的主要结论归纳如下:1.将籽棉与背景视为二个类别,基于竞争学习网络分割了籽棉图像。在HSI、Lab、 Ohta、RGB颜色空间下,用带类别标签的训练样本计算k-均值聚类的误分类率,选取了误分类率最小的RGB颜色空间,其B值较优。在RGB颜色空间下,用带类别标签的训练样本的B值一次性地训练了竞争学习网络模型。结合形态学滤波,用所训练的竞争学习网络模型分割907张新图像的准确率达92.94%。该方法结合了有监督的学习算法,使图像分割在先验知识的指导下进行,同时,避免了K-均值聚类的反复迭代和过拟合现象,降低了计算开销,提高了图像分割的效率和精度。2.基于频域提取了描述籽棉边界轮廓的频谱特征集。用8-邻域跟踪法获取了籽棉区域边界轮廓的坐标序列,基于傅里叶变换提取64个频谱特征,其相关系数都不超过0.9;单因子方差分析表明,大多数频谱特征在成熟和未成熟籽棉上的均值具有显著的差异。基于空域提取了个描述籽棉形状的几何结构特征集。用一组同心园外接或切割籽棉区域,基于比值法提取了15个几何结构特征,它们是,全局特征、径向切割区域特征1-3、圆周向切割区域特征1~5、径向切割线特征1-2、圆周向切割线特征1-3以及计盒维数,其相关系数超过了0.9;单因子方差分析表明,大多数几何结构特征在成熟和未成熟籽棉上的均值具有显著的差异。将籽棉是否成熟视为二类问题,基于过滤器模式从上述特征集中启发式搜索了特征子集,评估函数为类可分性准则。最优标量特征组合特征子集时,在训练集上计算每个特征的类可分性测量值并降序排列,将前l个(l=1、2、…、64或15)特征组合形成l维特征子集建立贝叶斯判别模型,随着特征子集容量l的增加,l维特征子集在训练集上的误分类率不断减小,验证集上的误分类率不再减小处为最佳特征子集容量,实验结果表明,频谱特征集的最佳特征子集容量为14,该特征子集在预测集上的识别率为77.78%;几何结构特征集的最佳特征子集容量为8,该特征子集在预测集上的识别率为85.56%。浮动搜索特征子集时,在训练集上浮动搜索具有最大类可分性测量值的l维特征子集建立贝叶斯判别模型,随着特征子集容量l的增加,l维特征子集在训练集上的误分类率不断减小,验证集上的误分类率不再减小处为最佳特征子集容量,实验结果表明,频谱特征集的最佳特征子集容量为22,该特征子集在预测集上的识别率为82.22%;几何结构特征集的最佳特征子集容量为8,该特征子集在预测集上的识别率为85.56%。将籽棉是否成熟视为二类问题,基于封装器模式从上述特征集中穷举搜索了特征子集,评估函数为分类器的误分类率。在训练集上组合所有可能的l维(l=1、2、64或15)特征子集建立贝叶斯判别模型,并选择在验证集上具有最小误分类率的l维特征子集,随着特征子集容量l的增加,l维特征子集在训练集上的误分类率不断减小,验证集上的最小误分类率不再减小处为最佳特征子集容量,实验结果表明,频谱特征集的最佳特征子集容量为15,该特征子集在预测集上的识别率为83.33%;几何结构特征集的最佳特征子集容量为6,该特征子集在预测集上的识别率为88.89%。3.基于相关分析选取了测量籽棉色泽的颜色空间。根据中国籽棉品级分级文字标准,在Hunter、Lab和HSI颜色空间下度量籽棉的色泽,相关分析表明,籽棉的色泽特征呈虚假相关;经灰度修正后,HSI颜色空间消除了虚假相关,可度量籽棉的色泽。基于空域提取了描述籽棉品级的纹理、形状特征集。在HSI颜色空间下,基于亮度Ⅰ和饱和度S的直方图的均值、标准差、平滑度、三阶矩、一致性和熵,提取了12个纹理特征以描述籽棉的色泽、雨锈/轻霜/僵瓣/污染/烂桃等杂质;基于比值法提取了16个形状特征以描述籽棉的大小、几何结构分布,它们是,棉瓣个数、全局特征、径向切割区域特征1~3、圆周向切割区域特征1~5、径向切割线特征1~2、圆周向切割线特征1~3以及计盒维数;剔除相关系数超过0.9的纹理、形状特征后,基于特征集在1~7级样本上均值与品级值之间的回归分析,在0.05的显著性水平下选取了线性相关的有效纹理、形状特征集,它们是,亮度直方图的三阶矩、饱和度直方图的均值、标准差和熵、棉瓣个数、全局特征、圆周向切割区域特征(1,4)、径向切割线特征1、圆周向切割线特征3、计盒维数。将成熟籽棉品级视为七类问题,基于10折交叉验证和过滤器模式从上述有效特征集中启发式搜索了特征子集。最优标量特征组合特征子集时,在每一个训练集上计算每个特征的类可分性测量值并降序排列,将前l个(l=1、2、…、11)特征组合形成l维特征子集建立贝叶斯判别模型,随着特征子集容量l的增加,l维特征子集在10个训练集上的平均误分类率不断减小,10个对应的验证集上的平均误分类率不再减小处为最佳特征子集容量,实验结果表明,有效特征集的最佳特征子集容量为7,10个训练集在此处建立了10个模型,第5个训练集在此处建立的模型较好,它在预测集上的识别率为74.71%。浮动搜索特征子集时,在每一个训练集上搜索具有最大类可分性测量值的l维特征子集建立贝叶斯判别模型,随着特征子集容量l的增加,l维特征子集在10个训练集上的平均误分类率不断减小,10个对应的验证集上的平均误分类率不再减小处为最佳特征子集容量,实验结果表明,有效特征集的最佳特征子集容量为6,10个训练集在此处建立了10个模型,第9个训练集建立的模型较好,它在预测集上的识别率为70.11%。将成熟籽棉品级视为七类问题,基于10折交叉验证和封装器模式从上述有效特征集中穷举搜索了特征子集。在每一个训练集上组合所有可能的l维特征子集建立贝叶斯判别模型,并选择在对应验证集上具有最小误分类率的l维特征子集(l=1、2、11),随着特征子集容量l的增加,l维特征子集在10个训练集上的平均误分类率逐渐减小,10个对应的验证集上的最小误分类率的平均值不再减小处为最佳特征子集容量,实验结果表明,有效特征集的最佳特征子集容量为9,10个训练集在此处建立了10个模型,第6个训练集建立的模型较好,它在对应验证集上的最小误分类率最小,在预测集上的识别率为79.31%。4.基于封装器模式穷举搜索的特征子集最优,它能够有效地剔除冗余特征、辨识关键特征,但计算开销大、速度慢。基于过滤器模式启发式搜索的特征子集次优,可能选出冗余特征,但计算量小,速度快,并可能搜索到过于乐观的特征子集,其验证集误差小于训练集误差,或者预测集误差小于验证集误差。基于交叉验证选择的模型稳定、可靠。为了判别田间籽棉的成熟度,最终选择在空域中基于封装器模式穷举搜索的几何结构特征子集,该特征子集是径向切割区域特征(1,2)、圆周向切割区域特征(1,3,4)、径向切割线特征2,揭示了“成熟籽棉内部绽开外围饱满,未成熟籽棉内部紧实外围瘦小。”这一关键特性,它在预测集上的识别率为88.89%。为了判别田间籽棉的品级,最终选择基于交叉验证和封装器模式穷举搜索的纹理、形状特征子集,该特征子集是白度三阶矩、黄度均值、黄度标准差、黄度熵、棉瓣个数、全局特征、圆周向切割区域特征1、径向切割线特征1和计盒维数,揭示了高品级棉花白度高、黄度低、杂质少、棉瓣紧凑/肥大/蓬松,低品级棉花白度低、黄度高、杂质多、棉瓣松散/瘦小/僵硬、淡灰棉/污染棉/烂桃棉多等特性,它在预测集上的识别率为79.31%。籽棉通常被误分入相邻品级,高品级籽棉和低品级籽棉比较容易被识别。