论文部分内容阅读
高精度印刷品生产过程中,易产生墨色堆积、混色、拉道子、甩色、缺印等问题,导致不合格品出现。采用视觉技术检测产品质量,并自动剔除不合格品,是提高生产力的最有效途径之一。在光源、相机等硬件条件确定的前提下,视觉检测技术的性能取决于图像处理能力。基于核机器学习的图像处理方法,集统计学习理论、核方法于一体,是处理非线性数据的有效手段之一。本文在高精度印刷品质量检测智能算法研发课题的支撑下,在深入分析研究核机器学习方法的基础上,结合高精度印刷品视觉检测的应用背景,以提高检测性能为目标,重点对图像处理系统中图像复原算法的改进、训练集的选择、核函数及参数的优化学习进行研究。论文完成的主要内容包括:1)在对核主成分分析深入研究的基础上,针对印刷品质量检测中存在的复原图像模糊问题,提出一种新的基于核主成分分析的图像复原算法。该算法假设同种印刷品的图像样本分布满足局部线性性质,利用图像样本在特征空间中的线性分布特征来计算最近邻居。然后依据最近邻居构成的线性几何结构,把残差最小化作为图像复原的优化目标,并用固定点迭代法对优化问题进行求解。最后给出所采用迭代格式的收敛性分析。通过数值实验,验证了算法的合理性与理论分析的正确性。实验结果显示,该算法的复原误差较现有算法降低了一半,同时解决了复原图像的模糊重影问题。2)为提高图像处理的计算速度,提出了基于图像样本空间分布的选样算法。该选样算法不仅考虑了数据库中样本的分布密度,同时把边界图像样本选入训练集。基于核方法的图像处理系统中,包含N个图像样本的训练集,对训练集特征进行提取的算法时间复杂度是O(N3),单个样本的检测时间复杂度是O(N2)。实验结果显示,在图像复原信噪比近似相等的前提下,当参与计算的500个样本减少到100个时,训练时间缩短了99.2%,检测时间缩短了96%。3)为提高图像处理的计算精度,提出了基于核对齐的选样算法。基于核对齐选择显著图像样本算法,将图像样本对核矩阵的贡献作为选样标准,把对核矩阵有最大贡献的显著图像样本逐个从大数据集中选择出来,构成训练集。此选样算法便于新图像样本的选择与添加,选样与训练集更新可在线完成。当基于核对齐的选样算法应用于图像处理系统时,采用随机选择的100个样本与利用核对齐选择的100个样本,分别进行训练与图像复原测试,结果显示平均复原误差从1312.7个灰度值降到了462.9个灰度值。4)设计了把标准化内积矩阵作为目标,学习核函数及其参数的算法。此算法可用于多元回归与非监督问题。并利用核对齐能有效度量核函数与目标函数相似度的性质,提出利用核对齐学习核函数的方法。经理论分析与研究发现,包含组合系数与高斯带宽两个变量的核对齐函数至多存在两个驻点,并依此提出计算该驻点的迭代算法。通过两组数值实验,对采用核对齐学习核函数的方法进行了验证,实验结果显示,采用学习的核函数及参数得到的计算结果接近统计最优值。5)在对核机器学习方法中学习向量值核函数、学习半正定矩阵值核函数与多核学习三个扩展方向深入研究的基础上,提出了学习矩阵值核函数的方法。实验结果显示,学习的向量值函数和多元核函数有效的解决了多类问题、多元数据降噪与多元回归问题。