论文部分内容阅读
假药不仅严重危害人类的健康,而且给合法药品生产企业造成巨大的经济损失。药品安全问题是世界各国尤其是发展中国家共同面临的问题之一。近红外光谱分析技术具有快速、准确、无污染、不破坏等优点,非常适合于药品分析。因此,提出一种快速、准确、针对药品的近红外光谱分析方法非常的必要。 为了有效解决这个问题,本文开创性地将硬件友好核函数(hardware friendly kernel,HFK)引入到最小二乘支持向量机(least squares support vector machine, LS-SVM)的训练和决策阶段的计算中。在FPGA平台上实现基于 HFK的 LS-SVM并行、串行计算结构,并对两种结构的训练速度和资源消耗进行比较研究。同时还与基于高斯核函数的硬件实现结构和软件环境实现结果进行比较。实验表明,基于HFK的 LS-SVM硬件实现结构具有分类准确率高、训练速度快等优点。在以上研究基础上,尝试将研究成果应用于某药厂的琥乙红霉素片 NIR光谱数据分析,从而鉴别药品的真假。本文的主要工作如下: 1、提出基于HFK的LS-SVM FPGA计算结构,并使用VHDL实现。其中包括并行、串行训练硬件计算结构以及决策函数硬件实现结构。 2、使用UCI标准数据集对基于HFK的LS-SVM FPGA并行、串行计算结构的硬件资源消耗、训练速度、分类准确率等性能参数进行测试。实验表明:并行、串行计算结构都能对线性可分和线性不可分问题进行较好的分类,验证了该硬件计算结构的正确性。随着训练样本数的增加,并行计算结构硬件资源的消耗量几乎成线性增长,而串行计算结构硬件资源的消耗量增长比较小,这是串行计算结构的一大优点。但对于硬件资源宽裕并且对速度要求更高的场合,并行计算结构将是一个很好的选择。 3、将基于HFK的LS-SVM FPGA实现结构与基于高斯核函数的LS-SVM FPGA实现结构性能参数进行比较。实验表明:同样的数据集,两者消耗相同的硬件资源,都能获得较高的分类准确率,但硬件友好核函数能获得更快的训练速度,最高可达到5.1倍。基于两种核函数的硬件实现结构获得与软件实现方式相近的分类准确率,进一步证明本文提出的LS-SVM硬件实现的正确性。 4、利用ModelSim仿真平台对本文提出的基于HFK的LS-SVM决策函数硬件计算结构进行二分类和多分类实验。使用适当的定点数精度,该硬件实现方法获得与LIBSVM软件包同样的分类准确率。本文还对 LS-SVM的输入参数采用定点数进行运算做了初步的研究;在不降低 LS-SVM决策函数分类性能的情况下,获得了输入参数的最小位数。由于SVM的决策函数结构形式与LS-SVM的相同,因此,该计算方案同样适用于SVM。 5、将基于HFK的LS-SVM并行、串行FPGA计算结构以及基于高斯核函数的FPGA计算结构分别应用于某药厂琥乙红霉素片NIR光谱建模及分析。由于单个NIR光谱数据样本采样点比较多(维数比较高),我们首先采用PLS算法对NIR光谱数据进行降维;然后,采用基于两种核函数的硬件计算结构以及软件实现方式进行比较研究。实验表明,基于两种核函数的硬件计算结构和软件实现方式一样,都能达到良好的药品真假鉴别效果。基于HFK的FPGA实现结构比高斯核的训练速度要快,进一步证明了本文提出的硬件计算结构的正确性与高效性。