论文部分内容阅读
考古出土的青铜器金文是宝贵的文字材料。准确、快速地了解其释义和字形演变源流对考古学、历史学和语言学研究均有重要意义。本文进行了金文拓片的数据采集与预处理,构建了金文图像数据库;研究了金文字头的字义分类与金文变体精确匹配的识别方法,为文物专家研究金文识别提供科技辅助支持。主要内容包括:(1)青铜器金文图像数据库构建。以《新金文编》等权威文献资料为金文信息采集的原始数据源,研究了金文图像的自动采集分割与预处理方法,实现了原始数据的数字化标准采集;分析了金文、青铜器、字义之间的关联关系,基于关系数据库的原理,设计了汉字--金文--青铜器数据之间的ER关系,构建了IB数据库对青铜器金文数据进行标准化存储。(2)基于混合特征和SVM的金文图像字头分类识别方法研究。针对单一金文特征无法表征金文问题,研究了混合特征的青铜器金文图像字头分类识别方法。针对当前金文图像样本较少不利于分类器训练的问题,基于金文图像数据库,利用生成对抗网络扩充训练样本。提取金文图像的方向梯度直方图特征(HOG)与灰度共生矩阵特征(GLCM),将结构特征和局部特征相结合训练SVM分类器,实现青铜器金文图像字头的识别,提高了识别准确率,降低了误判。(3)基于降维SIFT-RANSAC的金文图像变体匹配识别方法研究。为实现单个金文图像变体精准识别,在金文图像字头分类识别的基础上,提出基于降维的SIFT-RANSAC的金文图像变体匹配识别方法。针对经典SIFT算法效率低下且易误匹配的问题,通过将SIFT算法的特征描述符由矩形区域降维为四个同心圆区域,实现SIFT特征向量的降维,并利用RANSAC优化匹配特征点,降低图像识别的误配率,提高了识别效率和精度。