论文部分内容阅读
视频图像中的字符往往对理解图像的内容起着重要的作用,从视频图像中提取出字符信息有助于对图像信息的分析与处理。视频图像中的字符识别技术融合了数字图像处理、计算机图形学、模式识别、计算机视觉、人工神经元网络等多个学科的理论和方法。本文在MATLAB上通过对不同尺寸的中值滤波模板进行仿真比较,选取3×3中值滤波模板。通过对帧问差文本检测算法的仿真分析,提出连续帧边缘差的文本帧检测算法。采用多分辨率分解、Sobel边缘检测、横向与纵向腐蚀操作、膨胀操作、多分辨率融合相结合的方法进行文本定位,根据文本特征制定了文本筛选的规则,实验结果表明本文方法可以得到很好的文本定位效果。本文通过对文本分割算法和倾斜校正算法进行仿真、比较分析,根据仿真结果确定采用K均值聚类的文本分割算法和Hough变换的倾斜校正算法对定位出的文本进行分割和校正。利用基于投影的字符分割算法对字符进行切割,并对其进行改进以适用于粘连字符的分割。为了提高字符的识别率,本文采取坐标映射的方法对字符进行归一化处理,将分割出的字符归一化为25×25的标准尺寸。采用BP人工神经元网络进行字符识别,为了得到较好的识别网络,对基本BP算法、变学习率的改进型BP算法、引入动量项的改进型BP算法进行训练仿真,通过对训练时间及收敛性的比较分析,采用变学习率与引入动量项相结合的改进型BP算法,实验结果表明,该算法的识别率可以达到94%以上。本文采用北京瑞泰创新科技有限责任公司的ICETEK-DM6437-B评估模块作为硬件开发平台,并在其上实现视频图像中字符识别算法。在CCS集成开发环境下进行视频图像中字符识别算法的C程序开发。首先设置DSP/BIOS的相关环境参数并创建对象;接着保存配置文件并加载到工程中;然后编写视频图像中字符识别算法C程序;最后对算法程序进行调试直到满足要求。为了提高算法的执行速度,本文还对数学形态学算法、字符分割算法、变量的定义及循环体进行了优化。测试结果表明,在DSP上实现视频图像中字符识别算法基本满足预期要求,这为以后进一步的研究与开发提供了实验依据。