论文部分内容阅读
多媒体人机交互技术是多媒体技术和人机交互技术的结合,其主要内容是信息表示的多样化和如何通过多种输入输出设备与计算机进行交互。它包括基于视线跟踪、语音识别、手势输入等各种新的交互技术。而视线跟踪与视线输入作为这个领域中新兴的技术,成为近年来人机交互领域中倍受关注的前沿方向。围绕着视线跟踪与视线输入这个主题,本文主要探讨了人眼视觉跟踪理论与基于视线输入的人机系统等相关问题。首先,本文简要论述了人机交互技术和计算机视觉理论的发展历程,并扼要介绍视线跟踪技术的现有基本原理和方法,总结其研究现状和进展。同时介绍本文的研究背景和研究内容。其次,不同于主动红外源照射下基于角膜反射—瞳孔中心(PCCR)的理论,提出了一种基于人眼“特征”的视线跟踪系统。具体来说是将眼睛的空间坐标与眼睛图像的LPM特征相结合作为视线判别的特征,通过级联支持向量回归的算法(级联SVR)预测视线方向与屏幕坐标的映射关系,实现了人在与计算机进行交互过程中头部自然运动情况下的视线跟踪。用眼睛图像LPM特征来表示眼睛视线的信息,是对经典的基于红外线眼睛图像的瞳孔中心反射点向量方法的一种改进。传统的瞳孔中心反射点向量的算法,在计算瞳孔中心时通常需要边缘形状检测,然后确定中心位置,由于瞳孔的形状随着眼睛运动会产生变化,而且瞳孔的边缘经常会出现模糊现象影响瞳孔中心的检测结果,同时反射点过大也会使检测的反射点位置发生偏移,所以在计算瞳孔中心反射点向量时经常会出现误差,影响实验效果。利用LPM特征不仅能够表现瞳孔中心反射点向量所代表的方向信息,而且还能体现视线方向变化时眼睛的纹理变化。经过大量的实验表明,本文使用的跟踪方法与经典的跟踪算法相比有明显的改善,视线跟踪达到了很好的效果。