论文部分内容阅读
随着计算机、通信、微电子等技术的发展,智能手机、智能手表等移动设备不断涌现。这些移动设备往往具有一定的计算、存储、通信能力,并集成了加速度计、陀螺仪、磁力计等多种传感器,为随时随地的信息采集和数据处理创造了机会。移动设备的发展使得人们减少了对桌面型计算模式的依赖,推动了“以人为中心”的计算模式的发展。在以人为中心的计算中,行为感知识别是支撑这一计算模式的关键技术,它通过感知模块记录用户行为对应的观测数据,并分析观测数据识别用户行为(如走路、慢跑、打字),从而为用户提供信息支持和智能服务。由于移动设备具有轻便易携、内置多种传感器、具备一定的计算和存储能力等特性,基于移动设备的行为感知识别技术引起了人们的广泛关注,让人们摆脱了固定式设备的束缚,可以在移动环境下实现随时随地的行为感知识别。然而,对于移动设备而言,由于计算资源和续航时间有限,传统的感知识别方法难以在移动设备上直接运行,我们需要针对移动设备研究、设计可行的感知识别方案。近年来,基于移动设备的行为感知识别工作已经展开,但它们往往集中于粗粒度、简单独立的动作识别,并且识别算法的数据训练成本较高。具体而言,这些研究工作往往存在以下一些局限性:关注粗粒度的动作识别,难以实现高精度的微动作感知识别;离散地识别几种动作或是简单重复动作,鲜有考虑相互关联的系列动作识别或连续行为识别;需要进行较高成本的训练来实现动作识别,缺乏有效的模型来关联感知数据和用户行为。为解决上述问题并让识别方法在实际应用中有效运行,本文针对移动设备中的细粒度、关联性的动作识别问题展开了一系列的研究,旨在实现高精度的微动作识别、系列动作识别、连续行为识别,并研究如何建立感知数据和用户行为之间的模型关系,降低行为识别的训练成本。此外,针对移动设备的特点,本文还将考虑时延、能耗、干扰等问题,使得行为感知识别方法能够在资源有限的移动设备上良好运行。本文的主要贡献总结如下:(1)针对微动作感知识别问题,提出了一种基于目标定位的微动作感知识别方法·;基于该方法在智能手机上实现了基于虚拟键盘的文本输入系统,验证了该识别方法。我们的系统利用移动设备中的内置摄像头追踪用户手指的微小运动,通过匹配纸键盘上的按键区域和指尖位置定位目标按键,实现按键行为这一微动作的感知识别。此外,通过动态调整图片大小、聚焦目标按键区域、引入多线程、改变图片读写方式等优化方法降低了按键行为识别的时延,在移动设备上实现了高精度的实时文本输入。(2)针对系列动作感知识别问题,提出了一种基于上下文的系列动作感知识别方法;基于该方法在智能手机上实现了拍照节能系统,验证了该识别方法。我们的系统利用智能手机中内置的加速度计、陀螺仪感知识别用户当前的行为处于拍照过程中的哪个状态,从而采用对应的节能方案减少不必要的能量开销。考虑到拍照过程中系列行为之间的关联性,提出了动作状态机来描述一系列拍照行为之间的转移关系,利用上下文信息(即动作之间的相对顺序)来辅助识别当前的用户行为。通过引入上下文关系,提高了系列动作识别的准确率和对识别错误的容忍性,从而在保证用户体验的情况下节约了拍照过程中的手机能耗。(3)针对连续行为感知识别问题,提出了一种基于轮廓的连续行为感知识别方法;基于该方法以腕带式设备实现了空中写字识别的原型系统,验证了该识别方法。我们的系统利用腕带式设备中的内置加速度计、陀螺仪、磁力计感知用户的空中写字行为,并将其识别为对应的字符。为了降低行为识别中数据训练过程所需的成本,提出了一种“基于轮廓的动作模型”,在3D空间中计算用户行为对应的轮廓,来关联感知数据和写字行为。对于用户行为对应的轮廓,我们采用空间转换、轮廓切割、语法关系约束等方式将其识别为对应的字符;并引入隐马尔可夫模型,进一步提高连续行为的识别准确率。通过引入动作轮廓模型,降低了数据训练的成本,并提高了识别算法的可扩展性。