论文部分内容阅读
从钢铁侠的潇洒和智慧,到变形金刚的勇敢与坚韧,从盗梦空间的诡异和震撼,到阿凡达的宏伟与感动。现代的科幻大片似乎都离不开人机互动。科技不断朝着人类感官与计算机程序巧妙结合大步迈进。曾经,我们无数次幻想的未来,或许马上就可以来到我们的生活中了。
在科技与人文发展的进程中,英特尔无疑起到了推动作用,它让我们离幻想中的生活越来越近,同时也对人类的想像力提出了挑战。据国外媒体报道,英特尔正式在其近期召开的IDF大会(英特尔开发论坛)上推出了感知计算软件开发工具包2013测试版。虽然,目前我们对该软件的了解还仅仅停留在极富科幻色彩的名称上,但是,仅依靠字面意思,我们也可以猜测到该款软件的实质功能。据说这种感知计算软件是帮助研发者开发专用应用程序的,它可以完美的实现以下功能:由人类通过语音以及机器视觉成功的向计算机传达出指令,而计算机也能够通过键盘、鼠标以及直接触摸屏等设备完整的接收到所有指令信息,经过分析计算,巧妙的结合多模式界面,达到人类与计算设备互动的最终目的。
自计算机诞生以来,其应用与发展的速度就始终是令人感叹与充满希望的。计算机发展的最终目的也无外乎是服务人类,接收人类发出的指令,给出对应的计算并输出结果不过是计算机最平常的工作流程了。然而,就是在这样平常的流程中,英特尔看到了巨大的开发潜质。鼠标、键盘已经不能完全满足人类输入的需求,在不断的实践中,我们总是探索着更为方便而简洁的输入方法,触摸屏应运而生。在现代手机早已不需要键盘这一强大事实面前,我们更深刻的体会到,人类不必再辛苦的掌握0和1关系的同时,还要求计算机的工作模式不断地向人类的感官和习惯靠拢。不需要再学习枯燥的计算机语言,取而代之的是计算机“辨识”人类的语言,“分析”人类的动作,给出精准的计算,从而实现人类预期的目的。英特尔就是在这样的需求中看到了商机,而这正是英特尔发展的关键,因为研究和开发这一套科幻电影中才会频繁出现的软件,不仅要组织大量的科研人员和软件工程师,还要耗费大量的财力物力,投入相当长的时间和精力。因此,该项目的成功,对英特尔未来的发展十分的重要。
近期人机互动的发展方向主要集中在语音识别和机器视屏两个方面。
通过语音进行输入的研究早已不再新鲜,但至今为止,尚未有可靠而且精准的系统推出。语音识别和机器视觉都已被广泛的应用于军事方面,由于9·11事件的影响,美国政府大力资助此项研究,因而语音识别技术也取得了大跨度的发展,但是由于种种原因,它并未成为平常的主流应用。民间的语音识别技术也出现了很长一段时间,各种新旧版本的Windows都曾预装过语音识别,但终究因为该技术不能真正的达到自然互动、准确率较低,而且需要使用耳机,最终没能取得成功。
说到语音识别,也并不都是坏消息。在苹果iOS和谷歌上,语音识别技术就得到了发展,美中不足的是,该技术仍未精准到可以不用键盘,它必须要连接到互联网才能工作的特点,也让这款语音识别技术的发展受到了不小的限制。微软研发的语音识别在游戏中的使用可圈可点,但在跨不同设备广泛应用时的不自然,还是局限了其大范围的发展。
机器视觉的发展时间要比语音识别晚一些,主要是通过微软的Kinect才流行起来的。就如同人要判断距离时,需要两只眼睛同时使用一样,Kinect也需要使用两个摄像头,通过不同的视角来对人的动作进行判断。遗憾的是,这种判断只是大概的、笼统的,它并不能准确的检测到特定的手指和关节,而且对用户所在的位置也有一定的要求,这无疑局限了该技术的发展。而计算资源不能过于复杂等条条框框也最终导致微软这款机器视觉软件不能大规模的发展。
机器视觉不能简单的等同于照相机,它的最终目的不是保存所“看到”的影像,而是最终完成判断功能。一些电脑制造商,甚至连谷歌的Nexus 7都提供了面部识别功能,但这种识别显得有点低级,它不能很好的分辨出哪个是真实的人脸、照片、视频画面还是面具,达不到机器视觉识别人脸的基本要求。
在高科技手段不断应用于电影的客观事实中,我们可以体会到3D技术的大规模发展不但为电影本身增添了可观性,更为机器视觉提供了新思路。我们所要完成的工作,不过是3D游戏的逆向工程而已。但是,这仍然需要大量的硬件作为实现的基础,高分辨率的摄像头是必不可少的,在给计算设备输入像素信息、多边形和纹理的同时,也需要大量的处理性能和电力,这不仅仅是要满足计算引擎,高分辨率立体摄像头对此也有很高的要求,以上步骤完成后,3D“图”还需要与本地数据库的图案进行匹配,这也对计算性能和电力提出了较高的要求。
在技术上,即使能够逐步完善以上所有的不足,英特尔还是需要考虑用户的隐私,怎样既方便用户操作使用,又能严格保守用户的秘密,也是该项目要考虑的一个重点问题,这样我们才不需要担心网络上是否会有无数双眼睛盯着自己“穿拖鞋跳探戈”。
虽然,要达到真正实现自然、准确的人机互动,还有很长的一段路要走。但是,现在对语音识别和机器视觉的初步尝试,也给未来带来了无数的可能性。科幻电影中的情节将不再仅仅停留在大屏幕上,走下大屏幕的科幻桥段,无疑会给我们的生活带来更多新鲜的感受。
想像一下,早上被闹钟温柔的叫醒,并根据一天的活动安排和天气变化设计好你的出行计划和着装风格;工作中,你不必再辛苦的敲击键盘和为记不住文件被放在哪个路径下而苦恼,取而代之的只是“有事儿您说话”;忙了一整天,想放松一下,不必再繁琐的一首一首挑选喜欢的歌曲,你的情绪早已被音响察觉,它会自动奉上一段符合心境的音乐;看电视也不必到处寻找遥控器了,动动手指,所有频道任你选。
计算机已经从各个方面渗透到了人类的生产生活中,它在为人类服务的同时,也在不断地挑战人类的智慧。怎样把想像变成现实早已不是新鲜的想法,充分利用计算机,把人类智慧与机器功能完美结合已不仅仅是英特尔想要完成的任务了。在科技公司百家争鸣、百花齐放的时代,技术的发展也是空前迅速的,相信想像与现实的界限在未来的生活里终将不复存在。
在科技与人文发展的进程中,英特尔无疑起到了推动作用,它让我们离幻想中的生活越来越近,同时也对人类的想像力提出了挑战。据国外媒体报道,英特尔正式在其近期召开的IDF大会(英特尔开发论坛)上推出了感知计算软件开发工具包2013测试版。虽然,目前我们对该软件的了解还仅仅停留在极富科幻色彩的名称上,但是,仅依靠字面意思,我们也可以猜测到该款软件的实质功能。据说这种感知计算软件是帮助研发者开发专用应用程序的,它可以完美的实现以下功能:由人类通过语音以及机器视觉成功的向计算机传达出指令,而计算机也能够通过键盘、鼠标以及直接触摸屏等设备完整的接收到所有指令信息,经过分析计算,巧妙的结合多模式界面,达到人类与计算设备互动的最终目的。
自计算机诞生以来,其应用与发展的速度就始终是令人感叹与充满希望的。计算机发展的最终目的也无外乎是服务人类,接收人类发出的指令,给出对应的计算并输出结果不过是计算机最平常的工作流程了。然而,就是在这样平常的流程中,英特尔看到了巨大的开发潜质。鼠标、键盘已经不能完全满足人类输入的需求,在不断的实践中,我们总是探索着更为方便而简洁的输入方法,触摸屏应运而生。在现代手机早已不需要键盘这一强大事实面前,我们更深刻的体会到,人类不必再辛苦的掌握0和1关系的同时,还要求计算机的工作模式不断地向人类的感官和习惯靠拢。不需要再学习枯燥的计算机语言,取而代之的是计算机“辨识”人类的语言,“分析”人类的动作,给出精准的计算,从而实现人类预期的目的。英特尔就是在这样的需求中看到了商机,而这正是英特尔发展的关键,因为研究和开发这一套科幻电影中才会频繁出现的软件,不仅要组织大量的科研人员和软件工程师,还要耗费大量的财力物力,投入相当长的时间和精力。因此,该项目的成功,对英特尔未来的发展十分的重要。
近期人机互动的发展方向主要集中在语音识别和机器视屏两个方面。
通过语音进行输入的研究早已不再新鲜,但至今为止,尚未有可靠而且精准的系统推出。语音识别和机器视觉都已被广泛的应用于军事方面,由于9·11事件的影响,美国政府大力资助此项研究,因而语音识别技术也取得了大跨度的发展,但是由于种种原因,它并未成为平常的主流应用。民间的语音识别技术也出现了很长一段时间,各种新旧版本的Windows都曾预装过语音识别,但终究因为该技术不能真正的达到自然互动、准确率较低,而且需要使用耳机,最终没能取得成功。
说到语音识别,也并不都是坏消息。在苹果iOS和谷歌上,语音识别技术就得到了发展,美中不足的是,该技术仍未精准到可以不用键盘,它必须要连接到互联网才能工作的特点,也让这款语音识别技术的发展受到了不小的限制。微软研发的语音识别在游戏中的使用可圈可点,但在跨不同设备广泛应用时的不自然,还是局限了其大范围的发展。
机器视觉的发展时间要比语音识别晚一些,主要是通过微软的Kinect才流行起来的。就如同人要判断距离时,需要两只眼睛同时使用一样,Kinect也需要使用两个摄像头,通过不同的视角来对人的动作进行判断。遗憾的是,这种判断只是大概的、笼统的,它并不能准确的检测到特定的手指和关节,而且对用户所在的位置也有一定的要求,这无疑局限了该技术的发展。而计算资源不能过于复杂等条条框框也最终导致微软这款机器视觉软件不能大规模的发展。
机器视觉不能简单的等同于照相机,它的最终目的不是保存所“看到”的影像,而是最终完成判断功能。一些电脑制造商,甚至连谷歌的Nexus 7都提供了面部识别功能,但这种识别显得有点低级,它不能很好的分辨出哪个是真实的人脸、照片、视频画面还是面具,达不到机器视觉识别人脸的基本要求。
在高科技手段不断应用于电影的客观事实中,我们可以体会到3D技术的大规模发展不但为电影本身增添了可观性,更为机器视觉提供了新思路。我们所要完成的工作,不过是3D游戏的逆向工程而已。但是,这仍然需要大量的硬件作为实现的基础,高分辨率的摄像头是必不可少的,在给计算设备输入像素信息、多边形和纹理的同时,也需要大量的处理性能和电力,这不仅仅是要满足计算引擎,高分辨率立体摄像头对此也有很高的要求,以上步骤完成后,3D“图”还需要与本地数据库的图案进行匹配,这也对计算性能和电力提出了较高的要求。
在技术上,即使能够逐步完善以上所有的不足,英特尔还是需要考虑用户的隐私,怎样既方便用户操作使用,又能严格保守用户的秘密,也是该项目要考虑的一个重点问题,这样我们才不需要担心网络上是否会有无数双眼睛盯着自己“穿拖鞋跳探戈”。
虽然,要达到真正实现自然、准确的人机互动,还有很长的一段路要走。但是,现在对语音识别和机器视觉的初步尝试,也给未来带来了无数的可能性。科幻电影中的情节将不再仅仅停留在大屏幕上,走下大屏幕的科幻桥段,无疑会给我们的生活带来更多新鲜的感受。
想像一下,早上被闹钟温柔的叫醒,并根据一天的活动安排和天气变化设计好你的出行计划和着装风格;工作中,你不必再辛苦的敲击键盘和为记不住文件被放在哪个路径下而苦恼,取而代之的只是“有事儿您说话”;忙了一整天,想放松一下,不必再繁琐的一首一首挑选喜欢的歌曲,你的情绪早已被音响察觉,它会自动奉上一段符合心境的音乐;看电视也不必到处寻找遥控器了,动动手指,所有频道任你选。
计算机已经从各个方面渗透到了人类的生产生活中,它在为人类服务的同时,也在不断地挑战人类的智慧。怎样把想像变成现实早已不是新鲜的想法,充分利用计算机,把人类智慧与机器功能完美结合已不仅仅是英特尔想要完成的任务了。在科技公司百家争鸣、百花齐放的时代,技术的发展也是空前迅速的,相信想像与现实的界限在未来的生活里终将不复存在。