回到家,你不用担心找不到开关,挥挥手就能开灯,还可以打开窗户、电视或音响;驾车时,你用不着腾出手去拿手机,敲敲指头就可以接电话。随着手势识别等交互技术的发展,在不久的将来,这些都将成为现实。
手势识别,简单地说是一个用手、臂等姿态运动实现操控的过程,它的目的是让使用者在不借助任何辅助设备的情况下,自然、便捷、舒适地与智能设备进行交互。这一过程看似简单,实现起来却要解决一系列复杂的科学和工程技术结合难题。
不久前,计算机视觉公司未动科技发布了一款3D手势交互平台——黎曼平台。该平台利用人工智能技术,基于对深度图的处理实现了对手势的识别。未动科技创始人孙铮表示,未动科技的3D手势识别是基于深度摄像头的深度感知,经过计算机视觉与人工智能算法处理,识别出手部的三维姿态与位置。
3D手势识别并非近一两年才兴起的技术,此前不少公司已经开始了这方面的探索。比如,微软和英特尔推出了面向消费者的动作识别解决方案,但它们都是基于PC端的设计。黎曼平台则考虑到了移动端的功耗与运算性能等限制性条件,经过深度算法裁剪与工程优化,使得3D手势识别能够流畅精准地运行到手机等移动设备上,成为全球首款支持智能手机的手势识别平台。
孙铮说,传统的手势识别对每一帧的手势图像进行独立分析,而未动科技采用新的深度学习算法,把手势动作当作一个时间序列来处理,从而大幅提高了识别精度与运算效率。
从技术指标上看,黎曼平台可以实现对手部23个关节点识别以及26个自由度的追踪。相应延迟在毫秒级,在移动设备上最高帧率接近60,有低功耗、高精度、抗遮挡的特点,可以支持预定义3D手势。
德国PMD公司是全球唯一将深度传感器成功植入手机的技术提供商。近日,该公司宣布将选择黎曼平台作为中间件,为客户提供非接触式的交互方案,共同推出完整的手势识别软硬件一体方案,推进自然人机交互发展。
新的交互方式带来新的交互体验,甚至会引爆智能交互革命。从键盘、鼠标到触摸屏,交互方式一直向着人性化的方向发展。除了应用在智能手机上外,3D手势在识别机器人、无人机、虚拟现实、智能家居等领域还有广泛的应用。
以虚拟现实为例,在交互端,相比声控、眼动、手柄等识别方式,手势识别灵活性更高、实用性更强。此外,从沉浸感来说,用户在虚拟现实中看到自己的双手,并且自然舒适地操作,一定程度上提升了用户的体验。
专家表示,在人工智能的大背景下,原有的按键、触摸屏等交互方式可能会被颠覆,新型交互方式必将涌现,而3D手势识别是人机交互发展的重要趋势之一。智能交互模式也将带动产品升级创新,下一代智能设备的交互和操作方式对用户将更加自然和友好。