语音技术促进计算机技术再次变革

2017-04-18 09:13:32
分享

语音技术促进计算机技术再次变革

中国日报网4月18日电 据英国《经济学人》报道,英国科幻小说作家亚瑟·查理斯·克拉克(Arthur C. Clarke)表示,足够先进的技术与魔法无异。迅速兴起的语音计算技术证明了他的观点。使用语音技术就像念魔法咒语:只要对着空气说出几个字,身旁的设备便能达成你的愿望。

亚马逊Echo智能音箱是一款放置于桌面的柱形语音驱动电脑,名为Alexa。它可以为用户播放音乐和广播、讲笑话、回答一些细琐的问题、以及控制智能设备。在2016年圣诞节前,它进入了美国4%的家庭。语音助手在智能手机中也在迅速普及:苹果的语音助手Siri每周要处理20亿条命令;美国安卓手机上20%的谷歌搜索是通过语音输入的。现在发邮件和短信都可以通过语音输入,便利可靠。能说话为什么还要打字呢?

这是一个巨大的转变。尽管看起来好像挺简单,可是,通过提供一种自然的互动方式,语音技术有能力使计算机技术焕然一新。相比于输入复杂的键盘命令,通过更直观的窗口、图标、菜单以及后来的触屏技术使用电脑则受到欢迎。能对计算机说话后,抽象的用户界面就没有存在的必要了。就像移动手机不只是没有电线的电话,而汽车不只是没有马拉的车厢一样,没有显示屏和键盘的计算机将比如今我们想象的更有用、更强大,无处不在。

语音不会完全取代其他的输入和输出形式。有时,打字比讲话更便于我们与机器沟通(据说亚马逊正在研制一款装有嵌入屏幕的Echo智能音箱)。但是,语音技术出现后,会有越来越多的人选择通过语音与身边的科技互动,如洗衣机可以告诉你还有多久才能结束洗衣程序,你还可以与企业热线的虚拟助手进行交谈。不过,如果想发挥语音技术的最大潜力,科技人员还需进一步进行研究突破,并解决技术带来的棘手问题,即便利和隐私之间的权衡。

 

Alexa,什么是“深度学习”?

计算机语音识别系统已存在多年了。不过,这种技术之前并不可靠,需要长期的训练才能学会识别特定使用者的语音。现在计算机可以无需训练便能比较准确地识别出几乎所有人的语音,得益于“深度学习”这一人工智能技术。这一技术通常会使用数百万个来自互联网的例子训练某一软件系统。借助“深度学习”技术,机器将语音转为文字的准确度与人类不相上下。计算机翻译系统在迅速完善,把文字转为语音的系统也更加接近人声,听起来不再那么机械化。简言之,计算机在处理各种形式的自然语言方面发展非常迅速。

尽管借助“深度学习”技术后,机器可以较精准地识别语音,说话也不再那么生硬,但是,它们并不理解话语的含义。如果由语音驱动的计算机技术要真正蓬勃发展,这是便是它要克服的最大难题。只有理解文本信息,计算机才能流畅地与人类就某事进行交流,而不是像今天这样,仅能对简单的一次性语音指令(如,嗨,Siri,设置一个10分钟的提醒)做出回应。各大院校和大小企业的研究人员都在致力于解决这一问题。他们在研发可以就更复杂的任务进行更详尽对话的机器人。这些机器人不仅可以检索信息,还可以就房贷咨询提出建议、进行旅行安排。(亚马逊愿为研发出可以流畅地进行20分钟生动对话的机器人研发人支付100万美元奖励。)

 

当魔咒代替拼写

消费者和监管机构在语音技术的发展方面也扮演了一定的角色。尽管现在语音技术仅处于发展初期阶段,它却处于进退两难的境地:语音驱动系统只有在个性化后才能发挥最大潜能,接触到更多资源数据,如日历、电子邮件和其他一些敏感信息。这引发了人们对隐私和安全问题的担忧。

对于更为更复杂的事务,许多语音驱动系统始终在聆听和等待激活的状态。一些人担心:每部手机和每个房间内的联网麦克风时刻都在聆听,这将会带来怎样的影响?不是所有的语音都会上传到云端。在用户语音传送到真正处理用户指令的服务器之前,设备需要听到一句触发指令,如Alexa、OK、 Google、Hey、Cortana、或Hey, Siri等。不过,在人们储存语音后,这些数据有谁储存、储存多久就不得而知了。

阿肯色州警察局调查一起谋杀案时。认为一台亚马逊Echo智能音箱设备可能无意中听到了凶案信息,要求亚马逊提供所有可能与该案件有关的语音信息。亚马逊拒绝合作,并(在隐私保护提倡者的支持下)表示这种要求未必合法。同样的,2016年苹果公司拒绝协助美国联邦调查局FBI解锁一名恐怖分子的iPhone手机。这两起案例都表明了,我们需要制定明确的规则,规定在何种情况下可以为保障公众安全介入个人隐私。

即使这些问题还未解决,消费者仍会使用语音技术。大多数情况下,语音输入远比其他交流方式更加方便、自然。语音技术最独特的一点在于,用户在进行其他活动时(如开车、健身或者走在路上),仍可使用语音技术。这一技术也可以让那些因种种原因无法使用屏幕或键盘的人群使用计算机。语音技术不仅对计算机技术影响巨大,还会影响语言使用。计算机同声传译会令许多人认为无需掌握外语;在一个机器会说话的世界上,小语种更可能保留下来。触屏时代的到来是人类与计算机互动史上的一次巨大进步。语音技术将会是一次更大的变革。

 

(编译:李博文 刘恬 编辑:王旭泉)

 

 

分享

推荐