百度新技术:人性化播报新闻成现实

来源:飞象网
2015-12-01 14:49:16

摘要

新版本的百度新闻增添了突破性的功能,用户可以下滑新闻列表使用语音播报功能,软件将以温柔磁性且富有感情的声音播报用户个人定制的新闻及摘要。这项充分利用了大数据及人工智能技术的创新功能,将使用户在获取新闻时拥有高度拟人化的人机交互体验。

见过科幻电影里“私人资讯秘书”的形象吗?未来的某个清晨,对着墙壁说话,一个温暖的男声或女声,便会为你播报最新的新闻资讯。如今,这一场景已部分变成身边的现实。

近日,百度新闻客户端推出的最新版本中,增添了语音播报功能。用户可以下拉新闻列表,呼出播报选项,软件将以温柔磁性且富有感情的男声播报用户个人定制的新闻及摘要。

更重要的是,与其它各类应用中生硬、冷冰冰的语音播报不同,百度新闻的男声抑扬顿挫,节奏流畅,几乎与真人说话无异。就像一位彬彬有礼、服务到家的私人资讯秘书,不但可以帮你挑选你喜欢的新闻,还能自动从中提炼摘要念给你听。可谓“念你所念”。

百度新技术:人性化播报新闻成现实

炫科技内核语音合成技术和篇章理解技术

经笔者亲测,百度新闻的语音播报功能可以用“惊艳”来形容,很难想象如此逼真的人声是通过计算机合成而来的。听惯了冰冷生硬的“导航风格”,百度新闻的“磁性嗓音”着实让人眼前一亮。更令人惊奇的是,百度新闻似乎读懂了自己推荐的每一篇新闻——它为用户朗读的内容并非全篇报道,而是凝练的核心信息。

看似简单的功能背后是复杂而前端的技术支持。据了解,百度新闻的语音播报依托的是百度特有的语音合成技术,在语料收集、标注和数据建模方面均取得了重大的突破。

百度语音技术部通过大量实验探索,采用多层双向LSTM-RNN的深度神经网络建模方式,在整句层面学习韵律停顿和声学参数的变化轨迹,自动学习词、短语甚至整句范围内的依赖关系,大大丰富了情感音库的建模能力。强大的建模能力让百度对语料信息标注的要求更加自由宽泛。

“传统技术对整个语料库控制过于严格,而且需要对语料进行手工标注,费时费力,这些都限制了最终合成语音的情感表现力。而我们基于大数据和深度学习的语音合成系统,完全采用机器学习技术,极大地扩展了语音合成系统所能使用的合成语料库的体积,从而使得语音合成系统包含更丰富的情感。”百度语音技术部负责人贾磊说,以后语音合成领域的理论创新和算法技术创新,都将围绕大数据和深度学习展开,语音合成技术必将发生深刻的变革。

新版百度新闻APP的另一个亮点,在于自动提取新闻中的核心信息,百度新闻会对每一篇新闻的要点进行抓取并生成摘要,磁性男声只会将摘要部分朗读给用户,而不会全篇阅读。这背后是百度出色的自然语言处理技术。通过分析新闻的词汇、句法、人物和事件等信息,采用机器学习的方法,自动识别关键部分,而后压缩句子,使得计算机能够理解篇章内容,最终形成方便阅读或倾听的新闻摘要。

或将引发新闻客户端领域差异化竞争

同质化,是新闻闻资讯类应用长期以来的现实格局。国内市场上的现有新闻客户端高度相似,版式、功能、内容多半如出一辙。无论是倡导真实还是挖掘态度,大家都只能在新闻以外的元素上做文章,新闻的内容或呈现方式都没有发生太大的变化。产品在用户体验上的提升也十分有限。

百度新闻此次推出的新版本,或将成为对国内新闻客户端既有格局的一次震动。新的语音播报技术几乎适用于任何生活场景,无论用户是清晨起床洗漱时,还是户外运动时,或者是交通出行时,人们都可以第一时间用“听”的方式获取新闻信息。“解放双眼,甚至解放双手,让听新闻像听音乐一样不受场景限制。”提到应用这一功能的初衷时,百度新闻负责人说。

据了解,这也是百度新闻凭借技术优势,在新闻客户端市场中推进差异化竞争的第一步。“目前,我们还在研发新的功能。依托百度在大数据、人工智能、机器学习领域的深厚积淀,我们有信心给用户带来全新的新闻获取体验。”

事实上,近一年来,百度新闻始终在“数据新闻”“信息可视化”“虚拟现实与新闻”等传播前沿持续探索。此次推出人性化语音播报功能,是一次厚积薄发的技术运用。

据了解,拥有语音播报功能的新版百度新闻已经在各大安卓平台上线,下周苹果手机用户也将可以通过应用商店进行升级。