讯飞星火大模型激活虚拟智能，塑造交互无限可能

5月14日结束的OpenAI发布会推出其最新旗舰模型GPT-4o，展现了AI技术愈发强大的能力。在人工智能飞速发展、大模型不断涌现的今天，适逢讯飞星火大模型发布1周年。 这一年里，讯飞星火给虚拟人带来很多惊喜与变革。

（图片由讯飞星火生成）

虚拟人本质上是对人的一种数字化模拟，具备三大特征：外观、行为、思想。 这些特性的实现依赖一系列先进技术的融合，如图像识别、3D建模、动作捕捉、自然语言处理、计算机视觉等。目前讯飞星火大模型对虚拟人的赋能，体现在如下方面。

①形象定制更轻量：秒级构建

依托星火大模型，讯飞智作上线“秒级声音/形象构建”功能， 可以实现声音和形象的快速制作！

1716260514<span style='background-color: orange'><span style='background-color: orange'>19</span></span>7245.png

讯飞智作“秒级声音 & 形象构建”功能页面

只需10秒以内 的 个人形象视频素材， 通过AI算法提取外貌特征、声音特点等要素，系统能在极短时间内生成个人“数字化分身”。同时还支持形象模型的自训练、标准训练，满足虚拟人在不同场景下的应用需求。

根据真人主播生成的虚拟主播“安小佳”

根据真人主播生成的虚拟主持人“小俊“

教培、媒体传播、科技服务、客服导览、短视频制作等多种场景，涉及不同内容需求，讯飞智作都能很好地满足。

②行为驱动更真实：超拟人声音 +AI 生成动作

1月30日发布的星火语音大模型可实现超拟人对话， 声音效果接近人类日常生活的口语表达状态， 拥有呼吸叹气、变语速、停顿思考、轻重读、语气词（嗯、啊）等副语言能力。此外，大模型对情绪的感知度达85%+，能更生动地表达高兴、抱歉、撒娇、困惑等情绪。

目前 超拟人声音已上线讯飞智作， 包含“聆小琪”、“聆小珊”、“聆玉言”、”聆玉昭“、“聆飞哲”5款男女发音人。无论是日常闲聊，还是复杂专业的问答咨询，这样的声音都能更好地表达性格与情感。

超拟人声音 内容更真实

除声音之外，动作也是虚拟人交互的关键要素。大模型技术加持下，可以对语义文本进行深度理解，自动匹配和生成动作， 让虚拟人动作更加自然、流畅和逼真，也更有生命力。

多样化姿态 场景更丰富

AI 生成动作 互动更自然

目前讯飞智作新上线多款虚拟人形象，支持AI生成动作， 搭配场景化视频模板，让内容效果更贴近真实场景。

③交互大脑有意识：虚拟人智能交互机再进化

虚拟交互的升级，意味着用户与虚拟人之间的沟通互动更自然、高效和智能。

作为一款集合先进语音识别、自然语言处理和机器学习技术的智能设备，虚拟人智能交互机在星火大模型加持下，不断升级其智能感知能力、语义理解能力、情感表达能力， 让虚拟人与用户的“面对面”交流问答更有效、更开放。

目前，智能交互机已在金融、政务、文旅、商业、展会等多个领域大规模应用。圆明园、明中都、骆岗公园等景区，北京冬奥会、成都大运会等重大场合，都能见到它。

科大讯飞打造的成都大运会虚拟志愿者小芙

虚拟人智能交互机亮相 2023 世界人工智能大会

先进的星火大模型给虚拟人带来全面提升，不仅是外在形象、语言和动作上，更在于 对虚拟人交互能力的升级，对虚拟人“自主意识 ” 的增强，进而引领虚拟人 “全新意识”。

作为新质生产力代表，讯飞智作始终坚持践行人工智能+，让虚拟人成为人类伙伴。

免责声明：该文章系我网转载，旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议，仅供读者参考。

【责任编辑：钟经文】