胡明清博士:国内车载智能音频算法的先行者

来源:东方网    2022-08-16 09:00
来源: 东方网
2022-08-16 09:00 
分享
分享到
分享到微信

在今年6月底刚刚结束的由中国汽车工业协会举办的2022中国汽车供应链优秀创新成果评选活动中,科大讯飞(苏州)科技有限公司(以下简称科大讯飞)与其他29家厂商共同获得中国汽车供应链优秀创新成果称号。在现场科大讯飞展示了创新成果,与同行分享了众多宝贵经验,而作为本次创新产品的核心算法缔造者,胡明清博士为本次获奖发挥了重要作用。

行业的先行者,源激情和热爱

胡明清博士对国内车载智能音频算法的贡献,可以被称为该行业的先行者。之所以被称为先行者,是因为胡明清博士开发的智能音频技术已经全部进入科大讯飞的汽车音频产品“飞鱼车载智能音频管理系统”中,打破了国外公司在这个领域的长期垄断优势,规避了国产汽车行业潜在的供应链风险,为车载智能音频算法的国产化做出了重要贡献。在中国汽车工业协会举办的“2022年中国汽车供应链大会稽首届中国新能源智能网联汽车生态大会”上,分别获得“2022中国汽车供应链优秀创新成果”奖和“中国智能网联汽车创新成果”奖项。值得一提的是,这是该奖项自评选以来,首次颁发给国产车载音频产品,充分肯定了胡明清博士在这个行业所做的贡献。

能够获得行业同仁的肯定是胡明清博士数十年如一日的对智能音频算法的激情投入和热爱的结果。有句话说得好“所有优秀成果的背后,都是长期的激情和热爱”。人生的道路就是这样,长期的激情和热爱未必能有丰硕的结果,但是没有激情和没有热爱就注定一无所获,这是我们从胡明清博士多年的对工作的激情和热爱中得到的启发,从他身上感受到对技术研发的激情和热爱,以及孜孜不倦的学习、不断拓展知识边界和不断超越自我的精神。

初涉人工智能,不断学习勇于尝试

早年胡明清博士从西安电子科技大学获得信息与通信工程专业的硕士学位并通过在工业界公司两年多的工作经历,已经积累了丰富的软件和硬件开发经验,完全可以凭借这些经验在工业界开始自己的职业生涯。

在胡明清博士看来,以往积累的软硬件开发经验是属于“术”层面知识,而更高层次的“道”,则需要博士阶段严格的科研训练才能达到。在落实到选择博士课题时,胡明清博士出于对数学浓厚的兴趣,选择了当时还是比较冷门的人工智能的一个分支:机器学习,研究机器学习算法及其在传感器网络中的应用。

2005年前后的机器学习研究主要围绕传统的基于核的机器学习和基于贝叶斯的统计机器学习算法,大多数算法还处于理论探索阶段,离实际应用的距离较远,但是由于研究涉及大量数学建模和优化求解,可以很好训练对实际问题的科学抽象能力。由此可见胡明清博士在选择博士课题时,完全基于自己的热爱和能力提升需要,并没有重用前期的工程经验,躺在舒适区,而是勇于进入一个全新的陌生领域。现在回想起来,胡明清博士不无感慨的说:当时是误打误撞进入了人工智能领域,谁会想到人工智能如今会那么火!也就是从那时候开始胡明清博士给自己贴上了“人工智能”的标签。在发表两篇 IEEE Trans.论文后,胡明清博士取得博士学位,之后进入中国科学院计算技术研究所工作。

胡明清博士在博士学习过程中最大的感受是受限于自己的工科背景,所受的数学训练相对比较薄弱,在做机器学习算法研究时感觉比较吃力。意识到自己这一块短板后,为了给自己的后续研究打好扎实的基础,在计算技术研究所的三年期间,胡明清博士以坚忍的毅力充分利用业余时间把自己薄弱的数学基础重新进行夯实,自学了包括泛函、优化理论和优化算法、统计等数学课程。选择优秀教材,一章一节仔细阅读和学习,完成每一个章节的所有习题。胡明清博士在计算技术研究所工作的三年期间,发表了一篇 IEEE Trans 论文和若干会议论文,作为项目负责人获得一项国家自然科学基金委的基金资助,参与若干项自然科学基金和国家 863 计划项目。

学术探索路从来不是一帆风顺,难免坎坷、时有风浪、时有曲折,胡明清博士同样经历了很多曲折,然而他用实际行动告诉我们不断学习和勇于尝试所迸发出的力量。正是因为胡明清博士不放弃坚持到底的毅力,在曾将走过的弯路上,看到了不一样的风景,培养出独立科研能力。胡明清博士在回想过去走过的一些弯路时感慨到:当时如果有人给自己一些指导,也许就不用走那么多弯路了。不过不感到遗憾,因为走弯路的过程也是锻炼自己的过程,坚信前途是光明的道路是曲折的,保持好自己的心态,不管遇到任何的挫折和困难,都可以克服,方法总比问题多,通过这样的经历会让自己变得更加从容和自信。

邂逅音频算法,亲历行业变革

之后胡明清博士于 2010 年 10 月份加入杜比实验室在北京的办公室。当时杜比公司正在全球招聘研究人员进行核心技术的研究工作,胡明清博士因在人工智能领域的研究经历和扎实的信号处理知识而被录取为高级研究人员。从此胡明清博士身上又被打上了“音频算法”的标签。在杜比工作期间,胡明清博士参与了杜比Atmos核心技术的开发,开发了若干算法,帮助解决了诸多难题,输出十项获得授权的美国专利。杜比的Atmos技术引领音频行业革命性的变革,把传统的环绕声从二维平面拓展到三维立体空间,现已经成为电影工业和音乐产业的行业标准。也正是因为在杜比的这四年,胡明清博士完成了从学术界的研究人员到工业界研究人员的思维方式转变,学会如何从产品或者业务中提炼问题。通过解决这些问题,提升产品性能和促进业务发展。

在杜比的四年职业生涯虽然给胡明清博士身上打上了“音频算法”标签,但也并没有弱化其身上的“人工智能”标签。在 2010 年到 2015 年这五年期间,胡明清博士在国家自然科学基金资助下,先后在机器学习的顶尖会议 ICML 和计算机视觉的顶尖会议CVPR 上发表了三篇论文。截至目前,其中一篇论文他人引用率达到了417次,其余的两篇论文引用率也达到100次以上。引用的学者不乏业界顶尖学者。

匠心钻研技术,追求极致品质

胡明清博士不管身处何处,都非常爱岗敬业,凭着一股不服输,无论干啥都要干好的劲头,努力钻研技术,工作上从来都不怕吃苦,任劳任怨,在自己的岗位上,无私奉献着光和热。

在完成在杜比的职业生涯之后,胡明清博士在2015年加入了爱奇艺,成为了爱奇艺的一名研究员,挑起了提升爱奇艺音频品质的重担。在很短的时间内提出整改方案,抛弃了爱奇艺自2010年成立以来一直运行的音频生产工具链。凭借出色的专业音频技术能力,在短短时间内独立全面更新了爱奇艺后台的音频生产工具链和流程。经过公司内部第三方部门进行评测,音频品质相较过去有质的提升,使得爱奇艺的音频品质在行业内快速跨越到头部位置。目前这套系统还在爱奇艺后台稳定运行,每天服务来自全球各地的多达数亿的用户。

  图:2016年多模态情感识别竞赛颁奖图片(胡明清博士:从右往左第二位)

胡明清博士在爱奇艺任职期间,为了维护爱奇艺的合法权益,打击盗版行为,开发了一套音频水印技术,保护了爱奇艺版权内容,防止版权内容被非法盗播。除了服务产品和业务线需求,胡明清博士还积极参与学术界活动,为爱奇艺在学术界影响力提升做出关键作用。在2016年由中国模式识别会议举办的《多模态情感识别竞赛》中,胡明清博士与团队成员共同分析主办方提供的数据集、提出各种算法方案、设计多重实验来不断迭代提升识别精度,最终在国内外43个队伍中脱颖而出,获得《音频情感识别比赛》的第一名,提升了爱奇艺在学术界的影响力。

研判行业趋势,积极拥抱变化

在互联网行业深耕五年之后,行业的挑战逐渐不能够满足胡明清博士期望,在2020年疫情最为严重的那个月份,胡明清博士加入了科大讯飞苏州人工智能研究院,从事智能汽车中的智能座舱的智能声学音频核心算法开发工作。在开发车载智能音频产品过程中,特别是三维环绕声系统,面临极大挑战。由于传统的国际厂商,例如哈曼国际、Bose、Dirac等在这个领域深耕多年,已经形成了很高的技术壁垒和知识产权壁垒。当时国内车载音频行业市场份额基本上被这几家厂商瓜分,国内本土厂商还很少有与之媲美的方案。

考虑到国产替代,规避潜在的供应链风险,当时科大讯飞提出要研发一套完全拥有自主知识产权的三维沉浸式环绕声系统,胡明清博士独辟蹊径,区别于传统厂商的采用经典信号处理方法,而是采用最新的人工智能算法成功的解决研发过程中的各种问题,研发出一套科大讯飞自己的三维环绕声算法,实现讯飞环绕声算法零到一的突破,在各项听感指标上都超过在这个行业深耕多年的同行。此后胡明清博士还陆续开发出虚拟厅堂技术和独立声场技术,与三维环绕声技术共同构成车载智能音频算法矩阵。

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn