查看原文
其他

解开无形声音密码,让有形世界更友好 | 邬晓钧

Yuki 我是科学家iScientist 2022-10-01


9月14日“我是科学家”将举办第十七期活动

“善良的力量”



本期演讲嘉宾


邬晓钧

清华大学计算机系高级工程师

清华—得意音通声纹处理联合实验室副主任


《解开声音密码,让老年人不必奔波千里领退休金》



邬晓钧预告视频:


声音,无影无形,却是我们沟通交流和感知世界的重要途径。


来自清华大学计算机科学与技术系的邬晓钧老师,主要从事的研究就是人类的语言和语音。他的工作,就是从不同人的声音中分辨出他的身份。


“人类发出声音主要依靠声带,通过声带,经过口腔鼻腔,再通过空气传播出去”邬晓钧说。



每个人的声音其实都和指纹一样,有自己独特的“元素”,会受到先天和后天环境的影响。“首先,人的声音会存在一些先天差异;其次,一个人从小到大所处的环境,用的方言、语言等后天惯性也会形成个人的特点。”


这些生理上的特征和后天习惯形成的特点,都会影响我们的声音,“那么,我们反过来去找声音中这些特殊的部分,就能够跟每个人的特点对应起来。”邬晓钧解释道。


声音识别是清华大学人工智能领域一个非常重要的方向,也是一个很传统的应用方向。不过,要让科学技术转变成真正的产品造福社会,需要一些企业以及政府的参与和支持。


“所以,我们实验室就和得意音通公司建立了一个联合实验室,在研究机构和企业的合作这样一个背景下,我们逐渐把技术踏踏实实地变成了具体的产品和应用,然后能够满足具体的应用的需求。”


在应用的过程中,邬晓钧也和许多人聊过声纹识别技术,“大家听到用声音可以判断人的身份,其实还是会觉得这是很神奇的一件事,但是经过我们多年的努力,这真的不是一个神话,而是实实在在的我们科技能够做到的一件事情。”



现在,邬晓钧所在团队研发的声纹识别产品,已经在很多地方取得了很好的用户评价,给许多需要帮助的人们带来了方便。


在邬晓钧看来,“声纹识别研究,就像把一个无形的东西,在处理过程中变成有形的东西。这个过程充满了美感。” 


另外,“它深深地挖掘了我们人日常就有的一些能力,然后极大地扩展了这些能力,让我们每个人都成为了超人。”


9月14日,欢迎大家来A33剧场,听邬晓钧老师聊一聊如何利用声纹技术造福百姓。



9月14日下午14:00-16:30

北京 · A33剧场

扫描下方二维码立刻报名

(报名截止到9月13号)

报名成功者将在9月13日前收到短信通知

名额紧俏,请珍惜到场机会哦~

建议成人及12岁以上青少年参与



精彩直播同步上线

请关注“我是科学家”在

一直播、哔哩哔哩、网易官方主页



欢迎个人转发到朋友圈

科学家演讲,我要报名!


点击“阅读原文”,立即报名

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存