niKJ7Wj语音去混响 混响是指声波在室内传播时,被墙壁、天花板、地板等障碍物反射,与**声叠加的现象。 混响的作用 混响是声学中较重要的现象之一。适当的混响将使声音圆润而动听。过多的混响会使声音变得低沉且听不见。混响是建筑声学中的一个关键问题。报告厅应该有较短的混响时间。比如北京学术报告厅的混响时间是1s,而交响乐则需要较长的混响时间。比如上海音乐厅的混响时间是1.5s,维也纳音乐厅是2.05s 过多的混响会带来音素的重叠和掩蔽,严重影响语音识别的效果,尤其是远距离语音识别。 目前主流采用麦克风阵列+深度学习的方式去混响。
对麦克风阵列的需求 消费级麦克风阵列的兴起得益于蓬勃发展的语音交互市场,主要解决远距离语音识别问题,**真实场景下的语音识别率。 麦克风阵列声音定位 这涉及到语音交互用户场景的变化。当用户从手机切换到类似的智能音箱或机器人时,面对麦克风的环境其实*变了,就像两个人窃窃私语和大喊大叫的区别。 几年前,语音交互应该较常见的就是以 Siri 为代表的智能手机,一般采用单麦克风系统。 单个麦克风系统可以获得满足语音识别需要的低噪声、无混响、非常接近声源的声音信号。 但是,如果声源距离麦克风较远,并且在真实环境中存在大量噪声、多径反射和混响,则拾取信号的质量会下降,严重影响语音识别率. 此外,单个麦克风接收到的信号是由多个声源和环境噪声叠加的,很难将每个声源分开。 这样就无法实现声源定位和分离,这很重要,因为还有另一种声音叠加,不是噪声,但在语音识别中也应该被抑制,那就是人声的干扰。语音识别显然不能同时识别两个。不止一种声音。
麦克风阵列是由一组麦克风按一定的几何结构(通常是线性和圆形)放置而成,对采集到的不同空间方向的声音信号进行时空处理,以实现噪声抑制、混合噪声去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,从而提高语音信号处理质量,提高真实环境下的语音识别率。 事实上,仅通过麦克风阵列很难**语音识别率。 麦克风阵列只是一个物理入口,它只是在物理世界中完成声音信号处理,获得语音识别所需的声音,但语音识别率是在云端得到的结果,所以两个系统**匹配在一起得到较好的结果。 不仅如此,麦克风阵列处理的信号质量也无法由标准来定义。因为目前的语音识别基本上都是深度学习训练的结果,而深度学习有一个局限性,就是严重依赖样本数据库进行输入训练。如果处理后的语音与样本数据库不匹配,识别效果不会很好。
2018年4月,联丰迅声成立于历史文化名城古都西安,于同年9月获得英诺天使的种子轮投资。是一家以机器听觉为**的AIoT解决方案提供商,主要从事环境声音信号处理、声音识别、声源定位及相关的声学软、硬件产品研发与服务,并于2020年12月荣获“****企业”认定。
公司**技术团队由西北工业大学博士与硕士组成,环境声音事件检测技术和**前布局的ESR环境声目标识别技术处于**良好地位。连续数年参与世界**声学赛事,排名均位列top 3。是国内为数不多的同时自主掌握声呐硬件设计与算法软件开发的团队。
2018年4月,联丰迅声成立于历史文化名城古都西安,于同年9月获得英诺天使的种子轮投资。是一家以机器听觉为**的AIoT解决方案提供商,主要从事环境声音信号处理、声音识别、声源定位及相关的声学软、硬件产品研发与服务,并于2020年12月荣获“****企业”认定。
公司**技术团队由西北工业大学博士与硕士组成,环境..