浙江交互声学回声抑制算法

时间：2023年04月23日来源：

反映到听感上就是回声（远端判断成近端）或丢字（近端判断为远端）。（2）计算近端信号d(n)与估计的回声信号e(n)的相干性，如图5(b)，第二行为估计的回声信号e(n)，第三行为二者相干性cohde，很明显近端的部分几乎全部逼近，WebRTC用比较严格的门限（>=）即可将区分绝大部分近端帧，且误判的概率比较小，WebRTC工程师设置如此严格的门限想必是宁可一部分双讲效果，也不愿意接受回声残留。从图5可以体会到，线性滤波之后可以进一步凸显远端参考信号x(n)与估计的回声信号e(n)的差异，从而提高远近端帧状态的判决的可靠性。存在的问题与改进理想情况下，远端信号从扬声器播放出来没有非线性失真，那么e(n)=s(n)+v(n)，但实际情况下e(n)与d(n)很像，只是远端区域有一些幅度上的变化，说明WebRTCAEC线性部分在这个case中表现不佳，如图6(a)从频谱看低频段明显削弱，但中高频部分几乎没变。而利用变步长的双滤波器结构的结果会非常明显，如图6(b)所示无论是时域波形和频谱与近端信号x(n)都有很大差异，目前aec3和speex中都采用这种结构，可见WebRTCAEC中线性部分还有很大的优化空间。如何衡量改进的线性部分效果？这里我们对比了现有的固定步长的NLMS和变步长的NLMS。近端信号d。

非线性声学回声消除技术研究现状。浙江交互声学回声抑制算法

什么是非线性声学回声？，什么是非线性的声学回声？这里我给出了一张图，的是声学回声的路径图，图的左边对应的是发射端，右边对应的是接收端。我们发出的信号首先要经过D/A变换，从数字域变换到模拟域，然后再经过功率放大器，放大之后驱动喇叭，这样就会发出声音。发出来的声音经过空气信道传播之后，到了接收端被麦克风采集到，然后再次经过功率放大器，再通过A/D变换，从模拟域又变回到数字域。那么这里的y[k]就是我们收到的回声信号。，我们接收到的回声y[k]到底是线性回声还是非线性回声呢？或者说我们应该怎么去判断它？我觉得要解决这个问题，就是要认识清楚这里面的每一个环节，看看它们到底是线性系统还是非线性系统，如果所有的环节都是线性的话，那么很自然y[k]就是一个线性的回声，否则只要有一个环节是非线性的，那么这个回声就是非线性回声。录播声学回声降噪算法非线性声学回声消除方面的资料非常少。

这样会带来一个新的问题：按照Widrow的自适应滤波理论，滤波器的长度越长，其收敛速度越慢，同时权噪声越大，进而导致强混响下回声消除不够理想。第二个问题是延时跳变问题。在实时音视频通话领域，延时跳变是一个比较普遍的问题。主要现象是麦克端采集的信号和回声参考信号之间的时延关系会发生跳变，每次跳变之后就需要重新对齐信号，就会漏一些回声出来。第三个问题是啸叫问题。啸叫的检测和啸叫的抑制是公认的在回声领域的经典难题。还有双讲问题。双讲是评估回声消除算法性能的一个重要指标，当然也是很难处理的一个问题，因为双讲很容易导致滤波器系数发散。综合以上这些维度我们可以看到，非线性的声学回声消除是一个很有挑战的研究方向。双耦合声学回声消除算法这个是我们团队提出来的一种算法，它的主要特点是，在构建滤波器模型的过程中结合了非线性声学回声的一些特性，因此它在抑制非线性回声方面，也体现出固有的优势。1.非线性声学回声系统建模,继续回到前面的这个声学回声路径。我们对这个模型进行了简化。我们将左边的喇叭端用一个传递函数Wn来表示，假设它的是非线性的回声路径传递函数；同时我们将喇叭右边，就是麦克端，统一用Wl来表示。

TWS耳机异音，底噪，回声测试难点,TWS耳机市场一直在迅猛发展和壮大，逐步提升在整个耳机市场中的份额，无论是坐公交，乘地铁，漫步，还是居家娱乐，都能看到TWS耳机的魅影。换个角度讲，TWS耳机正在融入人们的生活。与此同时，习惯了TWS的用户对于TWS耳机也有着更高的要求，比如音质，降噪，更好的无线连接，防水，续航，轻便，舒适等。近期市场调查反馈得知，消费者普遍把音质作为选购TWS耳机的首要指标。其中消费者直观感受到的几项指标，在生产环节又容易忽略及不易测试出来的。测试员在听音时因工厂环境原因也难以分辨出来，但在实际使用过程中又很容易发现的不良，造成客户投诉及批量退货。这就是异（常）音，底噪和回声问题。下面我们基于这三者的表象，原因以及测量方法做些介绍。一、耳机异（常）音异（常）音泛指耳机喇叭漏气、杂音、振音等非正常音。其产生原因大概有以下几项：1、喇叭音圈问题，如变形、散线、未对齐、尾部卷起大振幅时音圈碰擦到T铁或华司等。2、喇叭磁隙问题，有摩擦或松散微粒。3、喇叭振膜问题，脱胶，喇叭振膜边缘与钢架胶粘处分离，或振膜表面破损。4、耳机电气及悬挂系统的缺陷，导致干扰附加音。异常音之所以难测试。

非线性的声学回声消除问题是一个困扰了行业很多年的技术难题。

n)中的回声是扬声器播放远端参考x(n)，又被麦克风采集到的形成的，也就意味着在近端数据还未采集进来之前，远端数据缓冲区中已经躺着N帧x(n)了，这个天然的延时可以约等于音频信号从准备渲染到被麦克风采集到的时间，不同设备这个延时是不等的。苹果设备延时较小，基本在120ms左右，Android设备普遍在200ms左右，低端机型上会有300ms左右甚至以上。（2）远近端非因果为什么会导致回声？从（1）中可以认为，正常情况下当前帧近端信号为了找到与之对齐的远端信号，必须在远端缓冲区沿着写指针向前查找。如果此时设备采集丢数据，远端数据会迅速消耗，导致新来的近端帧在向前查找时，已经找不到与之对齐的远端参考帧了，会导致后续各模块工作异常。如图10(a)表示正常延时情况，(b)表示非因果。WebRTCAEC中的延时调整策略关键而且复杂，涉及到固定延时调整，大延时检测，以及线性滤波器延时估计。三者的关系如下：①固定延时调整只会发生在开始AEC算法开始处理之前，而且调整一次。如会议盒子等固定的硬件设备延时基本是固定的，可以通过直接减去固定的延时的方法缩小延时估计范围，使之快速来到滤波器覆盖的延时范围之内。下面结合代码来看看固定延时的调整过程。

非线性的声学回声消除问题。江苏智能音响声学回声抑制算法

非线性声学回声产生的原因。浙江交互声学回声抑制算法

WebRTCAEC算法中开辟了可存储250个block大缓冲区，每个block的长度PART_LEN=64个样本点，能够保存的1s的数据，这也是理论上的大延时能够估计的范围，够用了。我们用610ms延时的数据测试(启用大延时调整需要设置delay_agnostic_enabled=1)：我们还是设置默认延时为240ms，刚开始还是调整了-60个block，随后大延时调整接入之后有调整了-88个block，一共调整(60+88)*4=592ms，之后线性滤波器固定index=4，表示剩余延时剩余16ms，符合预期。③线性滤波器延时估计是固定延时调整和大延时调整之后，滤波器对当前远近端延时的直接反馈。前两者调整不当会造成延时过小甚至非因果，或延时过大超出滤波器覆盖能力，导致无法收敛的回声。因此前两者在调整的过程中需要结合滤波器的能力，确保剩余延时在滤波器能够覆盖的范围之内，即使延时小范围抖动，线性部分也能自适应调整。总结与优化方向WebRTCAEC存在的问题：（1）线性部分收敛时间较慢，固定步长的NLMS算法对线性部分回声的估计欠佳；（2）线性部分滤波器阶数默认为32阶，默认覆盖延时132ms，对移动端延时较大设备支持不是很好，大延时检测部分介入较慢。浙江交互声学回声抑制算法

深圳鱼亮科技有限公司公司是一家专门从事智能家居，语音识别算法，机器人交互系统，降噪产品的生产和销售，是一家服务型企业，公司成立于2017-11-03，位于龙华街道清华社区建设东路青年创业园B栋3层12号。多年来为国内各行业用户提供各种产品支持。公司主要经营智能家居，语音识别算法，机器人交互系统，降噪等产品，产品质量可靠，均通过通信产品行业检测，严格按照行业标准执行。目前产品已经应用与全国30多个省、市、自治区。Bothlent为用户提供真诚、贴心的售前、售后服务，产品价格实惠。公司秉承为社会做贡献、为用户做服务的经营理念，致力向社会和用户提供满意的产品和服务。深圳鱼亮科技有限公司注重以人为本、团队合作的企业文化，通过保证智能家居，语音识别算法，机器人交互系统，降噪产品质量合格，以诚信经营、用户至上、价格合理来服务客户。建立一切以客户需求为前提的工作目标，真诚欢迎新老客户前来洽谈业务。

上一篇：陕西数字ENC降噪介绍

下一篇：浙江识别声学回声消除算法