广东商显声学回声喇叭抑制算法

时间：2022年08月17日来源：

什么是非线性声学回声？，什么是非线性的声学回声？这里我给出了一张图，的是声学回声的路径图，图的左边对应的是发射端，右边对应的是接收端。我们发出的信号首先要经过D/A变换，从数字域变换到模拟域，然后再经过功率放大器，放大之后驱动喇叭，这样就会发出声音。发出来的声音经过空气信道传播之后，到了接收端被麦克风采集到，然后再次经过功率放大器，再通过A/D变换，从模拟域又变回到数字域。那么这里的y[k]就是我们收到的回声信号。，我们接收到的回声y[k]到底是线性回声还是非线性回声呢？或者说我们应该怎么去判断它？我觉得要解决这个问题，就是要认识清楚这里面的每一个环节，看看它们到底是线性系统还是非线性系统，如果所有的环节都是线性的话，那么很自然y[k]就是一个线性的回声，否则只要有一个环节是非线性的，那么这个回声就是非线性回声。非线性的声学回声消除问题，在实际声学系统里面非常普遍也非常棘手。广东商显声学回声喇叭抑制算法

需要注意的是，如果index在滤波器阶数两端疯狂试探，只能说明当前给到线性部分的远近端延时较小或过大，此时滤波器效果是不稳定的，需要借助固定延时调整或大延时调整使index处于一个比较理想的位置。线性部分算法是可以看作是一个固定步长的NLMS算法，具体细节大家可以结合源码走读，本节重点讲解线型滤波在整个框架中的作用。从个人理解来看，线性部分的目的就是很大程度的消除线性回声，为远近端帧判别的时候，很大程度地保证了信号之间的相干值(0~1之间，值越大相干性越大)的可靠性。我们记消除线性回声之后的信号为估计的回声信号e(n)，e(n)=s(n)+y''(n)+v(n)，其中y''(n)为非线性回声信号，记y'(n)为线性回声，y(n)=y'(n)+y''(n)。相干性的计算（Matlab代码）,两个实验（1）计算近端信号d(n)与远端参考信号x(n)的相关性cohdx，理论上远端回声信号的相干性应该更接近0（为了方便后续对比，WebRTC做了反向处理:1-cohdx），如图5(a)，行为计算近端信号d(n)，第二行为远端参考信号x(n)，第三行为二者相干性曲线:1-cohdx，会发现回声部分相干值有明显起伏，比较大值有，近端部分整体接近，但是有持续波动，如果想通过一条固定的门限去区分远近端帧，会存在不同程度的误判。

广东商显声学回声喇叭抑制算法回声消除AEC（AcousticEchoCancellation）一般指的是声学回声消除，其主要用于抑制产品本身发出的声音。

运用声学处理来控制回声和混响,当有某个房间或建造一个录音棚时，如出现下述问题，就需要进行声学处理：（1）在墙边拍一下手，然后可听到颤动回声。这是由于声音在硬的平行墙面之间的来回撞击而产生的。（2）录音棚有非常活跃的环境，诸如像一个车库或是混凝土结构的地下室之类，可以听到很多的房间混响。（3）录音棚体积很小。（4）从录音作品中可以听到外界的噪声。（5）低音吉他放大器和音箱的声音有隆隆声。（6）缺乏在数英尺之外作不拾取噪声或不拾取过量房间混响的拾音的自由度。（7）在传声器信号中可听到大量的泄漏声。一些泄漏的例子，如吉他传声器拾取了鼓声，或是由于铙镲传声器拾取了电吉他的声音。如果有上述情况出现，则可按如下的建议来改善录音室的声学状况。混响和回声是由于房间表面的声音反射引起的，因此，强吸声的表面会有助于化解这些问题。高频吸收如要吸收高频，可使用诸如多孔的褶皱（凹凸不平的）的泡沫垫材料。这些材料是高可燃性的，所以，要作阻燃处理。把它们钉住或粘贴在墙面上，或者把它们固定在框架上。从效果上看，使用厚的泡沫材料要比薄的好。装在墙上的，这取决于声音撞击到泡沫材料上的角度。在泡沫材料嵌板之间要留有一些空隙。

反映到听感上就是回声（远端判断成近端）或丢字（近端判断为远端）。（2）计算近端信号d(n)与估计的回声信号e(n)的相干性，如图5(b)，第二行为估计的回声信号e(n)，第三行为二者相干性cohde，很明显近端的部分几乎全部逼近，WebRTC用比较严格的门限（>=）即可将区分绝大部分近端帧，且误判的概率比较小，WebRTC工程师设置如此严格的门限想必是宁可一部分双讲效果，也不愿意接受回声残留。从图5可以体会到，线性滤波之后可以进一步凸显远端参考信号x(n)与估计的回声信号e(n)的差异，从而提高远近端帧状态的判决的可靠性。存在的问题与改进理想情况下，远端信号从扬声器播放出来没有非线性失真，那么e(n)=s(n)+v(n)，但实际情况下e(n)与d(n)很像，只是远端区域有一些幅度上的变化，说明WebRTCAEC线性部分在这个case中表现不佳，如图6(a)从频谱看低频段明显削弱，但中高频部分几乎没变。而利用变步长的双滤波器结构的结果会非常明显，如图6(b)所示无论是时域波形和频谱与近端信号x(n)都有很大差异，目前aec3和speex中都采用这种结构，可见WebRTCAEC中线性部分还有很大的优化空间。如何衡量改进的线性部分效果？这里我们对比了现有的固定步长的NLMS和变步长的NLMS。近端信号d。

回声来自于非预期的泄露，一般分为电学回声和声学回声。

达到，接近于1。黄色曲线，对应的数据具有比较弱的非线性失真，所以在时间T变大了之后，短期相关度逐渐降低，趋于一个相对平稳的值。而红色曲线是我们选的一条具有强非线性失真的数据，为了对这三组数据进行有效对比，我们还给出了一条蓝色曲线，这条曲线是信号与噪声的短时相关度，它在整个时间T范围内都很小。通过这样一组曲线的对比，会得到两个结论，个结论就是我们构建的短时相关度函数，能够相对客观反映这个声学系统的线性度特征，线性度越好，这个值会越大。第二个结论：对于非线性失真很强的系统，其在短时观测窗内（如T<100ms）依然具有较强的相关度，这从红色的曲线可以看出来。也正是基于这样的特征，我们接下来就构建了一种新的误差函数，称之为“短时累积误差函数”。大家可以注意到我们在一个观测时间窗T内，对残差进行了累积。基于这样的误差函数，我们进一步构建了一种新的优化准则，称为“小平均短时累计误差准则”。我们希望通过优化准则的约束，得到的滤波器权系数能够满足两个特性，个特性是滤波器在统计意义上能够达到比较好，即全局比较好，因此我们在目标函数里加入了数学期望运算。同时。

介绍非线性声学回声消除的公开文献也少之又少。湖北语音交互声学回声消除算法

在构建滤波器模型的过程中结合了非线性声学回声的一些特性。广东商显声学回声喇叭抑制算法

WebRTCAEC算法中开辟了可存储250个block大缓冲区，每个block的长度PART_LEN=64个样本点，能够保存的1s的数据，这也是理论上的大延时能够估计的范围，够用了。我们用610ms延时的数据测试(启用大延时调整需要设置delay_agnostic_enabled=1)：我们还是设置默认延时为240ms，刚开始还是调整了-60个block，随后大延时调整接入之后有调整了-88个block，一共调整(60+88)*4=592ms，之后线性滤波器固定index=4，表示剩余延时剩余16ms，符合预期。③线性滤波器延时估计是固定延时调整和大延时调整之后，滤波器对当前远近端延时的直接反馈。前两者调整不当会造成延时过小甚至非因果，或延时过大超出滤波器覆盖能力，导致无法收敛的回声。因此前两者在调整的过程中需要结合滤波器的能力，确保剩余延时在滤波器能够覆盖的范围之内，即使延时小范围抖动，线性部分也能自适应调整。总结与优化方向WebRTCAEC存在的问题：（1）线性部分收敛时间较慢，固定步长的NLMS算法对线性部分回声的估计欠佳；（2）线性部分滤波器阶数默认为32阶，默认覆盖延时132ms，对移动端延时较大设备支持不是很好，大延时检测部分介入较慢。广东商显声学回声喇叭抑制算法

深圳鱼亮科技有限公司是一家有着雄厚实力背景、信誉可靠、励精图治、展望未来、有梦想有目标，有组织有体系的公司，坚持于带领员工在未来的道路上大放光明，携手共画蓝图，在广东省等地区的通信产品行业中积累了大批忠诚的客户粉丝源，也收获了良好的用户口碑，为公司的发展奠定的良好的行业基础，也希望未来公司能成为*****，努力为行业领域的发展奉献出自己的一份力量，我们相信精益求精的工作态度和不断的完善创新理念以及自强不息，斗志昂扬的的企业精神将**深圳鱼亮科技供应和您一起携手步入辉煌，共创佳绩，一直以来，公司贯彻执行科学管理、创新发展、诚实守信的方针，员工精诚努力，协同奋取，以品质、服务来赢得市场，我们一直在路上！

上一篇：江苏录音设备USB声卡降噪

下一篇：福建手机声学回声祛混响算法