甘肃数字声学回声介绍

时间:2022年10月23日 来源:

    也能够更清楚地看到这里面可能存在的回授现象。部分工程师在调试远程会议系统时也许遇到过啸叫,那可不一定是本地系统没调好所造成的,你会发现,关掉终端一切非常正常。为什么绝大多数的远程系统没有啸叫呢?这还得感谢您还不算非常质量的网络。我们常说,距离产生延时,而在模拟音频大举转向数字音频、网络音频的,网络信号的延迟也为音频领域赋予了新的现象,尤其应用在远程会议这样的音频传输系统当中,它能将一次次回授剥离成一次次听似回声的现象,这就是网络音频回声。通常由A地发出的声源A在几乎不经过延迟处理的本地系统中,通过A地音箱扩声;而其经过网络终端编码送向远端时,除了考虑A地的上传时间X,还得考虑B地的下载时间Y。在这样一个架构在Internet网络传输环境中的声音,其到达B地扩声音箱出来的信号则是A+X+Y。经B地本地话筒拾取后的该信号,再由B地的上传网速(时间)Z、A地的下载时间W传送回A地扩声音箱,其表现出的信号则会出现一次A信号,及一次赋予了(X+Y+Z+W)时间的A信号。假设A地—B地传输时间总和为200ms,B地—A地传输时间总和为200ms,则信号的一去一回。体现在A扩声音箱中至少会存在A和A+400ms的信号,若反馈信号电平足够强。则再被话筒拾取。

     先对非线性声学回声的特性进行分析。甘肃数字声学回声介绍

甘肃数字声学回声介绍,声学回声

    只需要近端采集信号即可,傲娇的回声消除需要同时输入近端信号与远端参考信号。有同学会问已知了远端参考信号,为什么不能用噪声抑制方法处理呢,直接从频域减掉远端信号的频谱不就可以了吗?行为近端信号s(n),已经混合了近端人声和扬声器播放出来的远端信号,黄色框中已经标出对齐之后的远端信号,其语音表达的内容一致,但是频谱和幅度(明显经过扬声器放大之后声音能量很高)均不一致,意思就是:参考的远端信号与扬声器播放出来的远端信号已经是“貌合神离”了,与降噪的方法相结合也是不错的思路,但是直接套用降噪的方法显然会造成回声残留与双讲部分严重的抑制。接下来,我们来看看WebRTC科学家是怎么做的吧。信号处理流程WebRTCAEC算法包含了延时调整策略,线性回声估计,非线性回声抑制3个部分。回声消除本质上更像是音源分离,我们期望从混合的近端信号中消除不需要的远端信号,保留近端人声发送到远端,但是WebRTC工程师们更倾向于将两个人交流的过程理解为一问一答的交替说话,存在远近端同时连续说话的情况并不多(即保单讲轻双讲)。因此只需要区分远近端说话区域就可以通过一些手段消除绝大多数远端回声。

     甘肃数字声学回声介绍非线性的声学回声消除问题,在实际声学系统里面非常普遍也非常棘手。

甘肃数字声学回声介绍,声学回声

    直达声总是较早到达人耳,这是因为直达声比反射声的声程短。除了直达声以外,反射的声音形成了混响声,使室内声压级增加。15.比较大声压级厅内空场稳态时的比较大声压级。16.传输频率特性厅内各测点处稳态声压级的平均值相对于扩声系统传声器处声压或扩声设备输入端电压的幅频响应。17.传声增益扩声系统达比较高可用增益时,厅内各测点处稳态声压级平均值与扩声系统传声器处声压级的差值。18.比较高可用增益maximumavailablegain歌舞厅扩声系统在声反馈自激临界状态的增益减去6dB时的增益。扩声系统中使用单指向性传声器、频率均衡器能提高扩声系统的传声增益。19.声场不均匀度有扩声时,厅内各测点处得到的稳态声压级的极大值和极小值的差值,以分贝表示。20.总噪声级扩声系统达到比较高可用增益,但无有用声信号输入时,厅内各测点处噪声声压级的平均值。21.声缺陷主要指回声、颤动回声、声聚焦、声染色及声阴影等声学现象。22.声缺陷的消除回声、颤动回声、声聚焦、声染色一般容易发生在大厅中,解决的方法是应用几何声学的有关规律予以消除,而声阴影则多发生于小室,应从波动声学的角度加以考虑,消除音质缺陷。

    

    在这里我将整个回声路径分成了A、B、C、D四个部分。我们一起来看一下,ABCD里面哪一个环节有可能是非线性的?答案应该是B。也就是回声路径里面的功率放大器和喇叭,具体的原因稍后会做详细分析。接下来我想再解释一下为什么A、C、D它们不是非线性的。首先这里的A和D比较好判断,他们都属于线性时不变系统。比较难判断的是C,因为在一些比较复杂的场景下,声学回声往往会经过多个不同路径的多次反射之后到达接收端,同时会带有很强的混响,甚至在更极端情况下,喇叭与麦克风之间还会产生相对位移变化,导致回声路径也会随时间快速变化。这么多因素叠加在一起,往往会导致回声消除算法的性能急剧退化,甚至完全失效。有同学可能会问,难道这么复杂的情况,不是非线性的吗?我认为C应该是一个线性时变的声学系统,因为我们区分线性跟非线性的主要依据是叠加原理,前面提到的这些复杂场景,它们依然是满足叠加原理的,所以C是线性系统。这里还要再补充一点,细心的朋友会发现B里面有一个功率放大器,同时在C里面也有一个功率放大器,为什么经B的功率放大器放大之后,可能带来非线性失真,而C的功率放大器不会产生非线性失真呢?二者的主要区别在于B放大之后输出是一个大信号。

    非线性的声学回声消除问题是一个困扰了行业很多年的技术难题。

甘肃数字声学回声介绍,声学回声

    26.声聚焦指凹面对声波形成集中反射、使反射声聚集于某个区域,造成声音在该区域特别响的现象。声聚集造成声能过分集中,使声能汇聚点的声音嘈杂,而其他区域听音条件变差,扩大了声场不均匀度,严重影响听众的听音条件。27.声影区由于障碍物或折射的原因,产生声音辐射不到的区域。在声影区内声压级很低,音量很轻。因此声影区的存在也是声压不均匀的原因。28.声染色由于室内频率响应的变化,使原始声音被赋予外加的音色特点。容积小的听音室,本征频率在低频端分布不够密集连续,因此在低频段易产生“共振”的音染现象。共振现象产生的声染色效应,引起声音信号的失真,产生主观听感上的厌恶情绪,严重影响听音效果。29.声闸(声锁)两道门之间保留较大的间距做成通常所称的“门斗”,并对其内表面做强吸声处理,以提高隔声效果,此“门斗”称为声闸(声锁).30.声桥材料直接固定在龙骨上时,受声一侧板的振动会通过龙骨传到另一侧板,这种象桥一样传递声能的现象被称为声桥。31.浮筑结构(房中房)通常只有外部环境很差或声学环境要求较高的情况下才会考虑浮筑结构,即在原房间中再建一个房间(即内套和外套)。分轻质和重质两种。内套和外套之间设置弹性垫层。

    回声消除AEC(AcousticEchoCancellation)一般指的是声学回声消除,其主要用于抑制产品本身发出的声音。甘肃数字声学回声介绍

我们把声学回声消除这个技术变成一张实体的插件(设备插卡)。甘肃数字声学回声介绍

    首先是优化准则。NLMS算法是基于小均方误差准则,而双耦合算法是基于小平均短时累计误差准则,所以他们的优化准则是不一样的。第二个就是理论的比较好解,NLMS算法具有Wiener-Hopf方程解,而双耦合算法的线性滤波器也具有Wiener-Hopf方程解,非线性滤波器具有小二乘解。第三个维度就是运算量,NLMS运算量是O(M),M是滤波器的阶数,而双耦合算法运算量后面会多一个O(N2),因为他有两个滤波器,N是非线性滤波器的阶数,这里的平方是因为小二乘需要对矩阵进行求逆运算,所以它的运算量比线性的NLMS运算量要大很多。第三个就是控制机制,NLMS算法只有一个滤波器,它的控制主要是通过调整步长来实现的,控制起来要相对简单。而双耦合算法需要对两套滤波器进行耦合控制,控制的复杂度要高很多。实验结果分析,这里我主要是分了两个实验场景比较双耦合算法和NLMS算法的性能,个是单讲测试场景,第二个就是双讲测试场景。首先看一下单讲测试场景,个示例是针对强非线性失真的情况,左边分别原信号的语谱,NLMS算法进行回声消除之后的语谱、双耦合算法的语谱。颜色越深,能量越大。右边这个的是回声抑制比,值越大越好,红色的曲线是双耦合算法的回声抑制比。

    甘肃数字声学回声介绍

深圳鱼亮科技有限公司在同行业领域中,一直处在一个不断锐意进取,不断制造创新的市场高度,多年以来致力于发展富有创新价值理念的产品标准,在广东省等地区的通信产品中始终保持良好的商业口碑,成绩让我们喜悦,但不会让我们止步,残酷的市场磨炼了我们坚强不屈的意志,和谐温馨的工作环境,富有营养的公司土壤滋养着我们不断开拓创新,勇于进取的无限潜力,深圳鱼亮科技供应携手大家一起走向共同辉煌的未来,回首过去,我们不会因为取得了一点点成绩而沾沾自喜,相反的是面对竞争越来越激烈的市场氛围,我们更要明确自己的不足,做好迎接新挑战的准备,要不畏困难,激流勇进,以一个更崭新的精神面貌迎接大家,共同走向辉煌回来!

信息来源于互联网 本站不为信息真实性负责