语音信号的数字化噪声抑制技术
摘要:介绍了语音信号的数字化噪声抑制技术。该技术通过PCM编码对模拟语音信号数字化,再以CPLD器件进行数字化噪声抑制处理,然后解码为语音输出,从而得到优良的语音噪声抑制效果,并可通过软件调节噪声抑制参数。还以应用实例介绍了电路原理,说明了设计要点。
关键词:噪声抑制 阈值 延时时间 PCM编解码 CPLD器件
语音信号的噪声抑制技术是基于人耳的声音屏蔽效应的,即当有较强的声音信号时,较小的噪声信号将被屏蔽而不易被听到。
在具有噪声抑制功能的语音通信设备中,没有语音信号时噪声抑制电路将信道关闭,使噪声信号不能到达语音终端,避免了噪声出现;语音信号来到时,噪声抑制电路自动打开信道,这时虽然噪声语音一起送到语音终端,但由于声音屏蔽效应,噪声的存在可以忽略。
模式式的噪声抑制电路直接对语音模拟信号进行处理,通常主要由取样放大器、模拟比较器、模拟开关、阻容延时器件等组成。因其集成度低、参数调整困难、设定的噪声抑制参数易受环境因素影响而漂移,使得噪声抑制性能难以得到保证。
在为某国孙工程研制新一代语音指挥通信设备时,为了避免模拟式噪声抑制技术的缺点,采用了数字化的噪声抑制技术。这一技术,是在对模拟语音信号进行PCM编码后,再用CPLD(复杂可编程逻辑器件)对PCM码流进行数字化噪声抑制处理,然后将PCM信号解码还原为模拟语音信号。结果,不仅获得了优良的噪声抑制效果,而且能够用软件调节噪声抑制参数,设备的集成主和稳定性都有显著提高。
javascript:window.open(this.src);" style="cursor:pointer;"/>
1 噪声抑制电路的主要技术参数
噪声抑制电路的主要技术参数为:噪声抑制阈值、前道时时间、后延时时间。
噪声抑制阀值是指打开语音信道的门限电平值。在阈值之下的信号认为是噪声,关闭语音信道;在阈值之上的信号则认为是语音,打开语音信道。这一阈值可根据环境噪声的大小、外来干扰的严重程度及语音信号的幅度而进行设置。例如,当语音信噪比为30dB时,噪声抑制阈值可设为32mV左右。
由于语音和噪声两种信号并不总是能够完全区分开的,因此在信号幅度超过噪声抑制阈值或回落到阈值之下时,需要分别进行延时和后延时。
前延时时间是指语音信号在超过阈值后到语音信道打开的延时时间。这一时间太长将造成语音的起始音素被切除(称为“头切”),是不能允许的。但这一时间又不能太短,太短的话任何幅度超过噪声抑制阈值的突发的短暂干扰都会立刻打开语音通道并将这干扰送到语音终端,破坏静音效果。为尽可能地吸收这类干扰又不至于造成“头切”,根据语音声学特征的有关统计资料与经验数值,前延时时间可在0.5~4ms之间选择。
后延时时间是指在噪声抑制门限被打开并自己传送语音时,从语音信号幅度回落至噪声抑制阈值之下到语音信道关闭的延时时间。由于语音信号波形的动态范围很大,讲话时又随着语气的变化而起伏停顿,因此后延时时间太短会造成语音的断续,影响语音传送质量。后延时时间太长,则造成语音停顿时噪声拖尾,同样影响语音质量。为兼顾这两方面,后延时时间的量值范围约为0.05~0.5s左右。
由于语音特点因人而异,环境噪声和外界干扰情况又常有不同,所以上述的噪声抑制三参数经常需要在语音通信的过程中进行调节。在使用模拟噪声抑制电路时,这些参数是用电位器或开关来调节的。在使用模拟噪声抑制电路时,这些参数是用电位器或开关来调节的。采用数字化噪声抑制技术后,通过软件就可以设定和调节这些参数了。
javascript:window.open(this.src);" style="cursor:pointer;"/>
2 语音信号的数字化
采用数字化噪声抑制技术,必须先将语音信号数字化。模拟语音信号的数字化有多种方法,最通用的是按照G.711标准进行PCM编码[1]。对于频带为300~3400Hz的语音信号,采用2.048MHz的取样时钟,以8kHz的速率进行8位取样,取样数据按A律编码,偶数位交替反转。多路语音信号可以分配不同的取样时隙,32个时隙(125μs)组成一帧。
PCM编解码芯片选用National Semiconductor公司的TP3094[2]。该芯片为44引脚PLCC封装,单一5V供电,集成了四路PCM编解码电路,压扩方式为A/μ律可选,片内自带电压基准、低通接收滤波器和带通发送滤波器,通过外接电阻可以调节输入信号的增益。
TP3094可采用长帧和短帧两种同步方式,外接帧信号和2.048MHz的时钟即可工作。TP3094在进行PCM编解码时的工作方式有8bit和32bit两种,以8bit方式工作时需为每路语音的PCM码提供单独的帧同步信号,而以32bit方式工作时只要为第一个时隙提供短帧同步信号即可自动完成对其后连续的另三路PCM语音编码同步。在以32bit方式作时,还可以采用多片TP3094芯片级联工作。
图1所示为两片TP30094级联成为八路PCM语音编解码电路。图中TP3094的VCI0~VXI3为四种语音输入端,GXO0~GXO3为各路的增益调节端,在VXI和GXO之间接一电阻,此电阻与VXI端至信号源间的电阻比值可决定该路语音信号的输入增益。VRO0~VRO3为解码后的四路模拟语音信号输出端。电容C1、C2用于滤波。外接的2.048MHz主时钟脉冲冲送到两片TP3094的MCLK端,8kHz的帧信号F0(由CPLD产生)送到第一片TP3094的FSX0和FSR0端,再将第一片TP3094的FSX和FSR1分别连到第二片TP3094的FSX0和FSR0端,就完成了两片芯片的级联。两片以上的级联亦可由此类推。为避免数字信号对模拟信号的干扰,电路中数字部分和模拟部分的供电分别布线后再接到单一5伏电源。
两片TP3094的PCM信号输出端DX并联后送到数字噪声抑制电路,经数字噪声抑制电路处理后的PCM信号再送回两片TP3094的输入端DR进行解码。TSX0、TSX1是开路沟道输出端,R1、R2为上拉电阻。在所分配的时隙输出PCM信号时,TSX0、TSX1为低电平,可提供给CPLD作为控制信号。
javascript:window.open(this.src);" style="cursor:pointer;"/>