用户登录  |  用户注册
首 页商业源码原创产品编程论坛
当前位置:PB创新网文章中心编程技巧计算机理论

实时混音的实现

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-01-10 12:08:12
【本文由PB创新网为您整理】摘要 本文主要讨论多路声音实时混叠的实现方法,以及实现过程中对一些特殊情况的处理。关键词 Wave 混音 混音器

1.引言

  将多个Wave文件或多路Wave数据同时在Wave设备上输出,就可同时听到多个不同的声音,达到混音的效果。如果是将多个不同端点的话音数据经局域网络传输到达某一个端点再经该端点的Wave设备输出,就能同时听到多个人的话音,从而实现局域网络中多方的话音交谈。

  在网络上实现话音交谈,特别强调实时性,要尽量保证话音的平滑、连续,因此为了保证话音数据连续,减少话音数据存储带来的延时,在具体实现中,话音的录制和播放都不采用文件的形式,录制和播放的话音数据都存在缓冲区中。在Windows系统中,一般情况下,高层Wave接口函数无法直接播放缓冲区中的话音数据,而必须用底层函数来实现,常用的是Windows API中的Wave函数。将Wave数据在Wave设备上输出使用的是WaveOutWrite函数,但是该函数不支持多路Wave数据的同时播放,为了能达到多路Wave数据同时播放的效果,对缓冲区中多路Wave数据进行必要的预处理后,再提交给Wave输出设备播放。实现原理如图1所示。

图1 多路Wave混音的实现原理

2.实现原理

  实时地混音,就是将多路Wave数据进行相互叠加处理到另一个目的缓冲区,最终将该目的的缓冲区提交给Wave输出设备。

将每一路Wave数据作为一个单独通道,分别从每个通道取一数据片段,把取得的几个数据片段相互叠加,然后存进另外一个目的缓冲区中。为了便于处理,缓冲区通常采用数组的形式存放Wave数据。

如果话音数据,采用采样频率1025Hz,8位单声道的数据格式,那么一秒的话音数据量为11025个字节。

为了达到实时的效果,目的缓冲区通常都设置比较小,大约可存放1/8秒的话音数据量,对于前述的话音格式,目的缓冲区的大小为11025/8=1375个字节。

下面具体看一下Wave数据以数组形式存放时的混音过程。如图2所示。

图2 多路Wave数据的叠加过程

假设有4路Wave数据,目的缓冲区的大小为1378,混音子函数调用为 Mixer(lpDest,rgpCDdata,4,1378)。

下面给出混音子函数的实现。其中lpDest为目的缓冲区,rgWaveSrc为多路Wave数据源,iNumWaves为Wave数据源的通道数,wLen为目的缓冲区长度。

Void mixit(LPSAMPLE lpDest,LPSAMPLE rgWaveSrc[],intiNumWaves,WORDwLen)

{int,,iSum;

WORD ctr;

ctr=0

While(wLen)

{

iSum=128;/*静音时数值为128*/

for(I=0;I<iNumWaves;I++)

iSum=iSum+*(rgWaveSrc[]+ctr)-128;

PEG(int)0,iSum,(int)225);/*对转换结果处理*/

*lpDest++=iSum;

ctr++;

wLen--;

}

}

注意一点的是对于单声道数据一个字节表示一个采样值,采样值在0-255之间,各个通道的对应Wave数据相加后,就会溢出,还需要将相加结果转换成0-255之间的数值。

  将该目的缓冲区中的Wave数据经WaveOutWrite函数输出,就能同时听到四个不同的声音,当Wave输出设备播放完目的缓冲区中的数据便返回,请求用户提供更多的Wave输出数据,因为Wave输出设备只能输出提交给它的Wave数据;另外,对Wave数据进行混音还需要一定的时间,因此当提交一个目的缓冲区中的数据给Wave输出设备后,就必须马上混叠另一段Wave数据来提交给Wave输出设备,作为下一个输出的数据缓冲区,避免声音输出的中断,后一个目的缓冲区提交后被输出设备放入输出队列中,当第一个目的缓冲区中输出完毕后再输出它的数据,当输出设备在输出第二个目的缓冲区的数据时,又能将第三段数据混合进第一个目的缓冲区中,然后重新提交,直到提交完所有的Wave数据,那时就将停止输出。在实际应用中目的缓冲区的数要多个,一般为3至4个,图3给出了混音、提交的完整过程。

3 混音、提交过程

3.特殊情况的处理

上面讨论了混音及播放的一般过程,但在实际应用中,还需要到对一些特殊情况进行处理。

●各通道中待混音的Wave数据长度不同。

...

图4 各通道中的Wave数据长度不同

这种情况是指当前要混音的某一通道中的声音片段数据比Wave混音器所定义的缓冲区长度要小,这时该路被采样的声音没有足够的数据与Wave混音器中的数据相混叠。

对于这种情况,采用以下的方法可以有效地解决,主要包括三步:

a) Wave混音器在混音前首先判断是否有这种情况出现,如果出现,Wave混音器必须确定该Wave通道中所能被采样的数据长度;

b) 按照该通道所能被采样的数据长度,将该路的数据与其它多个通道中的数据相混叠存入Wave混音器的目的缓冲区中;

c) 停止对该通道Wave数据的采样混叠处理,只采样混叠其它通道中的Wave数据,存入Wave混音器目的缓冲区的余下部分。

因为在接下来的采样混音过程还会出现相同的情况,所以必须重复上述a-c的步骤,直到Wave混音器的缓冲区填充完毕或再没有可填充的数据为止。这时将该Wave混音器的目的缓冲区提交给Wave输出设备。

●当播放混音数据时又有新的一路Wave数据要求混叠并且被播放。

当前正在播放Wave混音器中一个已经混叠的目的缓冲区中Wa

[1] [2]  下一页

Tags:

作者:佚名

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论

相关文章

PB创新网ourmis.com】Copyright © 2000-2009 . All Rights Reserved .
页面执行时间:31,671.88000 毫秒
Email:ourmis@126.com QQ:2322888 蜀ICP备05006790号