用户登录  |  用户注册
首 页商业源码原创产品编程论坛
当前位置:PB创新网文章中心解决方案电子通信

用EP7211实现传呼信息实时语音合成和播放

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-01-10 23:57:47
序流程如图1所示。

字符语音库的建立是在Windows平台及Visual C++编程环境下实现的,最终压缩处理后数据量的大小为729 950字节,每个字符语音数据的大小是650字节。

2.2 语音合成

当收到个人传呼信息时,语音合成程序首先从指定位置获取传呼信息数据,然后在语音库中查找每个汉字、阿拉伯数字或者英文字符的发音,重组一个数据文件。解码程序对该文件进行解码并且输出原始语音。语音合成流程如图2所示。

语音合成过程首先是当前字符在语音库的定位。对于10个阿拉伯数字和26个英文字符,将其放在语音库开头。这些字符的查找比较方便。汉字是2字节存储,我们依居其区位码来作为语音库中的定位索引。字符语音检索结束后的语音压缩数据作为该字符解码过程的输入。

数据解码过程可以分为参数解码和重构信号后处理2部分。首先要从输入的数据中提取参数符号,对这些符号解码之后,可以获得相应于10ms话音帧的编码器参数。这些参数包括线性预测系数、自适应码本矢量、固定码本矢量以及它们的增益。解码之后的参数用来计算重建语音信号。得到重构语音信号只有通过后处理过程来对该信号进行放大,包括后向滤波、高通滤波以及按比例因子扩大,最后得到原始的语音数据。

字符解码器原理如图3所示。

2.3 PDA系统的体系结构

PDA系统中嵌入式处理器EP7211进行数据处理,传呼解码芯接收传呼信息并进行解码,LCD提供数据输出显示,触摸屏提供用户输入接口,Flash用来存储应用程序和数据,SRAM为程序运行提供内存空间,电源电路为嵌入式处理器和外围设备提供所需要工作电压。
javascript:window.open(this.src);" style="cursor:pointer;"/>
    嵌入式处理器EP7211是Cirrus Logic公司专门为低成本、超低功耗的嵌入式应用设计的,包含ARM7TDMI处理器内核和丰富的外围接口。外围接口有CODEC音频接口、SPI串行A/D接口、单色LCD接口、DRAM接口、红外接口、2个PWM接口、实时时钟RTC以及电源检测接口。EP7211的内核电路工作在2.5V,而外围电路工作在3.3V;可根据具体情况对内核的时钟进行动态编程控制,可工作在18、36、49和74MHz。另外EP7211还有3种基本供电模式:正常操作(operating)、空闲(idle)和等待(standby)。在等待模式,主时钟被关断,整个CPU及相关外围(除中断和RTC)也关断,但可通过中断或按钮来唤醒。

系统软件开发平台采用了我们自主开发研制的、专门面向嵌入式应用系统开发的XGW平台。XGW开发平台采用消息驱动机制,是C语言开发。它功能强大、模块化设计、扩展性强、产品升级容易,总体框架如图5所示。

图5全面反应了XGW开发平台的体系结构,包括事件消息驱动机制、内存管理、字符和图形显示输出、图形组件库等。图形组件库中的编辑框、列表框、按钮等为用户应用程序开发提供系统应用编程接口API。不过,XGW平台对于系统硬件的中断响应没有提供统一的入口和出口,需要开发人员单独处理。XGW开发平台的消息分为鼠标消息、键盘消息和定时器消息等3类。

2.4 语音中断服务例程

嵌入式处理EP7211本身提供的外设语音录放Codec(coder/decoder)芯片可以实现语音的录入和播放功能。该模块提供2个独立的16字节长的数据发送和接缓冲区(FIFO),其为全双工模式,数字据点发速率是64kbps。芯片自身提供工作时钟、定时脉冲以及数据串/并和并/串转换功能。编程人员通过设置EP7211相应的控制寄存器使能这些项功能,则每当数据收发缓冲区半慢或者半空时(8字节),芯片自身就会产生一次中断信号供外部处理。理论计算芯片中断速率是1ms/次。javascript:window.open(this.src);" style="cursor:pointer;"/>

语音播放中断服务例程主要完成的工作是,当产生语音中断时,仍然有数据需要播放,则向语音数据发送缓冲区FIFO中写入指定数据,剩下的工作由Codec芯片本身来完成。中断服务例程ISR的伪代码如下(因为具体实现代码没有通用性,故此处用伪码描述):

void IRQ_Codec_Handler(void)

{

while(检测系统状态寄存器,发现语音芯片数据发送缓冲区FIFO非满)

{

if(已经播放过的语音数据长度<给定的需要播放的语音数据长度)

{

向语音芯片发送数据缓冲区FIFO写入指定数据;

调整已经播放过的语音数据长度;

if(已经播放过的语音数据长度>=给定的需要播放的语音数据长度)//结束

{

禁止数据发送缓冲区中断;

复位各相关的全局变量;

程序返回;

}

}

else

{

向语音芯片发送数据缓冲区FIFO写入默认数据

0XFF;

}

}

}javascript:window.open(this.src);" style="cursor:pointer;"/>

3 试验结构和分析

由于在设计阶段充分考虑过语音合成算法的大运算量和系统的实时性要求,故我们在具体实现的时候也采取了一些措施,比较突出的有:用ARM汇编语言来实现关键性的函数代码;语音合成时提高处理器EP7211的工作频率(处理器正常工作频率是18MHz);对于一些常用的三角函数计算,采用查表的方式等来加快程序执行速度。在PDA样机测试中,单字符合成时间在650ms左右,基本上能够满足实际应用需求。数据语音库经过处理之后,占用了729 560字节也能够满足本PDA系统的存储的要求。

当PDA系统收到1条个人传呼信息时,在语音库的支持下,立刻启动语音合成算法,逐个进行字符语音合成。当第1个字节语音合成结束后,立刻启动语音中断服务例程进行语音播放。这样收到的个人传呼信息,前台逐个字符解码时,其后台语音播放也在进行。根据实际测试参数,基本上满足了系统的实时性要求。

从一定角度看,单字符650 ms的语音合成时间基本能够满足实际应用需要,但还是希望能够进一步减小这个值。这由于我们对ARM算是器的使用还处在研究阶段。ARM本身提供了16位的Thumb指令集和32位的ARM指令集,而且两者在某些方面表现出较大差别。一般来讲,Thumb代码长度是ARM代码长度的65%,而执行效率要经后者高出60%。但在某些方面,32位ARM指令集也会表现出其优于16位Thumb指令集的强大功能;同时该处理器系统支持ARM指令庥和Thumb指令集混合编程模式。随着对二者差别和各自优势的深入理解,结合本系统的硬件体系结构,采用有效的指令集混合编程模式将会使程序执行效率进一步提高,从而使实时性得到进一步加强。



上一页  [1] [2] 

Tags:

作者:佚名

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论
PB创新网ourmis.com】Copyright © 2000-2009 . All Rights Reserved .
页面执行时间:17,531.25000 毫秒
Email:ourmis@126.com QQ:2322888 蜀ICP备05006790号