高保真实时准动态图像采集压缩和远程传输平台的研究与实现
摘要:基于大量的实际研究工作,论述了高保真实时准动态图像采集压缩和远程传输平台的设计思想、总体结构、关键技术和优化策略。着重对视频采集技术、压缩技术、图像实时传输技术、同步技术和自适应技术作了具体阐述。在相关技术领域有重要的学术价值和实际意义。
关键词:高保真 自适应 帧间压缩 双向调节
在Internet飞速发展和广泛普及的今天,信息传输从两方面加强力度:一是多媒体化;二是实时化。在此基础上,高保真准动态图像采集、压缩和远程传输技术成为许多先进国家计算机领域的重要研究课题。在军事上,战场信息已经不只是文字类型,而需要为决策者提供高质量的动态实时图像信息,以便及时准确地了解战场真实情况;另外,对国外新式战斗机、导弹等先进武器和装备,也不只是从文字上了解散其功能、从静态图片上了解其形状,而是要解其在实战中的具体功能、实际威力以及真实效果,使决策者和科技人员获得动态和感性的认识,有身临其境之感。在工业上,需要对一些多变的、有毒的、人类不宜久留的场合进行监测。在医疗上,则需要一些高级专家对异地的病人进行诊断和治疗……这些都是基于高保真实时准动态图像采集压缩和远程传输技术的综合实现。本文结合课题组长期的研究阐述其主要技术及其优化策略。
1 系统设计思想
本系统的设计目标是基于Internet实现远程部点之间的高保真准动态图像的实时传输。整个系统贯彻如下设计思想:发送站点和接收站点都具对图像质量的控制功能,以适应Internet传输率不稳定的情况;对图像采用多种类型的压缩技术,以适应不同的图像分辨率和环境要求;在Internet信道传输率较差时,能够启动自适应功能。
2 系统总体结构
在物理上,本系统分为发送站点和接收站点两部分。在逻辑上,本系统分为图像采集、压缩和传输子系统、性能控制子系统。整个系统包含如下六个独立的功能模块,如图1所示。
(1)图像采集、压缩和传输子系统
·图像采集模块,发送站点从摄像机读原始视频流,按一定的格式存储为视频数据。
·图像压缩模块,发送站点将视频数据压缩,javascript:window.open(this.src);" style="cursor:pointer;"/>为网络传输作准备。
·视频传输模块,利用RTP和UDP协议将压缩后的视频数据发送到远程站点。
·视频解压缩模块,接收站点将接收到的压缩数据用解压缩算法还原成视频数据。
(2)性能控制子系统
·客户/服务器同步模块,使发送站点和远程接收站点在视频格式和设置方面保持一致。
·自适应模块,在信道传输率较差时,能自动启动自适应功能,使系统的视频传输适应复杂的网络情况。
3 系统设计中的关键技术和优化策略
3.1 视频采集技术分析和选择
为了实时视频采集,需要安装相应的视频采集设备。即视频采集卡和摄像头等。并需要安装相应的驱动软件来支持这些设备的运行。
Windows2000操作系统提供了VFW(Video for Windows SDK)。VFW包含了大量与视频采集有关的编程接口。这些编程接口通过操作系统提供的VFW-to-WDM Voide Capture Mapper调用设备驱动程序中的相关例程,为系统的图像采集提供了底层接口编程基础。
本系统用到最主要的编程调用有如下几个:
CapCreateCaptureWindow,创建一个视频采集窗口;
CapCriverConnect,连接视频采集设备驱动程序;
CapSetVideoFormat,设定视频格式;
CapDlgVideoFormat,设置对话框。
VFW提供了两种视频采集模式:Preview(简称P模式)和Overlay(简称O模式)。笔者在系统设计中通过实验和测试比较了这两种模式。
·P模式占用较多的系统资源。在这种模式中,硬件将采集的视频帧传送到系统内存中,然后在视频采集窗口用Windows GDI函数进行显示;而O模式下,视频采集子系统直接通过硬件方法显示视频,相对来说节省内存,且速度较快。
·O模式稳定性较好,但也要求电源性能较好。在直流电源性能较好情况下,采用Overlay模式进行视频采集。
实际运行过程表明,上述分析是正确的。本系统设计中采用了Overlay模式。这一选择对稳定性起到了较好的优化作用。
3.2 视频压缩、解压缩技术的优先和优化
针对视频应用中可能遇到的各种情况,本系统的压缩、解压缩模块设计采用三种压缩方案,使用时可以从中选择一种,以适应不同环境和不同需求。
一是国际通用的高压缩进比方案H.263,该方案压缩比高,但图像质量较差,适用于网络传输性能较差的情况,该方案大体符合现场图像的处理要求。二是图像压缩质量最好、算法最先进的MPEG-4方案,该方案图像质量好,便压缩比较低,适用于网络传输性能良好的情况。三是在H.263的基础上作为较大幅度修改和优化的TH.263方案,该方案在压缩比与H.263相近的情况下,图像质量有明显改善。
TH.263方案是在对H.263深入分析基础上实施的。通过分析H.263的整个系统程序,得以其设计思想如下:首先将采集到的原始图像划分成8×8的宏块,然后判断此帧是不是关键帧。如果是关键帧,则对每个宏块作DCT(Discrete Cosine Transform)变换,对变换后的视频数据采集视觉能够接受的量化比量化,量化后许多高频分量将变成零,为了最大限度提高压缩编码效果,采用Z形扫描技