用户登录  |  用户注册
首 页商业源码原创产品编程论坛
当前位置:PB创新网文章中心编程技巧计算机应用

MPEG-4技术及应用综述

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-01-10 11:56:12
主页上的一份MPEG-4应用文档描述了很多最终用户应用,包括交互式多媒体广播和移动通信。
  对所有相关方面,MPEG力求避免大量的所有权、非交错格式和播放器的使用。为实现以上目标,MPEG-4提供标准化方式来:
  1. 代表语音、视觉或语音视觉内容的单元,称为"媒体对象"。这些媒体对象可能来自自然或合成源;这就是说他们能够被相机或话筒所记录,或者由计算机产生;
  2. 描述这些对象的组合以创建构成语音视频屏幕的组合媒体对象;
  3. 复用和同步与媒体对象相关的数据,这样他们能在提供了适于特殊媒体对象特性的QoS的网络通道上传输;而且
  4. 与接收端产生的语音视频景象交互。
2.2.1 媒体对象的编码表示

  MPEG-4 语音视频场景由一些媒体对象组成,以分层方式组织起来。在这层次结构中,我们找到了基本的媒体对象,例如:
  * 静态图象(例如固定背景)
  * 视频对象(例如正在说话的人-没有背景)
  * 语音对象(例如和这个人相关的声音)
  MPEG-4把这样大量的能够表现2-D或3-D自然和合成内容类型的基本媒体对象标准化。附加在上面提到的、除媒体对象之外,MPEG-4定义了如下对象的编码表示法,
  * 文本和图形;
  * 文本和图形;
  * 用来合成语言和运动头部的正在讲话的合成的头部和相关的文本;
  * 合成的声音
  编码形式的媒体对象是由在语音视频景象中处理该对象的描述元素和相关流数据组成。重要的是在编码形式下每个媒体对象都能独立与它的环境或背景独立表现。考虑到要求的功能,这种媒体对象的编码表示法是尽可能的高效的。这些功能包括差错鲁棒性、易释性和可编辑性。

2.2.2 媒体对象的组合

  基本媒体对象相应于描述树中的叶子,而组合媒体对象包含了整个子树。例如:相应于正在说话的人的视频对象和相应的声音捆绑在一起形成一个新的组合媒体对象,包含了那个人的语音和视频部分。
  * 这样的组成允许作者构建复杂的景象,使客户能处理有意义的对象。
  * 更普遍地,MPEG-4提供了一种描述景象的标准化方式,例如允许:
  * 在给定坐标系内随处放置媒体对象;
  * 应用变换来改变媒体对象的几何和声学表现;
  * 整合基本媒体对象以形成组合媒体对象;
  * 应用流数据于媒体对象以更改属性(例如声音,属于某对象的移动中的文本,驱动合成面孔的动态参数成面孔的动态参数;
  * 交互式地改变用户在景象中的任何视听点。
景象描述是建立在来自于对象合成结点的结构和功能意义上的虚拟现实(VRML)的一些基本概念而且扩展为完全实现上述特点。

2.2.3 媒体对象流数据的描述和同步

  一个MPEG-4影音场景的例子媒体对象可能需要在一个或多个基本流中传输的流数据。对象描述符把与媒体对象相关的所有流中区分开来。这就允许处理分层编码数据、内容变化信息的联系(称?quot;对象内容信息")和相关的知识产权。每个流自身由一套配置信息的描述符所区别,例如用来决定需要编码源和编码的时间信息精度。而且描述符可以携带传输需要的QoS的线索(例如最大位速率、位差错速率、优先级等)。基本流的同步是通过基本流内单个访问单元的时标实现的。同步层管碚庋姆梦实ピ褪北甑氖侗稹6懒⒂诿教謇嘈椭猓貌阍市硎侗鸪龇梦实ピ睦嘈突指疵教宥韵蠡蚓跋竺枋龅氖被夷茉谄浼涫迪滞健8貌愕挠锓ǹ梢远嘀址绞脚渲茫市碓谛矶嘞低持惺褂谩?

2.2.4 流数据的传输

  在不同QoS的网络中从源到目的的流信息的同步传输,是由上述的同步层和包含两子层的复合传输层确定的。第一个复用层根据MPEG-4标准的Part6中的DMIF规范进行管理。这种复用可在MPEG定义的FlexMux工具中体现,该工具允许以低复用费用组合基本流(ESS)。例如该层的复用可用来组合相似QoS需求的基本流,减少网络连接数或者端-端延迟,TransMux(传输复用)层搭建了提供匹配需求QoS的传输服务的层。MPEG-4仅确定了该层的接口而具体的数据包和控制信号的规划必须与各传输协议上有权的实体进行协商。任何现存的合适的传输协议栈,例如(RTP)/UDP/IP、(AAL5)/ATM或者MPEG-2在适合链路层上的传输流都可能成为TransMux的实例。选择权留给了最终用户和服务提供商,而允许MPEG-4用于广泛的运行环境中。
  FlexMux复用工具的使用是可选的,如果下层的TransMux实例提供了所有要求的功能,该层必须为空。而同步层总是存在的。以下是可行的:
  1. 识别访问单元,传输时标和时钟参考信息以及检测数据丢失;
  2. 传输控制信息以实现:
  * 为每个基本流和FlexMux流指示需要的QoS;
  * 翻译这样的QoS需求为实际网络资源;
  * 连接基本流到媒体对象;
  * 转换基本流的映射为FlexMux和TransMux通道。
  部分控制功能在和DMIF框架这样的传输控制实体联结后才可实现。

2.2.5 与媒体对象交互

  总体来说用户看到的是依据作者设计组合而成的影象。然而,用户和影象交互的可能性依赖于作者所允许的自由度。用户可能被允许进行的操作包括:
  * 改变景象的视/听

上一页  [1] [2] [3] [4] [5] [6]  下一页

Tags:

作者:佚名

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论
PB创新网ourmis.com】Copyright © 2000-2009 . All Rights Reserved .
页面执行时间:16,390.63000 毫秒
Email:ourmis@126.com QQ:2322888 蜀ICP备05006790号