新一代智能信息技术
研发、应用专家
服务热线:0755 - 2163 7833

MPEG系列标准及其应用

2014-6-17 15:42:14

  摘要:本文从MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21标准以及它们的应用等方面,介绍了MPEG系列标准及其应用。

  随着数字化、网络化、全球一体化信息时代的来临,多媒体技术成为信息技术的重要组成部分。它包括声音、图形、数据以及图像在内的多种媒体信息的传送和处理,其关键在于压缩技术。此外,在多媒体的传输、处理、应用中还有许多问题:如何在网络上传输视频?如何通过手机上网并接收视频和图像?如何对多媒体数据进行快速有效的检索?如何对多媒体信息进行统一的存取?等等。

  MPEG是活动图像专家组(Moving Picture Exports Group)英文的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已拥有300多名成员,包括IBM、SUN、BBC、NEC、INTEL、AT&&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组织。MPEG组织制定的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。

  一、MPEG-1标准及其应用

  MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分:

  第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。

  该标准从颁布的那一刻起,MPEG-1取得一连串的成功,如VCD和MP3的大量使用,Windows95以后的版本都带有一个MPEG-1软件解码器,可携式MPEG-1摄像机等等。

  二、MPEG-2标准及其应用

  MPEG组织于1994年推出MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率从每秒3兆比特~100兆比特,标准的正式规范在ISO/IEC13818中。MPEG-2不是MPEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。MPEG-2还专门规定了多路节目的复分接方式。MPEG-2标准目前分为9个部分,统称为ISO/IEC13818国际标准。

  MPEG-2图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。一帧图像内的任何一个场景都是由若干像素点构成的,因此一个像素通常与它周围的某些像素在亮度和色度上存在一定的关系,这种关系叫作空间相关性;一个节目中的一个情节常常由若干帧连续图像组成的图像序列构成,一个图像序列中前后帧图像间也存在一定的关系,这种关系叫作时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。

  MPEG-2的编码图像被分为三类,分别称为I帧,P帧和B帧。

  I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。I帧使用帧内压缩,不使用运动补偿,由于I帧不依赖其它帧,所以是随机存取的入点,同时是解码的基准帧。I帧主要用于接收机的初始化和信道的获取,以及节目的切换和插入,I帧图像的压缩倍数相对较低。I帧图像是周期性出现在图像序列中的,出现频率可由编码器选择。

  P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。

  P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。

  MPEG-2的编码码流分为六个层次。为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。MPEG-2标准的主要应用如下:

  1、视音频资料的保存

  2、非线性编辑系统及非线性编辑网络

  3、卫星传输

  4、电视节目的播出

  三、MPEG-4标准及其应用

  运动图像专家组MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。

  MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用(影音合成内容)、交互式多媒体(WWW、资料撷取与分散)等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。

  MPEG-4的编码理念是:MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。例如,我们可以将一个卡通人物放在真实的场景中,或者将真人置于一个虚拟的演播室里,还可以在互联网上方便的实现交互,根据自己的需要有选择的组合各种视频音频以及图形文本对象。

  MPEG-4系统的一般框架是:对自然或合成的视听内容的表示;对视听内容数据流的管理,如多点、同步、缓冲管理等;对灵活性的支持和对系统不同部分的配置。

  与MPEG-1、MPEG-2相比,MPEG-4具有如下独特的优点:

  (1)基于内容的交互性

  MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上下载、删除等。利用这些工具,用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象组合起来成为合成的多媒体数据。

  (2)高效的压缩性

  MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等。

  (3)通用的访问性

  MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用,此外,MPEG-4还支持基于内容的的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。

  这些特点无疑会加速多媒体应用的发展,从中受益的应用领域有:因特网多媒体应用;广播电视;交互式视频游戏;实时可视通信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网络等进行的远程数据库业务等。MPEG-4主要应用如下:

  1、应用于因特网视音频广播

  2、应用于无线通信

  3、应用于静止图像压缩

  4、应用于电视电话

  5、应用于计算机图形、动画与仿真

  6、应用于电子游戏

  四、MPEG-7标准及其应用

  MPEG-7标准被称为“多媒体内容描述接口”,为各类多媒体信息提供一种标准化的描述,这种描述将与内容本身有关,允许快速和有效的查询用户感兴趣的资料。它将扩展现有内容识别专用解决方案的有限的能力,特别是它还包括了更多的数据类型。换而言之,MPEG-7规定一个用于描述各种不同类型多媒体信息的描述符的标准集合。该标准于1998年10月提出,于2001年最终完成并公布。

  MPEG-7的目标是支持多种音频和视觉的描述,包括自由文本、N维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述将包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形等。

  MPEG-7的目标是根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求。以视觉内容为例,较低抽象层将包括形状、尺寸、纹理、颜色、运动(轨道)和位置的描述。对于音频的较低抽象层包括音调、调式、音速、音速变化、音响空间位置。最高层将给出语义信息:如“这是一个场景:一个鸭子正躲藏在树后并有一个汽车正在幕后通过。”抽象层与提取特征的方式有关:许多低层特征能以完全自动的方式提取,而高层特征需要更多人的交互作用。MPEG-7还允许依据视觉描述的查询去检索声音数据,反之也一样。

  MPEG-7的目标是支持数据管理的灵活性、数据资源的全球化和互操作性。

  MPEG-7标准化的范围包括:一系列的描述子(描述子是特征的表示法,一个描述子就是定义特征的语法和语义学);一系列的描述结构(详细说明成员之间的结构和语义);一种详细说明描述结构的语言、描述定义语言(DDL);一种或多种编码描述方法。

  MPEG-7由以下几部分组成:

  (1)MPEG-7系统:它保证MPEG-7描述有效传输和存储所必须的工具,并确保内容与描述之间进行同步,这些工具有管理和保护的智能特性;

  (2)MPEG-7描述定义语言:用来定义新的描述结构的语言;

  (3)MPEG-7音频:只涉及音频描述的描述子和描述结构;

  (4)MPEG-7视频:只涉及视频描述的描述子和描述结构;

  (5)MPEG-7属性实体和多媒体描述结构;

  (6)MPEG-7参考软件:实现MPEG-7标准相关成分的软件;

  (7)MPEG-7一致性:测试MPEG-7执行一致性的指导方针和程序。

  在我们的日常生活中,日益庞大的可利用音视频数据需要有效的多媒体系统来存取、交互。这类需求与一些重要的社会和经济问题相关,并且在许多专业和消费应用方面都是急需的,尤其是在网络高度发展的今天,而MPEG-7的最终目的是把网上的多媒体内容变成象现在的文本内容一样,具有可搜索性。这使得大众可以接触到大量的多媒体内容,MPEG-7标准可以支持非常广泛的应用,具体如下:

  (1)音视数据库的存储和检索;

  (2)广播媒体的选择(广播、电视节目);

  (3)因特网上的个性化新闻服务;

  (4)智能多媒体、多媒体编辑;

  (5)教育领域的应用(如数字多媒体图书馆等);

  (6)远程购物;

  (7)社会和文化服务(历史博物馆、艺术走廊等);

  (8)调查服务(人的特征的识别、辩论等);

  (9)遥感;

  (10)监视(交通控制、地面交通等);

  (11)生物医学应用;

  (12)建筑、不动产及内部设计;

  (13)多媒体目录服务(如,黄页、旅游信息、地理信息系统等);

  (14)家庭娱乐(个人的多媒体收集管理系统等)。

  原则上,任何类型的AV(Audio-Video)材料都可以通过任何类型的查询材料来检索,例如,AV材料可以通过视频、音乐、语言等来查询,通过搜索引擎来匹配查询数据和MPEG-7的音视频描述。

  五、MPEG-21标准及其应用

  互联网改变了物质商品交换的商业模式,这就是“电子商务”。新的市场必然带来新的问题:如何获取数字视频、音频以及合成图形等“数字商品”,如何保护多媒体内容的知识产权,如何为用户提供透明的媒体信息服务,如何检索内容,如何保证服务质量等。此外,有许多数字媒体(图片、音乐等)是由用户个人生成、使用的。这些“内容供应者”同商业内容供应商一样关心相同的事情:内容的管理和重定位、各种权利的保护、非授权存取和修改的保护、商业机密与个人隐私的保护等。目前虽然建立了传输和数字媒体消费的基础结构并确定了与此相关的诸多要素,但这些要素、规范之间还没有一个明确的关系描述方法,迫切需要一种结构或框架保证数字媒体消费的简单性,很好地处理“数字类消费”中诸要素之间的关系。MPEG-21就是在这种情况下提出的。

  制定MPEG-21标准的目的是:(1)将不同的协议、标准、技术等有机地融合在一起;(2)制定新的标准;(3)将这些不同的标准集成在一起。MPEG-21标准其实就是一些关键技术的集成,通过这种集成环境就对全球数字媒体资源进行透明和增强管理,实现内容描述、创建、发布、使用、识别、收费管理、产权保护、用户隐私权保护、终端和网络资源抽取、事件报告等功能。

  任何与MPEG-21多媒体框架标准环境交互或使用MPEG-21数字项实体的个人或团体都可以看作是用户。从纯技术角度来看,MPEG-21对于“内容供应商”和“消费者”没有任何区别。标准化是产业化成功的前提,MPEG-1已成功地在中国推动了VCD产业,MPEG-2标准又带动了DVD及数字电视等多种消费电子产业,其它MPEG标准的应用也在实施或开发中,MPEG紧扣应用发展的脉搏,与工业和应用同步。未来是信息化的社会,各种多媒体数据的传输和存储是信息处理的基本问题,因此,可以肯定MPEG系列标准将发挥越来越大的作用。

MPEG视频压缩标准介绍

  视频压缩基本概念

  在过去的几年里,关于视颇压缩的争论己成为-个极其热门的话题,但有趣的是,视频信号的压缩并不是一个新问题。许多人并没有意识到,伴随着1950年彩色电视的引入,视频压缩第一次商品化了。三幅分别显示红,蓝,绿的最高分辨率的图象,共占用15MHZ的总带宽;但被压缩成一路仅占5MHZ的复合信号--3:1的带宽压缩率被引入了。这种方式虽然简单,但毕竟是压缩了。 当然,这种早期的压缩方式是通过模拟技术实现的。今天,更稳定连续的图象质量,更高的压缩率可以通过把模拟信号转换为数字信号,利用一些高度复杂的技术来完成的。这些技术最终带来了更高的压缩效率和更精细的压缩图象处理方法。这些数字技术需要极为强大的计算能力,直到最近在经济上仍然是不可行的。然而,今天,情况有了变化。

  一般地讲,数字视频压缩是从分量视频表达开始的,此时信号是以一个亮度分量,两个色度分量来表达的。最广为接受的数字分量视频格式就是Rccommendation601,该建议使用了"共结点"模型的4:2:2采样结构。所谓"共结点",是指每个彩色象素点由3个采样来描述:一个亮度采样,两个色差形成的色度采样。因为这三个采样在时间上是重合的,所以 称作"共结点"。在525行的系统中,每帧有483个有效行,每行有720个象素点;在625行的系统中,每帧有576个有效行。

  压缩基本上是这样一个过程:通过消除存在于视频信号里的冗余成分,来减少图象或图象组的内容信息。这可以通过分析视频信号的统计预知性来实现。信号的主要部分是有一定的可预知性的。一个极端的例子是正弦波信号,它有高度的可预知性,因为每个周期都是相同的,且只有一个频率,这样就不需占用带宽。另一个极端的例子是,噪声信号完全不可预测。当然,实际上所有的信号都界于这两者之间。压缩技术总的来说就是要识别并去除这些冗余, 从而减少存储量和所需带宽。

  三种MPEG标准的比较

  MPEG-1制定于1992年,它是将视频数据压缩成1~2Mb/s的标准数据流,它对动作不激烈的视频信号可获得较好的图像质量,但当动作激烈时,图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式,因此这种技术不能广泛推广。它主要用于家用VCD,它需要的存储空间比较大,下面的例子可说明这点。

  对于清晰度为352×288的彩色画面,采用25帧/秒,压缩比为50:1时,实时录像一个小时,经计算可知需存储空间为600MB左右,若是8路图像以每天录像10小时,每月30天算,则要求硬盘存储容量为1440GB,则显然是不能被接受的。

  MPEG-2制定于1994年,它是为了力争获得更高的分辨率(720×486),提供广播级视频和CD级的音频,它是高质量视频音频编码标准。传输速率在3~10Mbit/s之间。作为MPEG-1的兼容性扩展,MPEG-2支持隔行扫描视频格式和其它先进功能,可广泛应用在各种速率和各种分辨率的场合。但是MPEG-2标准数据量依然很大,不便存放和传输。

  与前两者不同,MPEG4于1998 年11 月公布,原预计1999 年1月投入使用的国际标准MPEG4不仅是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。MPEG专家组的专家们正在为MPEG-4的制定努力工作。MPEG-4标准主要应用于视像电话(Video Phone),视像电子邮件(Video Email)和电子新闻(Electronic News)等,其传输速率要求较低,在4800-64000bits/sec之间,分辨率为176X144。MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求得最少的数据获得最佳的图象质量。

  与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4是第一个使你由被动变为主动(不再只是观看,允许你加入其中,即有交互性)的动态图象标准;它的另一个特点是其综合性;从根源上说,MPEG-4试图将自然物体与人造物体相溶合(视觉效果意义上的)。MPEG-4的设计目标还有更广的适应性和可扩展性。MPEG4 试图达到两个目标:

  1、低比特率下的多媒体通信;

  2、是多工业的多媒体通信的综合。 据此目标,MPEG4 引入AV 对象(Audio/Visaul Objects), 使得更多的交互操作成为可能。

  MPEG-4的视频质量分辨率比较高,而数据速率相对较低。主要原因在于,MPEG-4采用ACE(高级译码效率)技术,它是一套首次使用于MPEG-4的编码运算规则。与ACE有关的目标定向可以启用很低的数据率。它与MPEG-2相比,可节省90%的储存空间。MPEG-4还可以在声频与视频流中广泛的升级。当视频在5kb/s与10Mb/s之间变化时,声频信号可以在2kb/s与24kb/s之间进行处理。特别要强调的是MPEG-4标准是面向对象的压缩方式,不是像MPEG-1和MPEG-2简单地将图像分为一些像块,而是根据图像内容,将其中的对象(物体、人物、背景)分离出来分别进行帧内、帧间编码压缩,并允许在不同的对象之间灵活分配码率,对重要的对象分配较多的字节,对次要的对象分配较少的字节,从而大大提高了压缩比,使其在较低的码率下获得较好的效果。MPEG-4的面向对象的压缩方式也使图像探测功能和准确性更充分体现,该图像探测功能使硬盘录像机系统具有较好的视频移动报警功能。总之MPEG-4是一种崭新的低码率、高压缩比的视频编码标准,传输速率为4.8~64kbit/s,使用时占用的存储空间比较小,例如:对于清晰度352×288的彩色画面,其每帧占用空间为1.3KB时,选25帧/秒,则每小时需120KB、每天10小时、每月30天,则每路每月需36GB。若是8路则需288GB,这显然是能接受的。

来源:众能泰科

您的位置:首页 > 技术&知识 > 技术资料

Copyright © 2013- 深圳市众能泰科智能技术有限公司 版权所有 粤ICP备13035516号