最新资讯:
当前位置: 首页 > 技术回顾 > 正文
MPEG图像压缩标准的背景知识

   出于以下两个原因,图像必须压缩。

    首先,传输数字图像所需的带宽远窄于未压缩图像。例如,ntsc图像以大约640 x 480的分辨率,24bits/象素,每秒30帧的质量传输时,其数据率达28m字节/秒或221m位/秒。此外,ntsc声音信号还要使未压缩图像的比特率再增加一些。然而单速cd-rom(1x)驱动器只能以1.2m位/秒的速率传输数据。
第二个原因是以28m字节/秒的速率,15秒的未压缩图像将占用420m字节的内存空间,这对于大多数只能处理小图像片断的台式计算机来说都是不可接受的。
当今把图像加入电子信号的关键问题是压缩方式。有几种不同的压缩方式,但mpeg是最有市场潜力的压缩方式

mpeg的历史和优点

    mpeg(即moving picture experts group运动图像专家小组)是个国际标准,即所谓iso11172。它的两个标准─mpeg-1和mpeg-2特别重要。mpeg-1于 1991年引入,用于加速cd-rom中图像的传输。它的目的是把221mbit/秒的ntsc图像压缩到1.2mbit/秒,压缩率为200:1。这是图像压缩的工业认可标准。
mpeg-2用于宽带传输的图像,图像质量达到电视广播甚至hdtv的标准。和mpeg-1相比,mpeg-2支持更广的分辨率和比特率范围,将成为数字图像盘(dvd)和数字广播电视的压缩方式。这些市场将和计算机市场交织在一起,从而使mpeg-2成为计算机的一种重要的图像压缩标准。这一点非常重要,因为将mpeg-1的比特流解压缩时需要用到mpeg-2的解压缩器。另一标准──mpeg-4──正在发展中,它将支持非常低的比特率的数据流的应用,如电视电话,视频邮件和电子报刊等。
对mpeg的广泛接受意味着对它的使用者的投资保护。许多零售商出售mpeg的软件或硬件播放器,这种竞争造成了价格的下降和质量的上升。mpeg-1可以和mpeg-2兼容,因此它是一种尚有发展余地的标准。

mpeg如何工作

    mpeg-1的特点是它是一种有损的,非平衡编码。有损意味着为达到低比特率,一些图像和伴音信息将丢失。通常这些信息是人眼和人耳最不敏感的信息,因此即使以1x cd-rom的速率压缩也能达到vhs的图像质量和高保真立体声的效果。mpeg采用非平衡编码意味着压缩一幅图像比解压缩慢的多。

    mpeg-1的数据流包含3种成分:图像流,伴音流和系统流。图像流仅仅包含画面信息,伴音流包含声音信息,系统流实现图像和伴音的同步。所有播放mpeg图像和伴音数据所需的时钟信息都包含在系统流中。

    mpeg用复杂的数学和心理学技术达到它的压缩结果。mpeg伴音压缩编码利用了人耳灵敏度的研究结果,图像编码利用人眼对亮度,颜色,运动的灵敏度的一些有利结果。

mpeg伴音

    cd伴音两个通道共包含1.4mbit/秒的数据流。听觉心理学研究表明,采用适当的压缩技术,此数据流可以压缩到256kbit/秒而不会感觉到任何失真。mpeg伴音利用这个结果,尽管一些mpeg压缩器不支持高质量图像。

    mpeg伴音编码可以实现3种压缩等级。等级i是简单压缩,它是一种听觉心理学模型下的亚抽样编码。等级ii加入了更高的精度,等级iii加入了非线性量化,huffman编码和其他实现低速率高保真图像的先进技术。依次下去的等级提供了高质量和越来越高的压缩率,但要求计算机有越来越强的压缩能力。mpeg等级ii可以把一个1.4mbit/秒的立体声数据流压缩到32kbit/秒-384kbit/秒而保持高保真的声音。典型数据为,等级i的目标是每个通道192kbit/秒,等级ii的目标是每个通道128kbit/秒,等级iii的目标是每个通道64kbit/秒。目标ii要达到64kbit/通道时不如等级iii效果好,而在128kbit/通道,等级ii和等级iii的效果一样,而且都比等级i效果好。正如上面所说的,每通道128kbit/秒或者说两通道256kbit/秒可以达到很好的保真度。因此,等级ii对于高保真立体声音响是必要的,但也已足够了。
 
    mpeg-1支持设置为单声道,双声道,立体声或联合立体声的两个声音通道,等级ii的联合立体声把声音信号的高频部分(高于2khz)结合起来,立体图像整个保存下来,但仅传输瞬时包络。等级i不支持两和立体声。有些mpeg压缩器不能产生等时ii的伴音流,从而声音保真度较低而且没有联合立体声功能。

mpeg图像

    mpeg图像编码包含3个成分:i帧,p帧和b帧。mpeg编码过程中,一些图像压缩成i帧,一些压缩成p帧,另一些压缩成b帧。i帧压缩可以得到6;1的压缩比而不产生任何可觉察的模糊现象。i帧压缩的同时使用p帧压缩,可以达到更高的压缩比而无可觉察的模糊现象。b帧压缩可以达到200:1的压缩比,其文件尺寸一般为i帧压缩尺寸的15%,不到p帧压缩尺寸的一半。i帧压缩去掉图像的空间冗余度,p帧和b帧去掉时间冗余度,下文将进一步解释。

    i帧压缩采用基准帧模式,只提供帧内压缩,即把帧图像压缩到i帧时,仅仅考虑了帧内的图像。i帧压缩不能除去帧间冗余度。帧内压缩基于离散余弦变换(dct),类似于jpeg和h.261图像中使用dct的压缩标准。

    p帧采用预测编码,利用相邻帧的一般统计信息进行预测。也就是说,它考虑运动特性,提供帧间编码。p帧预测当前帧与前面最近的i帧或p帧的差别。
b帧为双向帧间编码。它从前面和后面的i帧或p帧中提取数据。b帧基于当前帧与前一帧和后一帧图像之间的差别进行压缩。

    mepg数据流开始时对ccir-601规定的sif分辨率的未压缩数字图像进行抽样。sif分辨率,对于ntsc制,就是亮度信号为352*240各像素,每个色度信号都为176*120个象素。各信号都是每秒30帧。mpeg压缩器决定了当前帧以i帧,p帧还是b帧。帧确定之后就采用dct变换,对结果进行量化,舍入,行程编码即变长编码。编码后的典型图像帧序为:ibbpbbpbbpbbibbpbbpbbpbbi…

    b帧和p帧要求计算机有更强的功能。有些压缩器不能产生b帧或者连p帧也不能产生,则图像的压缩结果将有很明显的间断。

其他形式的图像压缩

    当然,mpeg不是仅有的图像压缩标准。h.261,运动jpeg,cinepak和indeo是最优的替代标准。

    h.261和motion-jpeg与mepg采用相似的技术,即都采用离散余弦变换(dct)。然而,jpeg就象mpeg i帧压缩一样,是一种帧内压缩,而且要想不产生可觉察的模糊现象,压缩比不能超过10。因此,要用cd-rom或internet传输图像,jpeg不是一种好的选择,因为它们的压缩比要求达到200:1。h.261可以提供很高的压缩比,然而它不太适用于有大量运动的图像,而最适用于有静态背景的谈话图像。尽管h.261支持通过p帧的帧间压缩,但它不支持b帧压缩。因此,高压缩率的获得是以部分牺牲图像质量为代价的。当图像质量和运动很重要时,h.261将不再是好的选择。
 
    indeo3.2和4.0是专卖的,采用不同的压缩技术。indeo 4.0压缩是两者中较复杂的一种,允许双向预测(b帧)和缩放。一般,indeo4.0压缩用软件实现,速度很慢,尤其是使用b帧编码时尤其如此。indeo的b帧压缩还会造成帧丢失。缩放功能还会造成突变边缘有可觉察的象素化现象及帧的丢失。不用b帧压缩和缩放功能时,320x240分辨率,每秒15帧的图像可以压缩到每秒200kbytes。相比之下,mpeg提供了更高的压缩率,即将352x240分辨率,每秒30帧的图像压缩到每秒150kbyte。
cinepak是由radius公司发展的一种压缩技术,它也是专卖的,压缩速度很慢。一般它提供每秒15帧的cd而不象mpeg为每秒30帧。

结论

    尽管图像压缩有几种变解码标准,mpeg-1是唯一一种能提供低速率高质量的编解码标准。然而,mpeg的世界也存在差别。并非所有mpeg都支持完全mpeg编码,既同时包括i,p和b帧压缩。没有b帧压缩,图像质量在要求高压缩率的场合会有所下降。也不是所有mpeg都支持压缩后的高质量伴音,只支持等级i编码的mpeg压缩器将不能得到与等级ii相同的伴音质量。

信息来源:力富机构 
 
更多精彩, 尽在广电论坛
广电设备交易市场 请点击
数字电视全面剖析 请点击
广电招聘传递广电人才新干线
hc360慧聪网广电频道 广电行业资讯 广电技术文章
相关信息
·关于世界标准之ISO/MPEG音频标准(2004-01-29 16:11:37)
·MPEG-4系统交互性原理与实现(2004-01-29 09:05:13)
·MPEG-21:21世纪多媒体技术框架(2004-01-25 18:49:42)
发表评论
标  题
署  名
联系方式
内  容
确  定
请您注意:
·尊重网上道德,遵守中华人民共和国的各项有关法律法规
·承担一切因您的行为而直接或间接导致的民事或刑事法律责任
·本网留言板管理人员有权保留或删除其管辖留言中的任意内容
·您在本网留言板发表的作品,本网有权在网站内转载或引用
·参与本留言即表明您已经阅读并接受上述条款