摘 要 随着我国通信网络设施的快速发展,视频业务也迅速发展起来,ITU-T也制定了多种相关标准,本文主要介绍了视频会议系统的基本概念及其对新的视频编解码技术提出的要求,分析了H.264编码标准的特点和技术优势,并介绍了H.264在H.323系统中的实现方法。
关键词 H.264 H.323 图像 片 宏块 预测 1、引言
视频会议系统是一种可以在两点或多点间实现实时传送视频、音频和应用数据等多种信息、具有会议功能的多媒体通信系统。近年来,随着我国通信网络基础设施的快速建设和经济的飞速发展,会议电视业务由于可以为处于两点或多点的与会者提供视音频和数据等多种信息,节省大量费用,提高工作效率而发展迅速,并有望成为下一代网络(NGN)的主要业务。H.264是由ITU-T和ISO两个组织的专家为实现视频的更高压缩比,更好的图像质量和良好的网络适应性而提出的新的视频编解码标准。事实证明,H.264编码具有比其他的H系列视频压缩标准节省码流,比MPEG-4算法简单的特点。H.264的良好网络适应性和内在的抗丢包能力、抗误码机制,使它不仅适于IP传输方式,也适合丢包严重、时延和抖动复杂的无线信道。H.264有望成为多媒体通信中首选的视频编解码标准。
2、视频会议系统对视频编解码的要求
视频会议系统从产生至今,ITU-T制定了多种适合于各类通信网络的标准,目前通信网上传输多媒体信息的系统主要有H.320(基于ISDN),H.324(包括H.324I,H.324P和H.324M),H.31O(基于ATM)和H.323(基于LAN)四类系统。随着IP问题(安全和QoS问题)的逐步解决,以IP作为承载网的优势将更加明显,下一代网络也将采用IP技术作为承载网技术,因此本文以适用于在IP网上提供多媒体业务的H.323系统为主进行阐述。
视频会议系统对视频编解码标准的具体要求是:
(1)由于目前IP网络接入方式有LAN接入,Ethernet,xDSL等多种方式,一些接入方式如xDSL可提供的带宽有限,除去音频、数据占用的带宽,传输视频的可用带宽更少,要求视频编解码高效,压缩率高。
(2)网络适应性好,便于视频流在网络中传输,
(3)抗丢包性能和抗误码性能好,适应各种网络环境,包括丢包和误码严重的无线网络。
3、H.264编码的技术优势
由于H.264在制定时就充分考虑了多媒体通信对视频编解码的各种要求,并借鉴了H系列和MPEG系列视频标准的研究成果,因而具有明显的优势。结合视频会议系统对视频编解码技术的要求,H.264的优势表现在以下三个方面:
3.1 压缩率和图像质量方面
H.264通过对传统的帧内预测、帧间预测、变换编码和熵编码等算法的改进来进一步提高编码效率和图像质量。
(1)块的大小可变。在运动估计时,可以灵活地选择块的大小。在宏块(MB)划分上,H.264采用了16×6,16×8,8×16,8×8四种模式;当划分为8×8模式时,又可进一步采用8×4,4×8,4×4三种子宏块划分模式(见图1)进一步划分,这样做既可以使运动物体的划分更加精确,减小运动物体边缘的衔接误差,又可以减小变换过程中的计算量。当对较大的平滑区域采用Intra_16×16的帧间预测方式时,为减小小尺寸变换带来的块间灰度差异,H.264采用了对亮度数据的16个4×4块的DC系数进行第二次4×4变换,对色度数据的4个4×4块的DC系数进行22变换的方式。

图1 宏块划分和子宏块划分
(2)1/4像素精度的运动估值。在H.264中通过6阶FIR滤波器的内插获得1/2像素位置的预测值。当1/2像素值获得后,通过取整数像素位置和1/2像素位置像素值均值的方式获得1/4像素位置的值。采用高精度运动估计会进一步减小帧间预测误差,减少了经变换和量化后的非O比特数,提高了编码效率。