高清视频通信的应用技术和相关标准有哪些?
随着视频通信应用技术的不断发展和完善,越来越多的行业用户接受和使用视频通信产品。然而,在传统视频通信技术的标准下,由于视频通信应用技术和音视频编解码技术发展的制约,视频通信技术并没有从根本上解决通信过程中的图像和声音问题。低水平的视频质量无法满足用户对高清画质的特殊要求。
传统视频通信的主要问题是解码图像在分辨率和色彩还原方面与真实场景有很大差距。这种现象是由编解码设备编解码效率低、链路动态适应性差等多种因素造成的。从而导致真实场景的失真。另外在音频方面,传统的50Hz-7KHz只能感受到较窄的音频宽度,无法有效还原场景环境和声音特征。因此,音频编解码器需要提供更高的音频采样率,以实现更宽的音频效果。在实际应用中,人们对视频图像和声音的要求越来越高,如远程医疗和远程手术;远程维护等。需要通过视频通信的过程实现现场情况的精确视频传输(高清视频应用)。因此,我们需要提供具有更高视频通信质量的高清视频通信产品。因此,数字视频公司推出了基于标准的H.320H.323的高清视频通信产品NEWVISION 7000和NEWVISION 8000系列。
高清视频通信技术的选择:
视频要求:
作为媒体应用,视频通信应用也需要遵循各种标准组织倡导的高清多媒体标准。目前高清数字电视(HDTV)倡导的视频分辨率主要有三种格式,分别是720P、1080I和1080P(其中“P”为逐行扫描模式;“I”是隔行扫描模式)。高清视频通信的主要应用格式是720P——,即720行逐行。
视频通信之所以采用逐行扫描,是因为视频会议场景通常对动态图像要求不大(特殊区域除外),图像的动态变化较小,但对图像的细节要求较高,同时要保证图像的稳定性。但采用隔行扫描1080i(PAL制每秒扫描50场,水平方向分别扫描奇数行和偶数行,实际每场分辨率只有540行)就不能满足这些。因此,在扫描模式中采用逐行扫描可以更稳定地显示画面细节,使画面更清晰。
在媒体流处理方面,大量的原始视频和音频数据流需要在传输链路上进行编码、压缩和传输。高清音视频流(720P)处理的视频流是传统CIF格式流的10倍。如果是更大分辨率格式的视频图像,比如1080P,会导致原媒体数据流更大,影响视频编码效率,降低实时通信进程,增加延时。同时,它将测试实时图像压缩技术。因此,视频会议系统的建设,无论是标清还是高清视频通信系统,都要综合考虑用户在系统建设上的投入,让用户付出相对较低的成本,获得最大的利润。使用过高的视频图像格式(1080P)来处理媒体流会增加DSP的成本和用户的整体成本。比如视频会议系统的外围配套设备,如3354高清显示设备、回放设备、存储设备、主摄像头采集设备等,都必须符合高清通信的规定(高清视频通信是一个完整的端到端系统),而这些设备的价格远远高于其他设备,因此,采用720P视频格式作为图像分辨率格式,可以使整个系统达到最佳的性价比,有效降低用户的购买成本,避免投资浪费。
目前高清显示设备可以同时支持4: 3和16: 9显示模式。传统的视频通信系统多采用4: 3显示模式,而高清视频通信应采用更符合人眼观看习惯的16: 9显示模式,以取代传统视频会议系统采用的4:3显示模式。这是因为16: 9显示模式的可视面积会比4: 3显示模式增加20%左右,在屏幕显示区域的垂直分辨率(行数)相同的情况下,单帧的可视面积会增加20%左右。
所以结论是,高清视频通信视频图像的最佳选择应该是:720P视频格式和16: 9格式高清视频标准。
音频要求:
视频通信过程是一个视频和音频的实时双向完整通信过程。在这个过程中,为了获得高清的视频图像,我们有时会忽略另一个重要的过程:——音频通信。如果我们在观看高清视频图像时,不能获得更清晰、更连续的音频效果。那么这个过程其实是没有意义的,所以它的重要性甚至超过了视频。在传统的视频会议系统中,音频技术的发展极其缓慢。原因是目前视频通信中使用的音频编解码压缩标准都是为了在传输过程中保持较低的带宽占用和较高的编解码效率,使得音频信号的采样频率、采样精度和采样范围大大降低,提供的音频清晰度和可还原度也大大衰减。与存储和回放非实时压缩协议(如OGG、MP3等)的标准相比,),音频的保真度很低。这样,在某种程度上,现场声音的还原是达不到要求的。目前传统的视频通信过程中主要使用G.711、G.722、G.722.1、G.728等音频标准,音频宽度只有50Hz-7KHz单声道,而人耳能感知的自然频率响应能力可以达到20Hz-20KHz。所以在还原场景环境音的过程中丢失了太多的音频信息,无法真实展现场景情况。因此,在高清视频通信过程中,我们必须有一个辅助的音频处理方法来解决这个问题。让整个高清通信过程更加接近完美。
目前,国际上有很多音频处理技术的标准。对于下一代实时交互式音频,可以使用MPEG-1第2层或AAC系列音频。标准选择的原则是音频的频率范围要达到22KHz,几乎可以覆盖人类听觉的整个范围,甚至超越高频,才能真实自然地还原现场音频。在还原的过程中,可以使用双声道立体声进行回放,让整个视频交流的声音有更强的接近感,达到CD。同时实现了对链路带宽和编解码效率的最佳适应。下表列出了AAC的9个规格。
标准网格
MPEG-2 AAC MAIN的主要标准在音频处理上缺乏增益控制。
MPEG-2 AAC LC使用TNS,缺少增益和预测来提高编码效率。
MPEG-2AAC SSR的可变采样模式
MPEG-4 AAC LC的低复杂度编码方法
MPEG-4 AAC主要标准
MPEG-4 AAC SSR的可变采样模式
MPEG-4 AAC LD低延迟编码方法
MPEG-4 AAC HE的高效编码方法
MPEG-4 AAC LTP长期预测规范
综上所述,我们可以选择MPEG-1 Layer 2或者AAC系列标准来支持宽带音频。在上面的列表中,我们可以看到有9种AAC格式可供选择,各有特色。在下一代高清视频通信应用中,为用户提供CD级宽带音频是我们追求的方向。
北京数字视频高清视频通信技术
高清视频通信的概念提出时间不长。目前只有部分国外厂商宣称拥有该技术和产品,真正涉及高清视频通信技术和产品的国内厂商很少。因此,中国的视频通信厂商将面临新的挑战和机遇。
北京数字视讯拥有多年广电系统行业经验,拥有独立的产品编解码技术知识。利用其在编解码器方面的技术优势,公司视频R&D团队致力于高清图像编解码器的优化,完全满足高清视频通信的技术要求。视频采用H.264标准和720P格式,音频采用MPEG-1 Layer 2和AAC音频标准。成功推出商用级高清H.264编解码技术和全新Vision7000、8000系列高清视频产品,为用户带来高清图像和高保真语音享受。