登陆注册
49625400000012

第12章 素材(2)

3.2.2压缩:缩小比特率

数字化会产生相当高的数据率,数据量很大。应用ITU-R BT601-5标准的4∶3电视视频信号的比特率是270Mb/s,每小时的视频就有121.5GB。为了缩小比特率,从而降低带宽及存储的要求,要采用压缩技术。压缩通过去除比特流中的冗余数据来减少比特数。减少媒体中的某些属性,接收器(如人的感官)是很难察觉到这些信息的缺失的。无损压缩和有损压缩是可以区别出来的。对于无损压缩,解压后的数据和原始数据完全一致;而对于有损压缩,解压后的数据流和原始数据不一样,因为某些信息被删除或者近似化了。

压缩技术可以分为熵编码、源编码和混合编码方案。熵编码是一种无损压缩技术,而且不使用任何特殊媒体或者流式特性。在熵编码中,数据被认为只是一系列的比特。游程编码替代了实际的编码模式,它用跟随在码后的标记(只需要一次)和其出现的次数代替了序列。因为游程编码模式有一个最小步长,因此只有重复次数超过最小步长要求的部分才会被编码。很明显,此时只有重复超过3个字母的码适合用游程编码法。其他的熵编码形式有向量法、模式置换法、霍夫曼编码法和算术编码法。

源编码法(和熵编码法相反)利用了人类感官的特性(如眼睛和耳朵)。与原始信号相比,源编码法压缩质量有所下降,因此这种方法是有信息丢失的,但却可以保持较高的压缩率。例如,在全部声音内容中,删除人耳无法听到的部分音频信号,或者对视频信号中的色彩信号(而不是亮度信号)进行二次抽样(这源自于人类视觉对明暗程度比对色彩更加敏感)。更具体的例子是插值和转换编码(把数据转换到另外一种更适合压缩的数学域)。

大多数压缩标准采用混合编码技术,例如,结合熵编码和源编码的JPEG、H.261、MPEG-1、MPEG-2和MPEG-4等。根据不同的标准和目的要采用不同的压缩技术。

对于连续媒体,压缩方案有时候也利用连续数据流中的空间冗余信息和发生在相邻信息单元中的临时关系。在这种情况下,不是整个对象被编码,而是来自帧之前或之后的表示相同信息单元的相关信息被编码(即对象上存在变化和差别的相关信息单元才被编码)。例如对于视频来说,有些帧并不是完整的帧,只有这个帧和其他1~2个帧的不同处被编码。因此,为了完全解码这样的帧,所有与其相关的帧都要被计算在内,而且要预先解码。MPEG标准就应用了这种技术(见3.3.2)。

3.3视频

视频是内容管理系统的重要组成部分,系统需要处理、存储和管理不同的数字视频格式。存储和通信的需求对系统的底层和基础结构的要求非常严格。视频也要频繁地交换到其他第三方系统上,此时互用性具有重要的作用。此外,低码率的视频可用来浏览资料并查证系统中可用的内容。要仔细地选择这些格式以便在给定的技术和资金条件下更好地表示视频的质量。因此,了解视频编码和压缩的基本原理以及主要的视频格式是很重要的。

这一节将介绍主要视频格式的基本原理。视频制作中最主要的格式是基于MPEG或者DV编码的。内容管理系统中采用的大量的视频格式都基于这2种标准。

3.3.1视频编码:基础和原理

视频图像是用像素(图片元素)表示的,它们是图片中的最小单元。图像比例给出了图片的宽度与高度的比例,一般宽高比是4∶3。因此,垂直分辨率等于图像高度之内能够显示的像素数,水平宽度能显示的像素数等于垂直分辨率乘以图像比例。NTSC制式中有525行、700列。

彩色影像由红、绿、蓝3种信号(RGB)组成。这3种信号通常分别显示,它们混合在一起就定义了色彩。在传输信号的过程中采用了另外一种由1个亮度信号和2个色度信号(YUV)表示的方法。YUV编码并不分离色彩,而是将亮度(Y)从彩色信号(U和V)中分离出来,这是根据人类的感官对亮度比对色度更加敏感的原理。因此亮度信息更加重要,而且能用更高的带宽编码。这种组件编码带宽的不同通常表示为亮度信号和色度信号之间的比率。

对于连续移动的图像,如果帧频在每秒15帧以上,人类眼睛是无法区分单个帧的,这种特征被应用于表示运动图像。欧洲PAL制式标准使用25Hz的复制率(每秒25帧),而美国NTSC制式标准则使用29.97Hz(每秒29.97帧)。为了使移动画面没有闪烁,刷新率要在50Hz以上。如果采取控制闪烁的措施也可以使用更低的刷新率。例如,电视画面可以分成两半,每半都有相应的扫描线。两半画面用替换的方法交替传送信号。每半画面以2倍的速率被扫描(50Hz或59.94Hz)。

为了用计算机处理视频或者用计算机网络来传输,图像要从模拟制转为数字制。最基本的步骤是抽样、量化和编码。对于视频,灰度(或彩色)级在这个过程中被抽样到一个M×N的点阵数组内。接下来,连续的值根据点阵数组映射到表示量化区间的离散值(如分成256个区间)。

视频编码是处理画面不同色彩成分编码的过程。对编码来说有2种可选方案:抽样和编码整个模拟视频信号(如复合编码);或者对亮度和色度信号分别编码(如组件编码)。前者将所有信号都转换到数字域;而后者,则是对亮度和色度信号分别数字化。为了使不同的信号同时被转换,可以使用多路转换技术。

因为可以对亮度和色度信号单独抽样,对于更为重要的亮度信号可以用更高的抽样率(如13.5MHz),而2个色度信号只需要用亮度信号抽样率的一半来抽样(6.75MHz)即可。这种亮度抽样率为2个色度值抽样率的2倍的抽样方法被称为4∶2∶2抽样。

在8比特量化和亮度抽样值每行864、色度抽样值每行432的情况下,除去空白区间间隔后的累加率为261Mb/s。为了减少数字化视频的初始比特率,某些格式采用不同的抽样频率和每行抽样率,这样会在压缩前就已经影响到数字化视频的质量。

3.3.2基于MPEG的格式

ISO/IEC JTC1/SC29/WG11中的运动图像专家组(Moving Pictures Expert Group, MPEG)自1988年以来一直在发展关于视频编码的标准。相关的视频标准有MPEG-1、MPEG-2和MPEG-4。不同的标准制定的时间不同,针对的应用范围也不同。但是它们有很多共同的基本原理,属于同一个格式家族。

3.3.2.1MPEG-1

MPEG-1标准创建的最初目的是定义一种适合数字化存储技术的格式(如CD)。该标准由3个主要部分组成:MPEG视频、MPEG音频(见3.4.2)和MPEG系统(定义如何多路复用和同步音频和视频)。MEPG-1音视频数据流定义的编码的平均带宽是:视频编码部分1.1Mb/s,音频编码部分128kb/s(支持立体声)。因为MPEG-1的原始应用领域是用于存储媒体,所选择的压缩方案更适合于不对称压缩过程。在这种情况下,压缩能力比解压更强。

与大多数压缩方案不同的是MPEG-1标准并不指定编码器,而是定义MPEG-1视频和音频比特流的语法和语义,因此也就指定了MPEG-1流的形式。只要是MPEG-1对应的解码器就能够解码这样的比特流。

MPEG-1中的抽样和量化

MPEG-1中压缩的起始点是一个用所谓宏块作为基本组件的YUV图像。一个宏块被分为16×16的亮度抽样数组(分为4个8×8模块),和2个8×8的Cb和Cr色度抽样数组。然后这些8×8的块由二维的图像域转换为采用离散余弦变换(Discrete Cosine Transformation, DCT)的频率域。该过程的结果是图像中的每一个块都产生一组64 DCT系数。这种在该系数组的左上角表示的灰度和色彩值被称为DC系数,其他值则被称为AC系数。

接下来将量化应用于DCT系数中,在这一过程中实际数值被映射到整数值上。不同的量化步骤和值反映出使用的DC和AC系数的相关性。有一种量化步骤设DC值为8,并设2所乘得的31个量化步长的偶数值,从2到62,为AC的值。量化值取值范围从-255到255。人们使用一个普通的亮度和色度值的量化表。关于MPEG-1量化的更多信息可以参考Hung(1993)。

量化之后,MPEG-1采用了熵编码的方式来减少初始比特率。MPEG-1也定义了各种游程水平的可变编码。

MPEG-1帧类型

为了实现高压缩率,MPEG-1不仅将单帧信息进行压缩,而且也会参考前一帧和后一帧的编码信息,这种方法被称为帧间编码。此时要考虑2个互斥的要求:一方面,要保证最大程度的压缩,此时大块的信息仅被编码一次,同时也关联到其他帧;另一方面,应该能够随机访问一个视频流,流中的帧只有在不涉及其他帧的信息的时候才可以被随机访问。

在MPEG-1中,定义了4种不同类型的帧,可以根据它们与其他编码帧的相关程度来区分。在MPEG-1流中,这些类型的帧的组合影响压缩率和MPEG-1的流能够被随机访问的间隔时间。该4种帧类型是I、P、B、和D。

·I帧(帧内编码图像)是在视频序列中,图像编码不参考任何其他的帧。I帧的压缩与联合图片专家组(Joint Photographic Experts Group, JPEG)的压缩方案类似。

·P帧(预测编码图像)需要之前的I帧或者P帧信息。为了解码该P帧,它之前的I帧或P帧需要提前解码。帧内的参考区基于宏块。运动补偿预测根据先前相关帧来预测当前帧变化的区域。运动矢量表示了特定宏块从其在相关帧中的原始位置运动到当前P帧内特定位置的趋势。

·B帧(双向预测编码图像)需要先前的和之后的I帧和(或)P帧的信息。一千B帧表示的是与其相关帧的不同之处,它不能被用作其他图像的参考。应用运动补偿的插值法来寻找与前一帧和后一帧(I或P帧)匹配的宏块。

·D帧(DC编码图像)是为快进和快退功能定义的帧。D帧是内编码的(如I帧),但只有DC参数被编码。D帧也不被用作参考帧。

MPEG-1的帧间编码说明画面的很大区域从一帧到另一帧不发生变化。因此在之前和之后的宏块中已经编码的信息只需要被引用,而不需要再次编码。B帧可以实现最高程度的压缩。P帧压缩率也比帧内编码的I帧要高。

一个视频流中的不同帧类型的数量和出现频率取决于图片组(Group of Pictures, GoP)。GoP定义了2个I帧中间P帧和B帧的数量和顺序。为了达到高压缩率,大多数图片应该是B帧。然而,随机访问每个单帧却需要只有I帧的流。因此需要权衡压缩率和随机访问视频流的能力。I帧的数量也影响到视频流的错误恢复能力。如果一个I帧损坏或者缺失,则视频流中的所有接下来的P帧和B帧都不能被正常解码。实践证明,一组顺序为IBBPBBPBBI...的画面组是适合的,因为在这个顺序中的每9个帧中(每330毫秒)就有一个可随机访问的帧。

人们定义了2个不同的标准交换格式(Standard Interchange Formats, SIF)(根据PAL和NTSC命名)。为了和MPEG-1标准兼容,人们规定了其中必须要支持的一个最少参数集合,称为限制参数集(Constrain Parameter Set, CPS)。

3.3.2.2MPEG-2

MPEG-1被定义为一种适合数字化资源存储技术的格式。由于它规定了一个最大数据率(1.5Mb/s),在现有技术条件下对于给定的质量不会有显著的提高。因此MPGE-1不适合于高质量的应用要求。为了满足媒体制作和电视的高质量视频的要求,人们定义了MPEG-2。MPEG-2标准是ISO/IEC、ITU-TS、ITU-RS、EBU和SMPTE联合制定的结果。

MPEG-2标准的目的是为音视频信息在很大的分辨率和比特率的范围内提供有效的编码。根据ITU-R 601考虑到更高画面分辨率的要求,MPEG-2规定了最高100Mb/s的数据率。MPEG-2标准甚至考虑了HDTV。此外,它提供了适合交互多媒体服务的特性,如交互电视的随机访问、技巧模式(如快进、快退和慢放等)和多轨音频等。MPEG-2考虑的另一个问题是通过有损耗的信道传输视频。

MPEG-2和MPEG-1标准有同样的基本编码原理。压缩源是数码视频流(如先前的数码流)。与MPEG-1一样,MPEG-2也只定义视频流的语法和解码语义,而不是编码过程。同MPEG-1中定义的一样,有4种不同的画面帧(I、P、B、和D帧)。压缩过程中画面被分解为8×8的宏块,每个块用DTC来变换、量化和之字形扫描,还有运动评价和补偿。熵编码的步骤采用可变的游程编码。因此MPEG-1标准中的所有基本技术也用在MPEG-2中。

然而和MPEG-1不同的是,MPEG-2也支持隔行扫描的视频压缩。这是由MPGE-2的2种不同的画面模式——场画面(场单独被编码)和帧画面(每个隔行扫描的场组成一帧,被划分为宏块,然后被编码)来实现的。在该情况下,MPEG-2也为之字形扫描出现的非最佳情况提供了一种替换扫描模式。当邻近的扫描线来自于不同的场时,可以造成运动画面场景上的不连续。

同类推荐
  • 媒介演化论:历史制度主义视野下的中国媒介制度变迁研究

    媒介演化论:历史制度主义视野下的中国媒介制度变迁研究

    本书聚焦中国媒介制度的变迁与演化过程,史论结合,以论带史,详尽而生动地揭示出中国媒介制度变迁的发生学原理;运用历史制度主义整合“行动”与“结构”分析的理论框架,本书构建了一个中国媒介制度变迁的“四维模型”,以简驭繁,将中国媒介制度变迁的内在逻辑清楚地呈现出来。全书理论深厚、内容充实,逻辑严密,新见迭出,具有鲜明的中国媒介研究的本土意识和问题意识,堪称中国媒介制度变迁研究的扛鼎之作。
  • “新民”教育思想与教育论著选读

    “新民”教育思想与教育论著选读

    教师职业化、专业化是当今世界教育改革共同关注的热点和焦点问题之一。教师职业素质素养达到基本要求和提高,是当前教育改革和课程改革的急迫要求。为此,我们组织相关专家重新系统地、较完整地遍选、编译、评注了这套适合中小学教师职业阅读的《中外教育名家名作精读丛书》
  • 守望声屏:论媒体的责任与自律

    守望声屏:论媒体的责任与自律

    本书收录了“长沙广电杯”深化“三项教育”、治理“五大公害”论文征文活动的上相关作品,一是领导和理论骨干在有关会议上的重要讲话或撰写的相关文章;二是本次论文正文中的部分佳作。
  • 教师公文包-文坛趣话

    教师公文包-文坛趣话

    本书分立志、爱憎、爱国、勤奋、谦虚、谐趣、幽默、识才、趣闻九部分收录了适合给中小学生讲述的中外文坛趣事。
  • 五环辉映下的金陵:2014南京青奥会知识读本

    五环辉映下的金陵:2014南京青奥会知识读本

    青少年奥林匹克运动会(TheYouthOlympicGames,YOG),简称为“青少年奥运会”或“青奥会”。青奥会是当今世界的新型体育运动赛事,它是国际奥委会为贯彻“奥林匹克宪章”而增设的一项国际性的体育盛会,是专门为全世界青少年而开设的一个集体育比赛、文化和教育于一体的青少年的交流平台。
热门推荐
  • 孟子选注

    孟子选注

    本书从战国时期思想家、政治家、教育家孟子的哲学政治理论和教育纲领著作《孟子》中选取精华篇章,加以详细的注释和解读,并配以与中学生课堂学习相应的导读、知识链接等内容,使广大读者特别是中学生读者在阅读本书后,能够充分了解《孟子》体现的哲学思想、政治主张及教育观点,欣赏和理解《孟子》行文的特点和修辞手法,对中学生相关课文的学习是很好的补充,也是普通读者了解《孟子》的优秀选本。
  • 神天大陆之修神

    神天大陆之修神

    这是一个关于修炼成神的大陆,当突破十重天的时候,便能成神。大千世界之中,前世分别来自两个不同世界的人——潇枫(主角)和王瀚,让我们看他们如何登上成神之路,这一路像是惊奇的,充满了冒险,与挑战,一起来见证他们的成长吧!
  • 逍遥行之侠客风云传

    逍遥行之侠客风云传

    主角时代百年前传奇侠客小虾米收集十四天书开启圣堂秘密消失武林,留下圣堂钥匙流落武林,数十年后西域崛起势力天龙教迅速壮大,天龙教与中原武林纷争四起,争夺圣堂钥匙,主角父母遭人追杀,主角成人后机缘巧合拜入逍遥谷无暇子门下,日常生活中与大师兄谷月轩二师兄荆棘结下深厚情谊,结识诸多好友,与红颜知己,共同与江湖恶势力龙王带领的天龙教与杀手组织天意城朝廷东西厂势力斗争,过程主角中结识天龙教中天王部署了解天王事迹被天王胸襟折服,师兄弟三人联手破坏天龙教,天意城惊天阴谋的故事
  • 乱世降神录

    乱世降神录

    浅离(*?︶?*):我衣服上只是脏了一点………灵然(嫌弃脸(?ˇ?ˇ?)):去换!且看一条巨龙被迫变成小蛇如何在跌宕风云中破云为龙,降神御仙,呼风唤雨!
  • 贪恋红尘三千尺

    贪恋红尘三千尺

    本是青灯不归客,却因浊酒恋红尘。人有生老三千疾,唯有相思不可医。佛曰:缘来缘去,皆是天意;缘深缘浅,皆是宿命。她本是出家女,一心只想着远离凡尘逍遥自在。不曾想有朝一日唯一的一次下山随手救下一人竟是改变自己的一生。而她与他的相识,不过是为了印证,相识只是孽缘一场。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 噬魂重生

    噬魂重生

    保安逆袭成为时间系统的新宿主,穿越到天道大陆成为人上人......谁知道这一切只是被万界神王......后以时间系统的性命为代价,噬魂回到过往,而时间系统却从世界彻底消失......
  • 暴躁三国

    暴躁三国

    我叫赵云,二十一世纪的,玉帝捅了篓子,我被选上去给他平事儿,于是我来到一个比正常历史上还要乱的三国时代。这是一个暴躁的时代……因为玉帝的原因,我开了家雇佣兵公司,从此以后我……噗~谁!我是貂蝉,亲爱的!【纯属虚构,如有不妥你来咬我啊】
  • 寻觅不到你

    寻觅不到你

    要是狼吃掉了小红帽后变成了红帽,是不是就有数不尽的财富。伪装自己才不会死的更快,才能笑的更久。
  • 精灵世界修真

    精灵世界修真

    群:305751959 骑龙上九天,观鸿多少年的梦想,终于在鲤鱼王进化的一瞬间可以实现了。不过,他看着满身背刺的暴鲤龙,却不由的苦恼起来。“这坐下去好像有点扎啊!”