《多媒体数据压缩技术.pptx》由会员分享,可在线阅读,更多相关《多媒体数据压缩技术.pptx(21页珍藏版)》请在第壹文秘上搜索。
1、多媒体数据压缩技术1.1 多媒体数据的冗余类型1.2 数据压缩方法1.3 视频编码的国际标准1.1 多媒体数据的冗余类型图像数据表示中存在着大量的冗余,图像数据压缩技术就是利用图像数据的冗余性来减少图像数据量的方法。常见图像数据冗余类型如下: 空间冗余2. 时间冗余3. 视觉冗余空间冗余一幅图像表面上各采样点的颜色之间往往存在着空间连贯性,基于离散像素采样来表示物体表面颜色的像素存储方式可利用空间连贯性,达到减少数据量的目的。例如,在静态图像中有一块表面颜色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的空间冗余。时间冗余运动图像一般为位于一时间轴区间的一组连续画
2、面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为时间冗余。同理,语音数据中也存在着时间冗余。视觉冗余人类的视觉系统对图像场的敏感度是非均匀的。但是,在记录原始的图像数据时,通常假定视觉系统近似线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生比理想编码(即把视觉敏感和不敏感的部分区分开来的编码)更多的数据,这就是视觉冗余。1.2 数据压缩方法压缩处理一般是由两个过程组成:一是编码过程,即将原始数据经过编码进行压缩,以便存储与传输;二是解码过程,
3、此过程对编码数据进行解码,还原为可以使用的数据。数据压缩可分为两种类型:一种叫做无损压缩,另一种叫做有损压缩。无损压缩混合压缩有损压缩无损压缩无损压缩常用在原始数据的存档,如文本数据、程序以及珍贵的图片和图像等。其原理是统计压缩数据中的冗余(重复的数据)部分。常用的有:RLE (run length encoding)行程编码Huffman 编码算术编码LZW (lempel-ziv-welch)编码(1)、行程编码(RLE)RLE 编码是将数据流中连续出现的字符用单一记号表示。例如,字符串AAABCDDDDDDDDBBBBB可以压缩为3ABC8D5B 。RLE编码简单直观,编码/解码速度快,
4、因此许多图形和视频文件,如.BMP.TIFF及AVI等格式文件的压缩均采用此方法.(2)、Huffman编码它是一种对统计独立信源能达到最小平均码长的编码方法。其原理是,先统计数据中各字符出现的概率后,再按字符出现频率高低的顺序分别赋以由短到长的代码,从而保证了文件的整体的大部分字符是由较短的编码构成的。(3)、算术编码其方法是将被编码的信源消息表示成实数轴0-1之间的一个间隔,消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位数就越多。该方法实现较为复杂,常与其它有损压缩结合使用,并在图像数据压缩标准(如JPEG)中扮演重要角色。(4)、LZW编码LZW(Lempel-Ziv-We
5、lch)压缩使用字典库查找方案。它读入待压缩的数据并与一个字典库(库开始是空的)中的字符串对比,如有匹配的字符串,则输出该字符串数据在字典库中的位置索引,否则将该字符串插入字典中。许多商品压缩软件如ARJ、PKZIR、ZOO、LHA等都采用了设方法。另外,.GIF 和.TIF 格式的图形文件也是按这一文件存储的。有损压缩图像或声音的频带宽、信息丰富,人类视觉和听觉器官对频带中某些频率成分不大敏感,有损压缩以牺牲这部分信息为代价,换取了较高的压缩比。常用的有损压缩方法有:PCM(脉冲编码调制)、预测编码、变换编码、插值与外推等。新一代的数据压缩方法有:矢量量化和子带编码、基于模型的压缩、分形压缩
6、及小波变换等。混合压缩混合压缩是利用了各种单一压缩的长处,以求在压缩比、压缩效率及保真度之间取得最佳折衷。该方法在许多情况下被应用,如JPEG 和MPEG 标准就采用了混合编码的压缩方法。1.3 视频编码的国际标准1、静止图像压缩标准2、运动图像压缩标准3视频通信编码标准静止图像压缩标准国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立的“联合照片专家组“ JPEG (joint photographic experts group)于1991年提出的“多灰度静止图像的数字压缩编码“(简称JPEG标准)。这是一个适应于彩色和单色多灰度或连续色调静止数字图像的压缩标准。JPE
7、G标准支持很高的图像分辨率和量化精度。它包含两部分:第一部分是无损压缩,基于差分脉冲编码调制(DPCM)的预测编码。第二部分是有损压缩,基于离散余弦变换(DCT)和Huffman编码, 通常压缩20-40倍。运动图像压缩标准视频图像压缩的一个重要标准是MPEG (Moving Picture Experts Group)于1990年形成的一个标准草案(简称MPEG标准)。它兼顾了JPEG标准和CCITT专家组的H.261标准。MPEG标准分成MPEG视频、MPEG音频和MPEG系统三大部分。MPEG算法除了对单幅图像进行编码外(帧内编码),还利用图像序列的相关特性去除帧间图像冗余,大大提高了视频图像的压缩比。压缩比可达到60-100倍。视频通信编码标准多媒体通信中的电视图像编码标准都采用H.261和H.263。H.261主要用来支持电视会议和可视电话。电视图像数据压缩后的数据速率为P64kb/s,其中P是一个可变参数,取值范围是1-30。H.263是在H.261的基础上开发的电视图像编码标准,用于低位速率通信的电视图像编码。