»1
.
第8讲数据
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示
信息存储和传输的有效性,信息表示
数字表示:数制及其相互转换
字符表示
汉字编码
图形和视频表示:位图图象、矢量图象、数字视频
音频表示:波形音频和MIDI音乐
数据压缩:磁盘压缩、文件压缩、文本文件压缩、
图形文件、视频文件压缩、MP3音乐压缩
使用压缩工具
.
1. 信息存储和传输的有效性问题
信息论:研究信息表示和信息编码的有效方法。在
计算机里,信息编码和存储的方法——文件
格式
pdf格式笔记格式下载页码格式下载公文格式下载简报格式下载
。
包括字处理文档、图形数据、音频数据或视频数
据。
.
1. 信息存储和传输的有效性问题
信息表示:使用n个比特,可以传送的最大不同信息单元数
为2n。
已知信息个数M,如何知道需要的最少比特数? log2 M
¾例如:表示12个月,需要几比特?
位数 1 2 3 4 5 6 7 8
信息单元数
.
2. 数字表示-----数制及其相互转换
数制的基本概念
所谓进制方式,就是选定一个正整数作为进制的单位,这个
数称为进制的“基数”。选定基数那么多个数字符号,然后设
法把任意的数用一串数字符号表示
对任意R进制数X,其值V(X)表示为:
∑∑ −
−=
−
=
+=
m
i
i
i
n
i
i
i RXRXXV
1
1
0
)(
十进制数:基数为10,0-9数字
akak-1…a2a1a0=ak×10k+ak-1×10k-1+…+a2×102+a1×101+a0×100
二进制数:基数为2,两个数字“0”和“1”
akak-1…a2a1a0=ak×2k+ak-1×2k-1+…+a2×22+a1×21+a0×20
八进制数:基数为8,0-7数字
十六进制数:基数为16,0-9,A,B,C,D,E,F
.
计算机中数的编码表示
一个二进制数在计算机内的表示形式称为机器数
机器数的表示方法:无符号二进制数,原码、补码、反码
¾无符号二进制数:没有符号位,全部数位都表示数
¾有符号二进制数:数位和符号位,最高数位为符号位,
“0”正数的符号位;“1”负数的符号位
各种方法表示正数均相同,仅是负数不同
原码:最高位为符号位,其余对应负数的数值
反码:最高位为符号位,其余各数位求反码,得负数的值
求反码:逐位求反,“0”变“1”;“1”变“0”
补码:最高位为符号位,其余各数位求补码,得负数的值
(将减法运算变成加法运算)
求补码:先求反码,再加1
.
实数的编码表示
定点数:小数点不占二进制的位,隐含在机器数里某固定位置
例:11110000
[X]原=(11110000)2,则X=(-0.875)10
[X]补=(11110000)2,则X=(-0.125)10
n位原码定点整数的表示范围:
-(2n-1-1)≤ X ≤2n-1-1
n位原码定点小数的表示范围:
-(1-2-(n-1))≤ X ≤1-2-(n-1)
»2
.
实数的编码表示
浮点数:把任意一个二进制数通过移动小数点位置表示成阶
码和尾数两部分
±0.d1d2…dn×2±c1c2…cn
N=S×2E
E为N的阶码(Exponent),有符号的整数
S为N的尾数(Mantissa),数值的有效数字部分,取二进
制定点纯小数形式
例:101.1101B=2+3×0.1011101
0.01011101B=2-1×0.1011101
阶符 阶 尾符 尾数
.
实数的编码表示
浮点数的格式如下:
例:写出二进制数-101.1101B的浮点数形式。设阶码取4位
补码,尾数是8位原码。
-101.1101B=-0.1011101×2+3
浮点形式为:
浮点数表示的范围:决定于阶码
浮点数表示的精度:决定于尾数—有效数位
国际
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
:
数位 阶码数位 范围 尾数数位 精度
单精度数 32 8 2127 ̄ +2127 24 7位十进制数
双精度数 64 11 -10308 ̄ +1030853 16位十进制数
.
3. 字符表示
字符表示:用一系列比特来表示字符的方法
ASCII( American Standard Code for Information Interchange ):用7比特表示128个字符——
ASCII的数据文件为ASCII文件
ANSI( American National Standards Institute)编码:用8比特表示256个字符,前128个字符编
码与ASCII相同
EBCDIC( Extended Binary Code Decimal Interchange Code):8位字符编码,在IBM大型机上
采用
Unicode:一种16位字符编码
41
101
65A
助记符
十进制 十六进制
八进制 .
4. 汉字编码
GB2312 《信息交换用汉字编码字
符集 ─ 基本集》
一个汉字编码用2个字节表示
[南] 十进制码: 36 47
十六进制码:24H 2FH
[京] 十进制码:30 09
十六进制码:1EH 09H
汉字编码也称为区位码(汉字在汉字编码表中的位置),用于
汉字信息交换。处理用的汉字编码,称为国标码。在区码和
位码上各加32得到。 [南]44H 4FH, [京] 3EH 29H
国标码在计算机内的表示称为机内码,目的是在对汉字进行处
理时能与ASCII码进行区分。分别在高位码和低位码上各加
128。 [南] C4H CFH , [京] BEH A9H
.
文字的数字编码举例
space = 20h
C = 43h
+ = 2Bh
与 = D3hEBh
: = 3Ah
语言 =D3hEFhD1hD4h
是 = CAhC7h
的 = B5hC4h
扩充 = C0hA9hB3hE4h
20 43 2B 2B D3EB 43 3A 20 20 43 2B 2B D3EF D1D4 CAC7 20 20
43 D3EF D1D4 B5C4 C0A9 B3E4
即 00100000
编码, 按 HEX书写C++与C: C++语言是 C语言的扩充
即 00111010
即 1101001111101011 汉字用2个字节编码
即 00101011
即 01000011
即 1011010111000100
即 1100101011000111
11010011111011111101000111010100
11000000101010011011001111100100
.
5.图形和视频表示
位图图像:将图
像划分成独立
的点——像
素,对像素的
状态编码;存
储每个像素的
状态码的方式
来存储图像
分辨率
»3
.
5. 图形和视频表示
单色图像:每像素只有黑白两状
态,用0/1表示;
¾ 例:图像分辨率640*480像素,
则存储图像需640*480/8字节
灰度图像:每像素有256种状态,用
8比特编码;
¾ 例:图像分辨率640*480像素,
则存储图像需640*480字节
彩色图象
¾ 16色图像:4比特编码
¾ 256色图像: 8比特编码
¾ 24位真彩色图像: 24比特编码
屏幕宽(像素) 640 640 640 640 1024
屏幕高(像素) 480 480 480 480 768
图象类型 单色 16色 256色 真彩色 真彩色
需要字节数
.
5. 图形和视频表示
位图文件扩展名:.bmp、.pcx、.tif、.jpg、.gif
可以对位图图像进行编辑,如画图程序
减少图像的存储空间和传输时间的方法:降低分辨率、降低像素颜色状
态数、压缩技术、抖动技术
.
5. 图形和视频表示
抖动技术:减少图像中
的颜色数,根据人眼
对颜色和阴影的分辨
率,通过由两个或多
个颜色组成的模式产
生附加的颜色和阴
影。在WWW中,抖
动技术为常用技术
.
5. 图形和视频表示
矢量图像:由一串可重构图像的指令表示图象信息。
¾用不同的颜色来画线和图形,将线条和图形转换为能重构
图像的指令,存储这些指令。
¾优点:存储空间小,利于对矢量图像的编辑:局部放大、
缩小、变形、上色、移动和删除
矢量图象文件扩展名:.wmf、.dxf、.mgx、.eps、.cgm、
.
5. 图形和视频表示
矢量图象举例
.
5. 图形和视频表示
数字视频:由一系列的帧组成,每帧为静止图片,数据量
640*480*8*30*x秒(bits)
视频文件扩展名:.avi、.mov、.mpg
»4
.
6.声音表示:波形音频、MIDI音乐
声音的数字化
.
6.声音表示:波形音频、MIDI音乐
波形音频:声音的数字形
式表示
采样:对信号在时间轴上
分段
¾ 采样速率:每秒采用次
数,单位——Hz
¾ 样本幅度:8位/16位
音频CD:44.1kHz,16位;
立体声*2;1.44M软盘保留
8秒钟音频
一般采用频率11 kHz,8位
波形文件的扩展名
¾ .wav、.mod、.au、.voc
.
6.声音表示:波形音频、MIDI音乐
MIDI音乐文件:包含MIDI乐器和MIDI声卡用来重构声音的
指令。音符的定调、开始音符、演奏音符的乐器、音符的音
量和时间
MIDI音乐文件扩展名:.mid、.cmf、.rol
.
7. 数据压缩
多媒体数据的特点:数据量非常大。例如,一张彩色相片的
数据量可达100MB;视频影像和声音因连续播放,数据量庞
大。构成对存储以及网络传输的极大负担。
数据压缩:对数据重新进行编码以减少所需存储空间。数据
压缩,压缩后再存储和传输,需要时再解压、还原
采用数据压缩技术的依据:
¾原始多媒体数据存在大量冗余:图片中大面积的蓝天;视
频图像每帧之间变化很小
¾人的感观具有不敏感性:人对细微的颜色差异感觉不明
显。太弱的声音人们感受不到;人的视觉和听觉对某些信
号反映不太敏感,使得压缩后再还原即使有允许范围的变
化,人也感觉不出来。
磁盘压缩、文件压缩、文本文件压缩、图形文件压缩、视频
文件压缩、MP3音乐压缩
.
7. 数据压缩
磁盘压缩:将文件压缩后放到特定的磁盘卷上。存储文件
时,自动压缩文件;使用文件时,自动解压缩。
¾创建压缩卷;
¾缺点:有足够的空间来存放所有解压后的文件;压缩卷
上文件错误可能意味着丢失压缩卷上的所有文件
文件压缩:将一个或多个文件压缩为一个较小的文件
¾压缩软件:如winzip
.
7. 数据压缩
文本文件压缩:采用的压缩技术——自
适应模式替换。扫描整个文件并寻找两
个或多个字节组成的模式。当发现一个
模式后,用文件中其它地方没有用过的
字节代替之,并创建一个字典条目
»5
.
7. 数据压缩
图形文件压缩:
未压缩的位图图
像文件包含可压
缩的重复数据
¾游程编码:一
种压缩技术,
它寻找比特模
式并用描述这
个模式的码字
进行编码
文件:.bmp
文件:.tif、
.pcx、.gif、.jpg
.
压缩编码举例
游程长度编码RLE(Run Length Encoding):
由于一幅图像中有许多颜色相同的图块,用一整数对存储一个像素的颜色
值及相同颜色像素的数目(长度)。例如:
(G ,L)
?
?
?
?
?
编码时采用从左到右,从上到下的排列,
每当遇到一串相同数据时就用该数据及
重复次数代替原来的数据串。
000000003333333333
222222222226666666
111111111111111111
111111555555555555
888888888888888888
555555555555553333
222222222222222222
(0,8) (3,10) (2,11) (6,7)
(1,18) (1,6) (5,12) (8,18)
(5,14) (3,4) (2,18)
18*7字节的像素数据仅用22字节表示
.
7. 数据压缩
影响数据压缩的要素:
¾压缩比:原始数据量与压缩后数据量之比
¾图像质量
¾压缩与解压缩速度
¾执行的硬件与软件
有损压缩和无损压缩:
¾无损压缩:要求解压以后的数据和原始数据完全一致。
如:磁盘文件压缩,TIFF、PCX、GIF
¾有损压缩:解压以后的数据和原始数据不完全一致,是不
可逆压缩方式。有损压缩还原后,不影响信息的表达。
如:图像、视频、音频数据的压缩;压缩比可高达100:1,但人的主
观感受仍不会对原始信息产生误解
.
图象及音频数据压缩标准
JPEG( Joint Photographic Experts Group):静态图像压缩和解压缩算
法的国际标准。支持有损压缩,压缩比可用参数调整,在压缩比达25:1
时,压缩后还原的图像与原始图像相比较,人们很难区分其中的差别。
MPEG(Moving Picture Experts Group ):音频、视频数据的压缩标准。
视频图象由一系列的帧组成。采用帧内压缩(如用JPEG技术,压缩比
20:1-40:1倍)和帧间压缩(运动补偿技术,压缩比50:1)
帧间编码:对于每秒25帧(30)的电视信号,其相继帧之间存在极强的
相关性。据统计256级灰度的黑白图像序列,帧间差值超过3的象素数不
超过4%。所以在活动图像序列中可以利用前面的帧来预测后面的帧,以
实现数据压缩。
视频编码标准H.261
MP3:压缩音乐数据格式,MPEG压缩的变种
.
帧间编码
背景区:图像不变的部分
运动物体区:图像变化的部分
仅传输图像变化部分的信息
.
MPEG----动态视频压缩编码标准
根据对数字影像质量要求的不同,由不同的标准组成:MPEG-1
用于VCD、 MPEG-2 用于DVD、MP3 – MPEG-1 layer 3(音频压
缩)
MPEG-1:1993年公布,数据传输速率1.2Mbit/s-1.5Mbit/s的
视频和伴音信号。
MPEG-2:1994年公布,主要对高清晰度电视所需的视频及
伴音信号,传输速率10Mbit/s。与MPEG-1兼容。
MPEG-4:旨在为视、音频数据的通信、存储与管理提供一
个灵活的框架和一套编码工具。它支持基于内容的交互功
能。应用:Internet多媒体应用、交互式视频游戏、实时可视
通信。
MPEG-7:“多媒体内容描述接口”,为人们获取信息和提供基
于内容的检索的标准。
»6
.
本章知识要点
消息数量与表示位数之间的关系
ASCII、ANSI、EBCDIC、Unicode等字符编码的特点
位图图象文件与矢量图象的区别
波形音频与MIDI音乐的区别
数据压缩:磁盘压缩、文件压缩、文本文件压缩、图形文
件、视频文件压缩、MP3音乐压缩
文件扩展名与数据类型
16色图像、24位彩色图像、256色图像、灰度图像、单色图像
ASCII及ASCII文件
压缩及压缩比,无损压缩、有损压缩,解压缩、文件压缩
.
练习题
数据 是一种记录数据的技术,这样对存储空间的需求可
以减少。
磁盘压缩会在磁盘上创建一个压缩 。
诸如PKZIP和WinZIP的压缩工具产生的文件具有 文件扩
展名。
用较小的字节模式替换字符序列重复出现来压缩文本文件的
技术称为 。
JPEG使用一种称为 压缩的技术,这种压缩技术会丢失一
些原始图像信息。
JPEG使用 压缩技术,而GIF使用 压缩技术。
文件实际上是矢量图像的音乐版本,原因是它存储重构
音乐的指令。
3位可以表示 信息单元。
ASCII、ANSI、EBCDIC、Unicode都是表示 编码
.
练习题
单色图象需要 位来表示每个像素。
24位图象被称为 彩色图象。
图象文件包含图象中每个像素的数字化表示
文件是矢量图象的音乐版本,因为它存储重构音乐的指
令。
PKZIP和WINZIP都可以创建压缩磁盘卷?
MP3格式是MIDI文件的压缩版本?
JPEG使用 压缩技术,而GIF使用 压缩技术。
列出ASCII、ANSI、EBCDIC、Unicode等字符编码的特点
单色图象中,每个像素用一个比特表示;16色图象中,每个
像素用4个比特表示;每个像素有4种颜色的彩色图象,每个
像素需要多少个比特来表示?
.
练习题
描述位图图象与矢量图象的区别。
描述波形音频与MIDI音频的区别。
codec与压缩比的定义。
描述磁盘压缩和文件压缩的区别。
列出文件文件扩展名,指出所包含的文件数据类型(文本、
图象或声音)及是否采用压缩格式存储。
¾位图文件扩展名:.bmp、.pcx、.tif、.jpg、.gif、
¾矢量图象文件扩展名:.wmf、.dxf、.mgx、.eps、.cgm、
¾波形文件扩展名:.wav、.mod、.au、.voc
¾MIDI音乐文件扩展名:.mid、.cmf、.rol
¾视频文件扩展名:.avi、.mov、.mpg