信息论基础及应用第5章　信息率失真函数和限失真信源编码

信息论基础及应用第5章　信息率失真函数和限失真信源编码第5章　信息率失真函数和限失真信源编码信息论基础及应用5.1.1系统模型和失真测度■试验信道输入：X，值域为符号集A:{a1,a2,…,ar}试验信道输出：Y，值域为符号集B:{b1,b2,…,bs}■X的概率分布为P(x)或P(ai),(i=1,2,…,r)Y的概率分布为P(y)或P(bj),(j=1,2,…,s)5.1.1系统模型和失真测度■d(ai,bj)——发出符号ai，收到bj所引起的误差或失真。其值的大小代表失真的大小；为0...

第5章　信息率失真函数和限失真信源编码信息论基础及应用5.1.1系统模型和失真测度■试验信道输入：X，值域为符号集A:{a1,a2,…,ar}试验信道输出：Y，值域为符号集B:{b1,b2,…,bs}■X的概率分布为P(x)或P(ai),(i=1,2,…,r)Y的概率分布为P(y)或P(bj),(j=1,2,…,s)5.1.1系统模型和失真测度■d(ai,bj)——发出符号ai，收到bj所引起的误差或失真。其值的大小代表失真的大小；为0没有失真。 ■失真矩阵D定义为： ■失真函数人为规定，取决于实际需要、引起的损失和风险等。定义5.1　对于每一对(ai,bj)，指定一个非负函数称d(ai,bj)为单个符号的失真度或失真函数。5.1.1系统模型和失真测度■汉明失真矩阵D为r阶方阵：■汉明失真认为：◆当接收与发送相同时，无失真和错误，失真度d(ai,bj)=0；◆当接收与发送不同时，存在失真，且失真相同，常取值为1。定义5.2　离散对称信道（r=s）中，汉明失真定义为5.1.1系统模型和失真测度【例】二元对称信道（r=s=2），信源X的符号集为A:{0,1}，接收变量Y的符号集为B:{0,1}。◆在汉明失真定义下，失真矩阵为即：5.1.1系统模型和失真测度定义5.3　对于每一对(ai,bj)，指定一个非负函数称d(ai,bj)为单个符号的平方误差失真度或平方误差失真函数。【例】三元对称信道（r=s=3），信源X和接收变量Y的符号集为A,B:{0,1,2}。◆在平方误差失真定义下，失真矩阵为5.1.1系统模型和失真测度定义5.4　删除信道（s=r+1）中，接收符号bs是删除符号，则删除失真定义为【例A】二元删除信道（r=2，s=3），信源X的值域A:{0,1}，接收Y的值域B:{0,1,?}。◆在删除失真意义下，可得失真矩阵为:即：5.1.1系统模型和失真测度■D是：信源统计特性P(ai)（信源编码时，一般认为已知）、试验信道转移特性P(bj|ai)（由信源编码算法确定）、失真度d(ai,bj)（根据问题，人为给定）的函数。■当d(ai,bj),P(ai)确定后，D是P(bj|ai)（编码算法）的函数。定义5.5平均失真度定义为单个符号失真度d(ai,bj)的数学期望，即5.1.1系统模型和失真测度■规定离散信源符号的平均失真度D′小于所允许的失真D，即：则D是允许失真的上界，并称上式为保真度准则。5.1.1系统模型和失真测度■单符号信源的失真度和平均失真度的概念推广——N维信源符号序列的失真函数。■信源端N维符号序列：X=(X1,X2,…,XN),共有rN种序列分量Xi的值域：A:{a1,a2,…,ar}信源端输出的N维随机事件：■收信端N维符号序列：Y=(Y1,Y2,…,YN),共有sN种序列分量Yi的值域：B:{b1,b2,…,bs}收信端输出的N维随机事件：5.1.1系统模型和失真测度定义5.6N维序列失真度定义为序列失真矩阵为5.1.1系统模型和失真测度【例】信源序列X=(X1,X2,X3)，其分量的值域为A:{0,1}，经信道输出为序列Y=(Y1,Y2,Y3)，其分量的值域为B:{0,1}，◆汉明失真函数时，则由序列失真度定义可得◆同理可计算其它序列的失真度，◆序列失真矩阵D(N)为：5.1.1系统模型和失真测度定义5.7N维信源符号序列的平均失真度定义为定义5.8N维信源的平均失真度（单个符号的平均失真度）定义为■P(αi)——N维信源X的统计特性P(αiβj)——N维X和Y的联合概率P(βj|αi)——试验信道转移特性5.1.1系统模型和失真测度■可证明，信源和信道皆无记忆时，有：Dk——信源序列第k个分量的平均失真度■如果信源平稳、信道平稳，则：即离散无记忆平稳信源通过离散无记忆平稳信道，则其信源序列平均失真度等于单个符号平均失真度的N倍。■相应的保真度准则为：注：注意区分Dk和DN的不同。5.1.2　信息率失真函数的定义定义5.9满足保真度准则的信道称为许可试验信道，所有许可试验信道的集合用BD表示。对于离散单符号信源和信道，有对于离散无记忆N次扩展信源和信道，有5.1.2　信息率失真函数的定义定义5.10在满足保真度准则的许可试验信道的集合BD中，平均互信息最小值定义为信息率失真函数（率失真函数）：（离散单符号信源）（N次扩展信源）■可证明，信源和信道均为无记忆时，有：注：在信源概率分布、单个符号的失真度相同的条件下，对于不同的N，RN(D)是不同的。■由于平均互信息是下凸函数，率失真函数一定存在。5.1.2　信息率失真函数的定义■信道容量和信息率失真函数具有对偶性。（1）信道容量是指在信道固定前提下，选择一种信源概率分布P(ai)使信息传输率最大（求极大值）。是信道可靠传输的最大信息传输率。（2）信息率失真函数是在信源固定，满足保真度准则D′≤D条件下的信息传输率的最小值，是满足给定失真度条件下信源可以压缩的程度。5.1.2　信息率失真函数的定义■结论：（1）信道容量与信源无关，是信道特性的参量，不同的信道其信道容量不同。（2）信息率失真函数与信道无关，是信源特性的参量，不同的信源其信息率失真函数不同。■研究信道容量，使传输的信息量最大，错误概率任意小，以提高通信的可靠性。这是信道编码问题。■研究信息率失真函数，使信源输出的信息率尽可能小，以提高通信的有效性。这是信源编码问题。5.1.3　信息率失真函数的性质■由性质5.1的证明知，失真矩阵中每行至少有一个零元素时，信源的平均失真度Dmin=0，否则Dmin>0。■一般Dmin=0，表示信源不允许任何失真存在，R(0)=H(X)。■可证明，只有当失真矩阵中每行至少有一个零元素，并且每列最多只有一个零元素时，R(0)=H(X)。5.1.3　信息率失真函数的性质【续例A】求二元删除信道的信源的最小允许失真度。失真矩阵定义为:◆由性质5.1可知，最小允许失真度为◆满足条件的试验信道是一个无噪无损的试验信道，信道转移概率矩阵为：◆上述信道表征的是一一对应编码，此时5.1.3　信息率失真函数的性质【例】设信源X为：信宿Y的值域为B:{b1,b2}。失真矩阵为：◆由性质5.1可知，最小允许失真度为◆由性质5.1证明中式（5.23）知，达到Dmin的信道必须满足：有无穷多组解。且：5.1.3　信息率失真函数的性质性质5.2R(D)是平均失真度D的∪形凸函数（下凸函数），即设D1和D2是两个任意平均失真度，取和，则性质5.3R(D)是(Dmin,Dmax)区间上的连续和严格单调递减函数5.1.3　信息率失真函数的性质■信息率失真函数R(D)的典型曲线图：（1）R(Dmin)和R(Dmax)决定了曲线的两个端点，（2）在Dmin和Dmax之间R(D)是单调递减的下凸函数。连续信源时，，曲线不与纵轴相交。5.1.3　信息率失真函数的性质■信息率失真函数的两点解释：（1）信息率失真理论解决的问题，是计算满足失真要求的最小信道容量或信息传输率，以达到降低信道的复杂度和通信成本的目的。（2）R(D)为单调减函数，故存在反函数，即失真率函数D(R)（distortion-ratefunction）定义◆D(R)的物理意义：固定平均互信息I(X;Y)，选择信道的转移概率P(bj|ai)，使平均失真D最小，5.2离散信源的信息率失真函数的计算■求解信息率失真函数的问题描述：（1）已知P(ai)和P(bj|ai)时，I(X;Y)可以表示为（2）计算R(D)的优化问题可以表述为■有多种求解方法：拉格朗日乘子法、变分法、凸规划方法等。■但是，得到显式解析表达式比较困难。通常只能用参量形式来表示。■也采用迭代算法用计算机求解函数。■利用信源和失真函数的对称性，也可以方便求解一类。5.2.1利用信源的对称性计算信息率失真函数【例】设信源X为：输出Y的值域为B:{b1,b2,b3}。失真矩阵为：求信息率失真函数R(D)。解（1）确定R(D)的定义域。计算Dmin和Dmax如下：5.2.1利用信源的对称性计算信息率失真函数（2）确定转移概率P(bj|ai)。由于，信源X等概分布（对称）、失真函数具有对称性，因此，可推断最佳的转移概率函数也将对称。设：因为：因此，对于任何有限平均失真，必须β=0。5.2.1利用信源的对称性计算信息率失真函数（3）确定转移概率P(bj|ai)与失真度D的关系。计算平均失真度：解出：α=1-D，允许失真为D的试验信道为（4）计算输出符号的概率为：（5）计算信息率失真函数R(D)5.2.1利用信源的对称性计算信息率失真函数【例】设X是r元等概信源，其值域为A:{a1,a2,…,ar}；输出符号集为Y，其值域为B:{b1,b2,…,br}；求汉明失真度时的信息率失真函数R(D)。解（1）依题意，信源概率分布：汉明失真度：（2）确定R(D)的定义域。计算Dmin和Dmax如下：5.2.1利用信源的对称性计算信息率失真函数（3）确定转移概率P(bj|ai)。由于，信源X等概分布、汉明失真函数具有对称性，因此，可推断最佳的转移概率函数也将对称。设：（4）确定转移概率P(bj|ai)与失真度D的关系。计算平均失真度：解出：α=1-D，允许失真为D的试验信道为5.2.1利用信源的对称性计算信息率失真函数（5）计算输出符号的概率为：（6）计算信息率失真函数R(D)*5.2.2离散信源信息率失真函数的参量表达式■R(D)的优化表述为：■分析：极值的约束条件有r+1个，1个是保真度准则（平均失真约束），r个转移概率归一化约束，以及转移概率的非负性约束。*5.2.2离散信源信息率失真函数的参量表达式■拉格朗日乘子法求解，步骤如下：（1）引进一个新函数：S,μi,(i=1,2,…,r)——拉格朗日乘子（待定常数）（2）求Φ的偏导数，并置为零◆上式与优化约束等式得联立方程式（共有r+1个方程），解出P(bj|ai)和S,μi。（3）由信息率失真函数的定义式，计算R(D)。*5.2.2离散信源信息率失真函数的参量表达式■参量S形式的R(D)和D(R)表达式：经推导，得S——保真度条件的拉格朗日乘子。*5.2.2离散信源信息率失真函数的参量表达式■给出当S取某一数值时，计算R(D)和D(R)的步骤：（1）由下式计算出λi,(i=1,2,…,r)；（2）由下式求解出P(bj),(j=1,2,…,s)；（3）计算：（4）计算：*5.2.2离散信源信息率失真函数的参量表达式■P(bj)不能为负，所以参量S的取值有一定限制。■可证明，参量S是信息率失真函数R(D)的斜率。即且斜率S必为非正的、且是D的递增函数。■在D=Dmin处，R(D)的斜率有可能为-∞；当D>Dmax时，R(D)=0，其斜率为0。即：S∈(-∞,0)*5.2.2离散信源信息率失真函数的参量表达式【例】设二元信源：输出Y的值域为B:{b1,b2}。求汉明失真度时的R(D)。解（1）确定R(D)的定义域。计算Dmin和Dmax如下：（2）计算λ1,λ2。由公式得：解得：*5.2.2离散信源信息率失真函数的参量表达式（3）计算输出符号概率：P(b1),P(b2)。由公式得：（4）计算失真率函数D(R)。由公式得由上式解得：*5.2.2离散信源信息率失真函数的参量表达式（5）计算信息率失真函数R(D)。由公式得即：◆D相同时，信源分布越均匀，R(D)越大，信源压缩的可能性越小。◆反之，信源分布越不均匀，R(D)越小，信源压缩的可能性越大。5.3.1连续信源的信息率失真函数与性质定义5.11连续信源的平均失真度定义为N维连续信源的平均失真度定义为Di——第i个连续分量的平均失真度。■连续信源X，值域为实数域R，概率密度为p(x)输出连续变量Y，其值域也为实数域R。■在X和Y之间为一个试验信道，转移概率密度为p(y|x)，平均互信息为：5.3.1连续信源的信息率失真函数与性质■若N维连续信源的各分量取于同一连续信源，则有：5.3.1连续信源的信息率失真函数与性质性质5.4连续信源的R(D)是非负的，其定义域为0≤Dmin≤D≤Dmax；D<Dmin时，R(D)无意义；D>Dmax时，R(D)=0；且性质5.5连续信源的R(D)是平均失真度D的∪形凸函数（下凸函数）。性质5.6连续信源的R(D)是(Dmin,Dmax)区间上的连续和严格单调递减函数。5.3.2　高斯信源的信息率失真函数■高斯信源是一种工程上、理论上都常用的连续信源，输出为独立、同分布高斯随机变量。■在一般失真函数下，其率失真函数也是很难求得的。在平方误差失真测度下，可得到简单的闭式表达式。5.3.2　高斯信源的信息率失真函数■R(D)的特点：（1）允许失真大，R(D)小；D=σ2时，R(D)=0。（2）当D=σ2/4时，R(D)=1bit/自由度；即在允许D≤σ2/4时，每样本最少需用一个二元符号传输，也就是说，连续信号的幅度只需要采用二值量化。5.3.3　连续信源的信息率失真函数的界■一般的连续信源，难以得到简明的R(D)函数的表达式。但可以得到R(D)函数的界。■表明，在平方误差失真准则下，高斯信源有最大的R(D)值。结论：从数据压缩的角度，高斯信源是最难压缩的。5.4　限失真信源编码定理定理5.3离散无记忆平稳信源的信息率失真函数为R(D)，只要使信息传输率R满足R>R(D)，且失真度有限，当信源序列长度n足够长时，一定存在一种编码方法，其译码失真≤D+δ（δ是任意小的正数）。反之，若R<R(D)，则无论采用什么样的编码方法，其译码失真必大于D。■信息率失真理论的基本定理——Shannon第三编码定理。■定理严格地证实了R(D)函数是在允许失真为D条件下，每个信源符号能够被压缩的最低值。5.4　限失真信源编码定理■Shannon第三编码定理只是码的存在性定理。可以分正定理和逆定理。严格地分述如下：5.4　限失真信源编码定理定理5.4（限失真信源编码正定理）离散无记忆平稳信源的信息率失真函数为R(D)，且失真度有限。对于任意的D≥0,ε>0,δ>0，以及任意足够长的码长n，则一定存在一种信源编码C，其码字个数为而编码后的平均失真度d(C)≤D+δ。（R(D)以h为底，h为编码进制数）5.4　限失真信源编码定理定理5.5（限失真信源编码逆定理）不存在平均失真度为D，平均信息传输率R<R(D)的任何信源编码。即对任意码长n的信源编码，若码字个数一定有d(C)>D。■表明，如果编码后R<R(D)，就不能在保真度准则下再现信源的消息。

                    本文档为【信息论基础及应用第5章　信息率失真函数和限失真信源编码】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

信息论基础及应用第5章 信息率失真函数和限失真信源编码

你可能还喜欢

信息论基础及应用第5章　信息率失真函数和限失真信源编码