首页 DSP芯片的定点运算

DSP芯片的定点运算

举报
开通vip

DSP芯片的定点运算DSP芯片的定点运算最近在对前做的一个DSP项目进行改版,正好借此机会把学习的东西总结一番,此总结针对TI的TMS320F2812而言,编译器为CCS3.1。希望对自己或大家有所帮助。第1章          DSP芯片的定点运算1.数据的溢出:1>    溢出分类:上溢(overflow):下溢(underflow)2>溢出的结果:MaxMin MinMaxunsignedchar0255signedchar-128127unsignedint065535signedint-32...

DSP芯片的定点运算
DSP芯片的定点运算最近在对前做的一个DSP项目进行改版,正好借此机会把学习的东西总结一番,此总结针对TI的TMS320F2812而言,编译器为CCS3.1。希望对自己或大家有所帮助。第1章          DSP芯片的定点运算1.数据的溢出:1>    溢出分类:上溢(overflow):下溢(underflow)2>溢出的结果:MaxMin MinMaxunsignedchar0255signedchar-128127unsignedint065535signedint-3276832767上溢在圆圈上按数据逆时针移动;下溢在圆圈上顺时钟移动。例:signedint:32767+1=-32768;  -32768-1=32767unsignedchar:255+1=0;  0-1=2553>为了避免溢出的发生,一般在DSP中可以设置溢出保护功能。当发生溢出时,自动将结果设置为最大值或最小值。2.定点处理器对浮点数的处理:1>    定义变量为浮点型(float,double),用C语言抹平定点处理器和浮点处理器的区别,但是程序的代码庞大,运算速度也慢。2>    放大若干倍表示小数。比如要表示精度为0.01的变量,放大100倍去运算,运算完成后再转化。但是这个做法比较僵硬,如要将上面的变量重新定义成0.001精度,又需要放大1000倍,且要重新编写整个程序,考虑溢出等问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 。3>    定标法:Q格式:通过假定小数点位于哪一位的右侧,从而确定小数的精度。Q0:小数点在第0位的后面,即我们一般采用的方法Q15小数点在第15位的后面,0~14位都是小数位。转化公式:Q=(int)(F×pow(2,q))F=(float)(Q×pow(2,-q))3.Q格式的运算1>    定点加减法:须转换成相同的Q格式才能加减2>    定点乘法:不同Q格式的数据相乘,相当于Q值相加3>    定点除法:不同Q格式的数据相除,相当于Q值相减4>    定点左移:左移相当于Q值增加5>    定点右移:右移相当于Q减少4.Q格式的应用格式实际应用中,浮点运算大都时候都是既有整数部分,也有小数部分的。所以要选择一个适当的定标格式才能更好的处理运算。一般用如下两种方法:1>    使用时使用适中的定标,既可以表示一定的整数复位也可以表示小数复位,如对于2812的32位系统,使用Q15格式,可表示-65536.0~65535.999969482区间内的数据。2>    全部采用小数,这样因为小数之间相乘永远是小数,永远不会溢出。取一个极限最大值(最好使用2的n次幂),转换成x/Max的小数(如果Max是取的2的n次幂,就可以使用移位代替除法)。5.Ti的qmath.lib库 说明 关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书 :见TI的文档C28xIQMathLibrary(SPRC087a).zip的详细说明。TI公司给出了一个Q格式的数学库qmath.lib注意Q格式函数使用的时序和空间要求,尽量避重就轻。CMD文件的编写1.      COFF格式1>    通用目标文件格式(CommonObjectFileFormat)是一种流行的二进制可执行文件格式,二进制可执行文件包括库文件(lib),目标文件(obj)最终可执行文件(out)。,现今PC机上的Windows95和NT4.0以后的操作系统的二进制文件格式(PE)就是在COFF格式基础上的进一步扩充。2>    COFF格式:详细的COFF文件格式包括段头,可执行代码和初始化数据,可重定位信息,行号入口,符号表,字符串表等,这些属于编写操作系统和编译器人员关心范畴。而对于C只需要了解定义段和给段分配空间就可以了。3>    采用COFF更有利于模块化编程,程序员可以自由决定愿意把哪些代码归属到哪些段,然后加以不同的处理。2.      Section目标文件中最小单位称为块。一个块就是最终在存储器映象中占据连续空间的一段代码或数据。1>    COFF目标文件包含三个默认的块:.text可执行代码.data已初始化数据.bss为未初始化数据保留的空间2>    汇编器对块的处理未初始化块.bss变量存放空间.usect用户自定义的未初始化段初始化块.text汇编指令代码.data常数数据(比如对变量的初始化数据).sect用户自定义的已初始化段.asect通.sect,多了绝对地址定位功能,一般不用3>C语言的段未初始化块(data).bss存放全局和静态变量.ebss长调用的.bss(超过了64K地址限制).stack存放C语言的栈.sysmem存放C语言的堆.esysmem长调用的.sysmem(超过了64K地址限制)初始化块.text可执行代码和常数(program).switch  switch语句产生的常数 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 (program/低64K数据空间).pinitTablesforglobalconstructors(C++)(program).cinit用来存放对全局和静态变量的初始化常数值(program).const全局和静态的const变量初始化值和字符串常数,(data).econst长.const(可定位到任何地方)(data)3>    自定义段(C语言)#pragmaDATA_SECTION(函数名或全局变量名,"用户自定义在数据空间的段名");#pragmaCODE_SECTION(函数名或全局变量名,"用户自定义在程序空间的段名");不能在函数体内声明。必须在定义和使用前声明#pragma可以阻止对未调用的函数的优化3.      连接命令文件(CMD)1>    MEMORY指定存储空间MEMORY{PAGE0:name0[attr] :origin=constant,length=constant  PAGEn:namen[attr] :origin=constant,length=constant  }PAGEn:标示存储空间,n<255;PAGE0为程序存储空间;PAGE1为程序存储空间name:存储空间名称attr:存储空间属性:只读R,只写W,可包含可执行代码X,可以被初始化I。orgin:用来定义存储空间的起始地址Lenth:用来定义存储空间的长度2>    SECTI******分配段SECTI******{name      :[property,property,……]}name:输出段的名称property:输出段的属性:load=allocation(强制地址或存储空间名称)同>allocation:定义输出段将会被装载到哪里。run=allocation(强制地址或存储空间名称)同>allocation:定义输出段将会在哪里运行。注:CMD文件中只出现一个关键字load或run时,表示两者的地址时表示两者的地址时重合的。PAGE=n,段位于那个存储页面空间。例:ramfuncs      :LOAD=FLASHD,RUN=RAML0,LOAD_START(_RamfuncsLoadStart),LOAD_END(_RamfuncsLoadEnd),RUN_START(_RamfuncsRunStart),PAGE=03>    直接写编译命令-lrts2800_ml.lib连接系统文件rts2800_ml.lib-ofilename.out最终生成的二进制文件命名为filename.out-mfilename.map生成映射文件filename.map-stack0x200堆栈为512字4..const段:由关键字const限定的全局变量(const限定的局部变量不产生)初始化值,和出现在表达式(做指针使用,而用来初始化字符串数组变量不产生)中的字符串常数,另外数组和结构体是局部变量时,其初始值会产生.const段,而全局时不产生。C语言环境1.C语言软件开发过程软件开发过程涉及编译器(compiler),汇编器(assembler),连接器(linker),归档器(archiver),建库器(library-buildutility),运行支持库(runtimesupportlibrary),HEX转换器(hexconversionutility),交叉引用列表器(crossreferencelister),绝对列表器(absolutelister)等。其大都设置既可通过命令,也可通过ccs的project\buildoptions设置。1>.编译器:对C语言源代码进行编译,产生汇编语言源代码。一步编译:cl2000–v28[-options]filenames[objectfiles][-z[link_options]]分布编译:文法分析:生成file.if的中间文件  ac2000file.c代码优化:生成file.opt的文件  opt2000file.if代码生成:生成file.asm的汇编文件  cg2000file.opt汇编:生成file.obj目标文件  asm2000file.asm2>.汇编器:把汇编语言源文件翻译成机器语言目标文件,机器语言格式为公用目标格式(COFF)。具体命令格式如下:asm2000Version[inputfile[objectfile[listingfile]]][options]3>.连接器:把多个目标文件组合成单个可执行目标模块。它一边创建可执行模块,一边完成重定位以及决定外部参考。连接器的输入是可重定位的目标文件和目标库文件.具体命令格式如下:汇编语言:lnk2000[options]filename1,filename2……[filenamen]C语言:lnk2000{-c|-cr}filenames[options][-oname.out][lnk.cmd][-llibname,lib]注:  -c运行时自动初始化变量-cr载入程序时自动初始化变量options:详见手册。-oname.out生成的输出文件名lnk.cmd连接的cmd文件名-llibname.lib连接的运行支持库名例:lnk2000–cprog1prog2prog3–oprog.outrts2800.lib4>.归档器(Archiver)归档器Archiver可以用来对文档(Archive)或者库(library)中的文件进行分离和合并。这些文档或库可以是源文件库,也可以时目标文件库。归档器可以对库进行新建,添加,删除,替换,提取等操作,具体命令格式如下:ar2000[-]command[options]libname[filename0,filename1,……filenamen]1>    此命令针对TMS320F2812而言,其他类DSP命令以及格式略有不同,可详查TI的文档。此命令所在目录在\CCS_v3.1\C2000\cgtools\bin2>    command:@使用CMD文件a(add)向指定文档中添加指定文件d(delete)删除指定文档中的指定文件r(replace)替换指定文档中的指定文件t(table)列出指定文档中的文件x(extract)提取指定文档中的指定文件3>    options:q(quiet)屏蔽状态信息s(symbol)列出库中定义的全局符号(对命令a,r,d无效)u替换文件时同步更新修改日期v(verbose)提供详细的描叙4>    libname指定的文档名5>    filename文档中指定的文件名5>.建库器(library-buildutility):建立满足你自己要求的运行支持库.CCS中提供有rts库文件(\CCS_v3.1\C2000\cgtools\lib),并提供了对应的源程序文件rts.src(\CCS_v3.1\C2000\cgtools\lib)。如:rts2800.lib:C/C++运行支持库;rts2800_ml.libC/C++大内存模式运行支持库;用户可以利用归档器和建库器对rts.src中的文件进行提取,修改等操作,并重新生成自己需要的库文件。命令的具体格式如下:mk2000–v28[options]src_arch1[-lobjlib1]src_arch1[-lobjlib1]……6>.运行支持库(runtimesupportlibrary):它包括C编译器所支持的ANSI 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 运行支持函数、编译器公用程序函数、浮点运算函数和C编译器支持的I/O函数.CCS中提供有rts库文件(\CCS_v3.1\C2000\cgtools\lib),并提供了对应的源程序文件rts.src(\CCS_v3.1\C2000\cgtools\lib)。如:rts2800.lib:C/C++运行支持库;rts2800_ml.libC/C++大内存模式运行支持库.库文件包括标准的C/C++运行支持库函数,浮点运算程序,系统启动程序_c_int00.7>.HEX转换器(hexconversionutility):它把COFF目标文件转换成TI-Tagged、ASCII-hex、Intel、Motorola-S、或Tektronix等目标格式,可以把转换好的文件下载到EPROM编程器中.hex2000[-options]filename-a  ASCII-HEX-i  Intel-t  Ti-Tagged-m  Motorola-S-x  Tektronix8>.交叉引用列表器(crossreferencelister):它用连接的目标文件产生参照列表文件,可显示符号及其定义,以及符号所在的源文件.xref2000[options][inputfilename[outputfilename]]options:  -lxx每页显示xx行(十进制数)-q(quiet)不显示提示消息inputfilename  obj文件outputfilename生成的xrf文件9>.绝对列表器(absolutelister):它输入连接后的目标文件,输出.abs文件,通过汇编.abs文件可产生含有绝对地址的列表文件。如果没有绝对列表器,这些操作将需要冗长乏味的手工操作才能完成。abs2000[-options]inputfileoptions:  -e改变缺省的文件后缀名-ea[.]asmext  asm->asmtxt-ec[.]cext  c->ctxt-eh[.]hext  h->htxt-ep[.]cppext  cpp/cc/cxx->ptxt-fs指定输出文件目录。如:–fsC:\ABSDIR-q不显示提示消息inputfile  .out文件例如:abs2000–eas–eccsr–ehhsrhello.out生成文件hello.s(hello.asm),hello.csr(hello.c),hello.hsr(hello.h).2.CCS概述DSP芯片开发工具可分为两大类:代码生成工具:代码调试工具:C/汇编语言源码调试器,初学者工具DSK,软件模拟器(Simulator),评价模块EVM,软件开发系统SWDS,仿真器XDS.3.C编译器的优化:1>C编译器优化分为2类:C语言通用优化:简化表达式,数据流优化,删除公共子表达式和冗余分配,优化跳转,简化控制流,优化与循环有关的变量,将循环体内计算值不变的表达式移至循环体前,运行支持库函数的行内扩展。根据DSP芯片的特定优化:高效地使用寄存器,自动增量寄存器寻址方式,使用块重复,使用并行指令,使用延迟跳转。2>CCS的优化选项:4.GEL语言的使用:GEL(GeneralExtensionLanguage通用扩展语言)是一种类似于C语言的一种解释性语言,它可以创建GEL函数,以扩展CCS用途。GEL是C语言的一个子集,然而它不能声明主机变量,所有的变量必须在DSP程序中定义,存在于仿真/实际目标板中,唯一不在目标板上定义的标识符是GEL函数及其参数。GEL函数可在任何能键入C表达式的地方调用,既可以在任何可键入C表达式的对话框中调用,也可以在其他GEL函数中调用。但不支持递归。可以将常用的GEL函数添加到CCS的GEL菜单下,此时需要使用menuitem关键词在GEL菜单下创建一个新的下拉菜单列表(一级菜单),再使用hotmenu,dialog和slider在该菜单项中添加新的菜单项(二级菜单)。在CCS启动是自动执行GEL函数。SETUPCCS时设置环境时设置了自动执行GEL函数。自动运行StartUp()函数。这样要求每个工程建立时都载入GEL文件。CCS提供了一系列嵌入GEL的函数。使用这些函数,用户可以控制仿真/实际目标板的状态,访问存储器,并在输出窗口中显示结果。5.ProbePoint的应用ProbePoint只是暂时中断程序的运行,更新与之相连接的窗口,然后自动运行以后的程序。与之相连接的窗口可在ProbePoint设置中设置好,然后replace。可使用ProbePoint从PC文件中导入数据,也可存储数据到PC文件中,对PC文件的格式只能使用两种:COFF程序文件(.out);CCS数据文件(.dat)。可利用ProbePoint和BreakPoint配合显示图形和动画。显示图形使用View->Graph->Time/Frequency,设置好跳出的对话框,可看到一块内存的数据,可使用ProbePoint将PC上的数据传给目标板,然后继续运行程序。然后可以创建断点,使图形窗口自动更新,使用Animate命令,使到达断点后更新窗口后程序自动继续执行。1.用户库的创建:1>DOS命令:使用归档器ar2000命令和汇编编译连接等命令进行手工创建。2>CCS直接创建,在CCS中建立工程对话框的时候有一个可选择建立lib文件的选项。可直接把工程中的asm,c等文件直接整合生成一个库文件(不包括CMD文件)。第3章 DSP芯片的定点运算3.1 数的定标在定点DSP芯片中,采用定点数进行数值运算,其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长,一般为16位或24位。显然,字长越长,所能表示的数的范围越大,精度也越高。如无特别说明,本书均以16位字长为例。DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负,0表示数值为正,1则表示数值为负。其余15位表示数值的大小。因此二进制数1b=8195二进制数0b=-4对DSP芯片而言,参与数值运算的数就是16位的整型数。但在许多情况下,数学运算过程中的数不一定都是整数。那么,DSP芯片是如何处理小数的呢?应该说,DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢?当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。通过设定小数点在16位数中的不同位置,就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。从表3.1可以看出,同样一个16位数,若小数点设定的位置不同,它所表示的数也就不同。例如:16进制数2000H=8192,用Q0表示16进制数2000H=0.25,用Q15表示但对于DSP芯片来说,处理方法是完全相同的。从表3.1还可以看出,不同的Q所表示的数不仅范围不同,而且精度也不相同。Q越大,数值范围越小,但精度越高;相反,Q越小,数值范围越大,但精度就越低。例如,Q0的数值范围是-32768到+32767,其精度为1,而Q15的数值范围为-1到0.9999695,精度为1/32768=0.00003051。因此,对定点数而言,数值范围与精度是一对矛盾,一个变量要想能够表示比较大的数值范围,必须以牺牲精度为代价;而想提高精度,则数的表示范围就相应地减小。在实际的定点算法中,为了达到最佳的性能,必须充分考虑到这一点。浮点数与定点数的转换关系可表示为:浮点数(x)转换为定点数():定点数()转换为浮点数(x):例如,浮点数x=0.5,定标Q=15,则定点数=,式中表示下取整。反之,一个用Q=15表示的定点数16384,其浮点数为16384×2-15=16384/32768=0.5。表3.1 Q表示、S表示及数值范围Q表示S表示十进制数表示范围Q15S0.15-1≤X≤0.9999695Q14S1.14-2≤X≤1.9999390Q13S2.13-4≤X≤3.9998779Q12S3.12-8≤X≤7.9997559Q11S4.11-16≤X≤15.9995117Q10S5.10-32≤X≤31.9990234Q9S6.9-64≤X≤63.9980469Q8S7.8-128≤X≤127.9960938Q7S8.7-256≤X≤255.9921875Q6S9.6-512≤X≤511.9804375Q5S10.5-1024≤X≤1023.96875Q4S11.4-2048≤X≤2047.9375Q3S12.3-4096≤X≤4095.875Q2S13.2-8192≤X≤8191.75Q1S14.1-16384≤X≤16383.5Q0S15.0-32768≤X≤327673.2 高级语言:从浮点到定点在编写DSP模拟算法时,为了方便,一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数,又有浮点数。如例3.1程序中的变量i是整型数,而pi是浮点数,hamwindow则是浮点数组。例3.1 256点汉明窗计算int  i;float  pi=3.14159;float  hamwindow[256];for(i=0;i<256;i++) hamwindow[i]=0.54-0.46*cos(2.0*pi*i/255);如果要将上述程序用某种定点DSP芯片来实现,则需将上述程序改写为DSP芯片的汇编语言程序。为了DSP程序调试的方便及模拟定点DSP实现时的算法性能,在编写DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算的定点实现方法。3.2.1 加法/减法运算的C语言定点模拟设浮点加法运算的表达式为:floatx,y,z;z=x+y;将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值一样。若两者不一样,则在做加法/减法运算前先进行小数点的调整。为保证运算精度,需使Q值小的数调整为与另一个数的Q值一样大。此外,在做加法/减法运算时,必须注意结果可能会超过16位表示。如果加法/减法的结果超出16位的表示范围,则必须保留32位结果,以保证运算的精度。1.结果不超过16位表示范围设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法/减法结果z的定标值为Qz,则z=x+y ==所以定点加法可以描述为:intx,y,z;longtemp;  /*临时变量*/temp=y<<(Qx-Qy);temp=x+temp;z=(int)(temp>>(Qx-Qz)),若Qx≥Qzz=(int)(temp<<(Qz-Qx)),若QxQ≤z例3.2定点加法设x=0.5,y=3.1,则浮点运算结果为z=x+y=0.5+3.1=3.6;Qx=15,Qy=13,Qz=13,则定点加法为:x=16384;y=25395;temp=25395<<2=101580;temp=x+temp=16384+101580=117964;z=(int)(117964L>>2)=29491;因为z的Q值为13,所以定点值z=29491即为浮点值z=29491/8192=3.6。例3.3定点减法设x=3.0,y=3.1,则浮点运算结果为z=x-y=3.0-3.1=-0.1;Qx=13,Qy=13,Qz=15,则定点减法为:x=24576;y=25295;temp=25395;temp=x-temp=24576-25395=-819;因为QxQy,加法结果z的定标值为Qz,则定点加法为:intx,y;longtemp,z;temp=y<<(Qx-Qy);temp=x+temp;z=temp>>(Qx-Qz),若Qx≥Qzz=temp<<(Qz-Qx),若Qx≤Qz例3.4结果超过16位的定点加法设x=15000,y=20000,则浮点运算值为z=x+y=35000,显然z>32767,因此Qx=1,Qy=0,Qz=0,则定点加法为:x=30000;y=20000;temp=20000<<1=40000;temp=temp+x=40000+30000=70000;z=70000L>>1=35000;因为z的Q值为0,所以定点值z=35000就是浮点值,这里z是一个长整型数。当加法或加法的结果超过16位表示范围时,如果程序员事先能够了解到这种情况,并且需要保证运算精度时,则必须保持32位结果。如果程序中是按照16位数进行运算的,则超过16位实际上就是出现了溢出。如果不采取适当的措施,则数据溢出会导致运算精度的严重恶化。一般的定点DSP芯片都设有溢出保护功能,当溢出保护功能有效时,一旦出现溢出,则累加器ACC的结果为最大的饱和值(上溢为7FFFH,下溢为8001H),从而达到防止溢出引起精度严重恶化的目的。3.2.2 乘法运算的C语言定点模拟设浮点乘法运算的表达式为:floatx,y,z;z=xy;假设经过统计后x的定标值为Qx,y的定标值为Qy,乘积z的定标值为Qz,则z=xy==所以定点表示的乘法为:intx,y,z;longtemp;temp=(long)x;z=(temp×y)>>(Qx+Qy-Qz);例3.5定点乘法设x=18.4,y=36.8,则浮点运算值为z=18.4×36.8=677.12;根据上节,得Qx=10,Qy=9,Qz=5,所以x=18841;y=18841;temp=18841L;z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666;因为z的定标值为5,故定点z=21666即为浮点的z=21666/32=677.08。3.2.3 除法运算的C语言定点模拟设浮点除法运算的表达式为:floatx,y,z;z=x/y;假设经过统计后被除数x的定标值为Qx,除数y的定标值为Qy,商z的定标值为Qz,则z=x/y=所以定点表示的除法为:intx,y,z;longtemp;temp=(long)x;z=(temp<<(Qz-Qx+Qy))/y;例3.6定点除法设x=18.4,y=36.8,浮点运算值为z=x/y=18.4/36.8=0.5;根据上节,得Qx=10,Qy=9,Qz=15;所以有x=18841,y=18841;temp=(long)18841;z=(18841L<<(15-10+9))/18841=308690944L/18841=16384;因为商z的定标值为15,所以定点z=16384即为浮点z=16384/215=0.5。3.2.4 程序变量的Q值确定在前面几节介绍的例子中,由于x、y、z的值都是已知的,因此从浮点变为定点时Q值很好确定。在实际的DSP应用中,程序中参与运算的都是变量,那么如何确定浮点程序中变量的Q值呢?从前面的分析可以知道,确定变量的Q值实际上就是确定变量的动态范围,动态范围确定了,则Q值也就确定了。设变量的绝对值的最大值为,注意必须小于或等于32767。取一个整数n,使它满足则有Q=15-n例如,某变量的值在-1至+1之间,即<1,因此n=0,Q=15-n=15。确定了变量的就可以确定其Q值,那么变量的又是如何确定的呢?一般来说,确定变量的有两种方法:一种是理论分析法,另一种是统计分析法。1.理论分析法有些变量的动态范围通过理论分析是可以确定的。例如:(1)三角函数,y=sin(x)或y=cos(x),由三角函数知识可知,|y|≤1;(2)汉明窗,y(n)=0.54-0.46cos[2n/(N-1)],0≤n≤N-1。因为-1≤cos[2n/(N-1)]≤1,所以0.08≤y(n)≤1.0;(3)FIR卷积。y(n)=,设,且x(n)是模拟信号12位量化值,即有≤211,则≤211;(4)理论已经证明,在自相关线性预测编码(LPC)的程序 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 中,反射系数满足下列不等式:,i=1,2,…,p,p为LPC的阶数。2.统计分析法对于理论上无法确定范围的变量,一般采用统计分析的方法来确定其动态范围。所谓统计分析,就是用足够多的输入信号样值来确定程序中变量的动态范围,这里输入信号一方面要有一定的数量,另一方面必须尽可能地涉及各种情况。例如,在语音信号分析中,统计分析时就必须采集足够多的语音信号样值,并且在所采集的语音样值中,应尽可能地包含各种情况,如音量的大小、声音的种类(男声、女声)等。只有这样,统计出来的结果才能具有典型性。当然,统计分析毕竟不可能涉及所有可能发生的情况,因此,对统计得出的结果在程序设计时可采取一些保护措施,如适当牺牲一些精度,Q值取比统计值稍大些,使用DSP芯片提供的溢出保护功能等。3.2.5 浮点至定点变换的C程序举例本节通过一个例子来说明C程序从浮点变换至定点的方法。这是一个对语音信号(0.3kHz~3.4kHz)进行低通滤波的C语言程序,低通滤波的截止频率为800Hz,滤波器采用19点的有限冲击响应FIR滤波。语音信号的采样频率为8kHz,每个语音样值按16位整型数存放在insp.dat文件中。例3.7语音信号800Hz19点FIR低通滤波C语言浮点程序#includeconst intlength=180  /*语音帧长为180点=22.5ms@8kHz采样*/void filter(intxin[],intxout[],intn,floath[]);/*滤波子程序说明*//*19点滤波器系数*/static floath[19]={0.01218354,-0.009012882,-0.02881839,-0.04743239,-0.04584568,-0.008692503,0.06446265,0.1544655,0.2289794,0.257883,0.2289794,0.1544655,0.06446265,-0.008692503,-0.04584568,-0.04743239,-0.02881839,-0.009012882,0.01218354};static intx1[length+20];/*低通滤波浮点子程序*/void filter(intxin[],intxout[],intn,floath[]){inti,j;floatsum;for(i=0;iconstintlength=180;void filter(intxin[],intxout[],intn,inth[]);staticint h[19]={399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450,7503,5061,2112,-285,-1503,-1555,-945,-296,399};  /*Q15*/staticint x1[length+20];/*低通滤波定点子程序*/void filter(intxin[],intxout[],intn,inth[]){inti,j;longsum;for(i=0;i>15;}for(i=0;i<(n-1);i++)x1[n-i-2]=xin[length-i-1];}主程序与浮点的完全一样。3.3 DSP定点算术运算定点DSP芯片的数值表示是基于2的补码表示形式。每个16位数用1个符号位、i个整数位和15-i个小数位来表示。因此数00000010.10100000表示的值为=2.625,这个数可用Q8格式(8个小数位)来表示,它表示的数值范围为-128~+127.996,一个Q8定点数的小数精度为1/256=0.004。虽然特殊情况(如动态范围和精度要求)必须使用混合表示法,但是,更通常的是全部以Q15格式表示的小数或以Q0格式表示的整数来工作。这一点对于主要是乘法和累加的信号处理算法特别现实,小数乘以小数得小数,整数乘以整数得整数。当然,乘积累加时可能会出现溢出现象,在这种情况下,程序员应当了解数学里面的物理过程以注意可能的溢出情况。下面讨论乘法、加法和除法的DSP定点运算,汇编程序以TMS320C25为例。3.3.1 定点乘法2个定点数相乘时可以分为下列3种情况:1.小数乘小数Q15×Q15=Q30例3.9 0.5*0.5=0.250.;Q15×  0.;Q1500.000000000000=0.25;Q302个Q15的小数相乘后得到1个Q30的小数,即有2个符号位。一般情况下相乘后得到的满精度数不必全部保留,而只需保留16位单精度数。由于相乘后得到的高16位不满15位的小数精度,为了达到15位精度,可将乘积左移1位,下面是上述乘法的TMS320C25程序:LT  OP1;OP1=4000H(0.5/Q15)MPY  OP2;OP2=4000H(0.5/Q15)PACSACH  ANS,1;ANS=2000H(0.25/Q15)2.整数乘整数Q0×Q0=Q0例3.10 17×(-5)=-851=17×  1=-511111110101011=-853.混合表示法许多情况下,运算过程中为了既满足数值的动态范围又保证一定的精度,就必须采用Q0与Q15之间的表示法。比如,数值1.2345,显然Q15无法表示,而若用Q0表示,则最接近的数是1,精度无法保证。因此,数1.2345最佳的表示法是Q14。例3.11 1.5×0.75=1.12501.10000000000000=1.5  ;Q14×  00.11000000000000=0.75  ;Q140001.0000000000=1.125;Q28Q14的最大值不大于2,因此,2个Q14数相乘得到的乘积不大于4。一般的,若一个数的整数位为i位,小数位为j位,另一个数的整数位为m位,小数位为n位,则这两个数的乘积为(i+m)位整数位和(j+n)位小数位。这个乘积的最高16位可能的精度为(i+m)整数位和(15-i-m)小数位。但是,若事先了解数的动态范围,就可以增加数的精度。例如,程序员了解到上述乘积不会大于1.8,就可以用Q14数表示乘积,而不是理论上的最佳情况Q13。例3.11的TMS320C25程序如下:LT  OP1  ;OP1=6000H(1.5/Q14)MPY  OP2  ;OP2=3000H(0.75/Q14)PACSACH  ANS,1  ;ANS=2400H(1.125/Q13)上述方法为了保证精度均对乘的结果舍位,结果所产生的误差相当于减去1个LSB(最低位)。采用下面简单的舍入方法,可使误差减少二分之一。LT  OP1MPY  OP2PACADD  ONE,14  (上舍入)SACH  ANS,1上述程序说明,不管ANS为正或负,所产生的误差是1/2LSB,其中存储单元ONE的值为1。3.3.2 定点加法乘的过程中,程序员可不考虑溢出而只需调整运算中的小数点。而加法则是一个更加复杂的过程。首先,加法运算必须用相同的Q点表示;其次,程序员或者允许其结果有足够的高位以适应位的增长,或者必须准备解决溢出问题。如果操作数仅为16位长,其结果可用双精度数表示。下面举例说明16位数相加的两种途径。1.保留32位结果LAC  OP1  ;(Q15)ADD  OP2  ;(Q15)SACH  ANSHI  ;(高16位结果)SACL  ANSLO  ;(低16位结果)2.调整小数点保留16位结果LAC  OP1,15  ;(Q14数用ACCH表示)ADD  OP2,15  ;(Q14数用ACCH表示)SACH  ANS  ;(Q14)加法运算最可能出现的问题是运算结果溢出。TMS320提供了检查溢出的专用指令BV,此外,使用溢出保护功能可使累加结果溢出时累加器饱和为最大的整数或负数。当然,即使如此,运算精度还是大大降低。因此,最好的方法是完全理解基本的物理过程并注意选择数的表达方式。3.3.3 定点除法在通用DSP芯片中,一般不提供单周期的除法指令,为此必须采用除法子程序来实现。二进制除法是乘法的逆运算。乘法包括一系列的移位和加法,而除法可分解为一系列的减法和移位。下面来说明除法的实现过程。设累加器为8位,且除法运算为10除以3。除的过程就是除数逐步移位并与被除数比较的过程,在每一步进行减法运算,如果能减则将位插入商中。(1)除数的最低有效位对齐被除数的最高有效位。00001010-  0001100011110010(2)由于减法结果为负,放弃减法结果,将被除数左移一位再减。00010100-  0001100011111000(3)结果仍为负,放弃减法结果,被除数左移一位再减。00101000-  0001100000010000(4)结果为正,将减法结果左移一位后加1,作最后一次减。00100001-  0001100000001001(5)结果为正,将结果左移一位加1得最后结果。高4位代表余数,低4位表示商。00010011即商为0011=3,余数为0001=1。TMS320没有专门的除法指令,但使用条件减指令SUBC可以完成有效灵活的除法功能。使用这一指令的唯一限制是两个操作数必须为正。程序员必须事先了解其可能的运算数的特性,如其商是否可以用小数表示及商的精度是否可被计算出来。这里每一种考虑可影响如何使用SUBC指令的问题。下面给出两种不同情况下的TMS320C25除法程序。(1)分子小于分母DIV_A:LT  NUMERAMPY  DENOMPACSACH  TEMSGN  ;取商的符号LAC  DENOMABSSACL  DENOM  ;使分母为正ZALH  NUMERA  ;使分子为正ABSRPTK  14SUBC  DENOM  ;除循环15次SACL  QUOTLAC  TEMSGNBGEZ  A1  ;若符号为正,则完成ZACSUB  QUOTSACL  QUOT  ;若为负,则商为负A1:  RET这个程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN为暂存单元。(2)规定商的精度DIV_B:LT  NUMERAMPY  DENOMPACSACH  TEMSGN  ;取商的符号LAC  DENOMABSSACL  DENOM  ;使分母为正LACK  15ADD  FRACSACL  FRAC  ;计算循环计数器LAC  NUMERAABS  ;使分子为正RPT  FRACSUBC  DENOM  ;除循环16+FRAC次SACL  QUOTLAC  TEMSGNBGEZ  B1  ;若符号为正,则完成ZACSUB  QUOTSACL  QUOT  ;若为负,则商为负B1:  RET与DIV_A相同,这个程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN为暂存单元。FRAC中规定商的精度,如商的精度为Q13,则调用程序前FRAC单元中的值应为13。3.4 非线性运算的定点快速实现在数值运算中,除基本的加减乘除运算外,还有其他许多非线性运算,如对数运算、开方运算、指数运算、三角函数运算等,实现这些非线性运算的方法一般有:(1)调用DSP编译系统的库函数;(2)查表法;(3)混合法。下面分别介绍这三种方法。1.调用DSP编译系统的库函数TMS320C2X/C5X的C编译器提供了比较丰富的运行支持库函数。在这些库函数中,包含了诸如对数、开方、三角函数、指数等常用的非线性函数。在C程序中(也可在汇编程序中)只要采用与库函数相同的变量定义,就可以直接调用。例如,在库函数中,定义了以10为底的常用对数log10():#includedouble log10(doublex);在C程序中按如下方式调用:floatx,y;x=10.0;y=log10(x);从上例可以看出,库函数中的常用对数log10()要求的输入值为浮点数,返回值也为浮点数,运算的精度完全可以保证。直接调用库函数非常方便,但由于运算量大,很难在实时DSP中得到应用。2.查表法在实时DSP应用中实现非线性运算,一般都采取适当降低运算精度来提高程序的运算速度。查表法是快速实现非线性运算最常用的方法。采用这种方法必须根据自变量的范围和精度要求制作一张表格。显然输入的范围越大,精度要求越高,则所需的表格就越大,即存储量也越大。查表法求值所需的计算就是根据输入值确定表的地址,根据地址就可得到相应的值,因而运算量较小。查表法比较适合于非线性函数是周期函数或已知非线性函数输入值范围这两种情况,例3.12和例3.13分别说明这两种情况。例3.12已知正弦函数y=cos(x),制作一个512点表格,并说明查表方法。由于正弦函数是周期函数,函数值在-1至+1之间,用查表法比较合适。由于Q15的表示范围为-1至32767/32768之间,原则上讲-1至+1的范围必须用Q14表示。但一般从方便和总体精度考虑,类似情况仍用Q15表示,此时+1用32767来表示。(1)产生512点值的C语言程序如下所示:#define N 512#define pi 3.14159int sin_tab[512];void main(){inti;for(i=0;i>20。例3.13用查表法求以2为底的对数,已知自变量取值范围为0.5~1,要求将自变量范围均匀划分为10等分。试制作这个表格并说明查表方法。(1)做表:y=log2(x),由于x在0.5到1之间,因此y在-1到0之间,x和y均可用Q15表示。由于对x均匀划分为10段,因此,10段对应于输入x的范围如表3.2所示。若每一段的对数值都取第1点的对数值,则表中第1段的对数值为y0(Q15)=(int)(log2(0.5)×32768),第2段的对数值为y1(Q15)=(int)(log2(0.55)×32768),依次类推。表3.2 logtab010点对数表(输入0.5~1)地址输入值对数值(Q15)00.50~0.55-3276810.55~0.60-2826220.60~0.65-2414930.65~0.70-2036540.70~0.75-1686250.75~0.80-1360060.80~0.85-1054970.85~0.90-768380.90~0.95-498190.95~1.00-2425(2)查表:查表时,先根据输入值计算表的地址,计算方法为:index=((x-16384)×20)>>15。式中,index就是查表用的地址。例如,已知输入x=26869,则index=6,因此y=-10549。3.混合法(1)提高查表法的精度上述方法查表所得结果的精度随表的大小而变化,表越大,则精度越高,但存储量也越大。当系统的存储量有限而精度要求也较高时,查表法就不太适合。那么能否在适当增加运算量的情况下提高非线性运算的精度呢?下面介绍一种查表结合少量运算来计算非线性函数的混合法,这种方法适用于在输入变量的范围内函数呈单调变化的情形。混合法是在查表的基础上采用计算的方法以提高当输入值处于表格两点之间时的精度。提高精度的一个简便方法是采用折线近似法,如图3.1所示。仍以求以2为底的对数为例(例3.13)。设输入值为x,则精确的对数值为y,在表格值的两点之间作一直线,用y'作为y的近似值,则有:y'=y0+y其中y0由查表求得。现在只需在查表求得y0的基础上增加y即可。y的计算方法如下:y=(x/x0)y=x(y0/x0)式中y0/x0对每一段来说是一个恒定值,可作一个表格直接查得。此外计算x时需用到每段横坐标的起始值,这个值也可作一个表格。这样共有三个大小均为10的表格,分别为存储每段起点对数值的表logtab0、存储每段y0/x0值的表logtab1和存储每段输入起始值x0的表logtab2,表logtab1和表logtab2可用下列两个数组表示:int  logtab1[10]={22529,20567,18920,17517,16308,15255,14330,13511,12780,12124}; /*y0/x0:Q13*/int  logtab2[10]={16384,18022,19660,21299,22938,24576,26214,27853,29491,31130}; /*x0:Q15*/综上所述,采用混合法计算对数值的方法可归纳为:①根据输入值,计算查表地址:index=((x-16384)×20)>>15;②查表得y0=logtab0[index];③计算x=x-logtab2[index];④计算y=(x×logtab1[index])>>13;⑤计算得结果y=y0+y。例3.14已知x=0.54,求log2(x)。0.54的精确对数值为y=log2(0.54)=-0.889。混合法求对数值的过程为:①定标Q15,定标值x=0.54*32768=17694;②表地址index=((x-16384)×20)>>15=0;③查表得y0=logtab0[0]=-32768;④计算x=x-logtab2[0]=17694-16384=1310;⑤计算y=(xlogtab1[0])>>13=(1310*22529L)>>13=3602;⑥计算结果y=y0+y=-32768+3602=-29166。结果y为Q15定标,折算成
本文档为【DSP芯片的定点运算】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_321635
暂无简介~
格式:doc
大小:279KB
软件:Word
页数:0
分类:
上传时间:2021-05-18
浏览量:62