dsp定点运算基本方法

2024-07-14 20:59| 来源: 网络整理| 查看: 265

一ＤＳＰ定点算数运算 1 数的定标在定点DSP芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长，一般为16位或24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以16位字长为例。 DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负，0表示数值为正，l则表示数值为负。其余15位表示数值的大小。因此，二进制数0010000000000011b=8195 二进制数1111111111111100b= -4 对DSP芯片而言，参与数值运算的数就是16位的整型数。但在许多情况下，数学运算过程中的数不一定都是整数。那么，DSP芯片是如何处理小数的呢？应该说，DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢？当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。通过设定小数点在16位数中的不同位置，就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表1.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。从表1.1可以看出，同样一个16位数，若小数点设定的位置不同，它所表示的数也就不同。例如， 16进制数2000H=8192，用Q0表示 16进制数2000H=0.25，用Q15表示但对于DSP芯片来说，处理方法是完全相同的。从表1.1还可以看出，不同的Q所表示的数不仅范围不同，而且精度也不相同。Q越大，数值范围越小，但精度越高；相反，Q越小，数值范围越大，但精度就越低。例如，Q0 的数值范围是一32768到+32767，其精度为1，而Q15的数值范围为-1到0.9999695，精度为1/32768=0.00003051。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价；而想精度提高，则数的表示范围就相应地减小。在实际的定点算法中，为了达到最佳的性能，必须充分考虑到这一点。浮点数与定点数的转换关系可表示为：浮点数(x)转换为定点数(xq)：xq=(int)x* 2Q 定点数(xq)转换为浮点数(x)：x=(float)xq*2-Q 例如，浮点数x=0.5，定标Q=15，则定点数xq=L0.5*32768J=16384，式中LJ表示下取整。反之，一个用Q=15表示的定点数16384，其浮点数为163幼*2-15=16384/32768=0.5。浮点数转换为定点数时，为了降低截尾误差，在取整前可以先加上0.5。

表1.1 Q表示、S表示及数值范围 Q表示 S表示十进制数表示范围 Q15 S0.15 -1≤x≤0.9999695 Q14 S1.14 -2≤x≤1.9999390 Q13 S2.13 -4≤x≤3.9998779 Q12 S3.12 -8≤x≤7.9997559 Q11 S4.11 -16≤x≤15.9995117 Q10 S5.10 -32≤x≤31.9990234 Q9 S6.9 -64≤x≤63.9980469 Q8 S7.8 -128≤x≤127.9960938 Q7 S8.7 -256≤x≤255.9921875 Q6 S9.6 -512≤x≤511.9804375 Q5 S10.5 -1024≤x≤1023.96875 Q4 S11.4 -2048≤x≤2047.9375 Q3 S12.3 -4096≤x≤4095.875 Q2 S13.2 -8192≤x≤8191.75 Q1 S14.1 -16384≤x≤16383.5 Q0 S15.0 -32768≤x≤32767

2 高级语言：从浮点到定点我们在编写DSP模拟算法时，为了方便，一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数，又有浮点数。如例1.1程序中的变量i是整型数，而pi是浮点数，hamwindow则是浮点数组。例1.1 256点汉明窗计算 int i；+ float pi=3.14l59； float hamwindow[256]； for(i=0；i>(Qx-Qz)，若Qx>=Qz z=temp(Qx+Qy-Qz)；例1.5定点乘法。设x=18.4，y=36.8，则浮点运算值为=18.4*36.8=677.12；根据上节，得Qx=10，Qy=9，Qz=5，所以 x=18841；y=18841； temp=18841L； z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666；因为z的定标值为5，故定点z=21666，即为浮点的z=21666/32=677.08。 2.3除法运算的C语言定点摸拟设浮点除法运算的表达式为： float x，y，z； z=x/y；假设经过统计后被除数x的定标值为Qx，除数y的定标值为Qy，商z的定标值为Qz，则 z=x/y zq*2-Qz=(xq*2-Qx)/(yq*2-Qy) zq=(xq*2(Qz-Qx+Qy))/yq 所以定点表示的除法为： int x，y，z； long temp； temp=(long)x； z=(temp ++； printf(“=％d＼n”，)； for(i=0；i＜length；i++)indata=getw(fp1)； /*取一帧语音数据*/ filter(indata，outdata，19，h)；/*调用低通滤波子程序*/ for(i=0；i＜length；i++)putw(outdata，fp2)；/*将滤波后的样值写入文件*/ } fcloseall()；/*关闭文件*/ return(0)； } 例1.8语音信号800Hz l9点FIR低通滤波C语言定点程序。＃i nclude const int length=180； void filter (int xin[]，int xout[]，int n，int h[])； static int h[19]={399，-296，-945，-1555，-1503，-285，2112，5061，7503，8450， 7503，5061，2112，-285，-1503，-1555，-945，-296，399}；/*Q15*/ static int x1[length+20]； /*低通滤波定点子程序*/ void filter(int xin[]，int xout[]，int n，int h[]) int i，j； long sum； for(i=0；i＜length；i++)x1[n＋i-111=xin]； for(i=0；i＜1ength；i++) sum=0； for(j=0；j＜n；j++)sum+=(long)h[j]*x1[i-j＋n-1]； xout=sum>>15； for(i=0；i＜(n-1)；i＋＋)x1[n-i-2]=xin[length-i-1]； } 主程序与浮点的完全一样。“ 3 DSP定点算术运算定点DSP芯片的数值表示基于2的补码表示形式。每个16位数用l个符号位、i个整数位和15-i个小数位来表示。因此： 00000010.10100000 表示的值为： 21＋2-1＋2-3=2.625 这个数可用Q8格式(8个小数位)来表示，其表示的数值范围为-128至＋l27.996，一个Q8定点数的小数精度为1/256=0.004。虽然特殊情况(如动态范围和精度要求)必须使用混合表示法。但是，更通常的是全部以Q15格式表示的小数或以Q0格式表示的整数来工作。这一点对于主要是乘法和累加的信号处理算法特别现实，小数乘以小数得小数，整数乘以整数得整数。当然，乘积累加时可能会出现溢出现象，在这种情况下，程序员应当了解数学里面的物理过程以注意可能的溢出情况。下面我们来讨论乘法、加法和除法的DSP定点运算，汇编程序以TMS320C25为例。 3.1定点乘法两个定点数相乘时可以分为下列三种情况： 1. 小数乘小数例1.9 Q15*Q15=Q30 0.5*0.5=0.25 0.100000000000000；Q15 * 0.100000000000000；Q15 -------------------------------------------- 00.010000000000000000000000000000=0.25；Q30 两个Q15的小数相乘后得到一个Q30的小数，即有两个符号位。一般情况下相乘后得到的满精度数不必全部保留，而只需保留16位单精度数。由于相乘后得到的高16位不满15位的小数据度，为了达到15位精度，可将乘积左移一位，下面是上述乘法的TMS320C25程序： LT OP1；OP1=4000H(0.5/Q15) MPY OP2；oP2=4000H(0.5/Ql5) PAC SACH ANS，1；ANS=2000H(0.25/Q15) 2. 整数乘整数例1.10 Q0*Q0=Q0 17*(-5)=-85 0000000000010001=l7 *1111111111111011=-5 ------------------------------------------- 11111111111111111111111110101011=-85 3. 混合表示法许多情况下，运算过程中为了既满足数值的动态范围又保证一定的精度，就必须采用Q0与Q15之间的表示法。比如，数值1.2345，显然Q15无法表示，而若用Q0表示，则最接近的数是1，精度无法保证。因此，数1.2345最佳的表示法是Q14。例1.11 1.5*0.75= 1.125 01.10000000000000=1.5；Q14 *00.11000000000000=0.75；Q14 --------------------------------------- 0001.0010000000000000000000000000=1.125 Q28 Q14的最大值不大于2，因此，两个Q14数相乘得到的乘积不大于4。一般地，若一个数的整数位为i位，小数位为j位，另一个数的整数位为m位，小数位为n位，则这两个数的乘积为(i+m)位整数位和(j+n)位小数位。这个乘积的最高16位可能的精度为(i＋m)整数位和(15- i- m)小数位。但是，若事先了解数的动态范围，就可以增加数的精度。例如，程序员了解到上述乘积不会大于1.8，就可以用Q14数表示乘积，而不是理论上的最佳情况Q13。例3.11的TMS320C25程序如下： LT OP1；OP1 = 6000H(1.5/Ql4) MPY OP2；OP2 = 3000H(0.75/Q14) PAC SACH ANS，1；ANS=2400H(1.125/Q13) 上述方法，为了精度均对乘的结果舍位，结果所产生的误差相当于减去一个LSB(最低位)。采用下面简单的舍人方法，可使误差减少二分之一。 LT OP1 MPY OP2 PAC ADD ONE，14(上舍入) SACH ANS，1 上述程序说明，不管ANS为正或负，所产生的误差是l/2 LSB，其中存储单元ONE的值为1。 3.2定点加法乘的过程中，程序员可不考虑溢出而只需调整运算中的小数点。而加法则是一个更加复杂的过程。首先，加法运算必须用相同的Q点表示，其次，程序员或者允许其结果有足够的高位以适应位的增长，或者必须准备解决溢出问题。如果操作数仅为16位长，其结果可用双精度数表示。下面举例说明16位数相加的两种途径。 1.保留32位结果 LAC OP1；(Q15) ADD OP2；(Ql5) SACH ANSHI ；(高16位结果) SACL ANSLO ：(低16位结果) 2.调整小数点保留16位结果 LAC OP1，15；(Q14数用ACCH表示) ADD OP2，15；(Q14数用ACCH表示) SACH ANS；(Q14) 加法运算最可能出现的问题是运算结果溢出。TMS320提供了检查溢出的专用指令BV，此外，使用溢出保护功能可使累加结果溢出时累加器饱和为最大的整数或负数。当然，即使如此，运算精度还是大大降低。因此，最好的方法是完全理解基本的物理过程并注意选择数的表达方式。 3.3定点除法在通用DSP芯片中，一般不提供单周期的除法指令，为此必须采用除法子程序来实现。二进制除法是乘法的逆运算。乘法包括一系列的移位和加法，而除法可分解为一系列的减法和移位。下面我们来说明除法的实现过程。设累加器为8位，且除法运算为10除以3。除的过程包括与被除法有关的除数逐步移位，在每一步进行减法运算，如果能减则将位插入商中。 (1)除数的最低有效位对齐被除数的最高有效位。 0000l0l0 - 00011000 -------------------------------------- 11110010 (2)由于减法结果为负，放弃减法结果，将被除数左移一位，再减。 00010100 - 00011000 ---------------------------------------- 11111000 (3)结果仍为负，放弃减法结果，被除数左移一位，再减。 00101000 - 00011000 ------------------------------------------ 00010000 (4)结果为正，将减法结果左移一位后加1，作最后一次减。 00100001 - 00011000 ---------------------------------------- 00001001 (5)结果为正，将结果左移一位加1 得最后结果。高4位代表余数，低4位表示商。 00010011 即，商为0011= 3.余数为0001= 1。 TMS320没有专门的除法指令，但使用条件减指令SUBC可以完成有效灵活的除法功能。使用这一指令的唯一限制是两个操作数必须为正。程序员必须事先了解其可能的运算数的特性，如其商是否可以用小数表示及商的精度是否可被计算出来。这里每一种考虑可影响如何使用SUBC指令的问题。下面我们给出两种不同情况下的TMS320C25除法程序。 (1)分子小于分母 DIV_A： LT NUMERA MPY DENOM PAC SACH TEMSGN；取商的符号 LAC DENOM ABS SACL DENOM；使分母为正 ZALH NUMERA；分子为正 ABS RPTK 14 SUBC DENOM；除循环15次 SACL QUOT LAC TEMSGN BGEZ A1；若符号为正，则完成 ZAC SUB QUOT SACL QUOT；若为负，则商为负 A1： RET 这个程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN为暂存单元。 (2)规定商的精度 DIV_B: LT NUMERA MPY DENOM PAC SACH TEMSGN；取商的符号 LAC DENOM ABS SACL DENOM; 使分母为正 LACK 15 ADD FRAC SACL FRAC；计算循环计数器 LAC NUMERA ABS ; 使分子为正 RPT FRAC SUBC DENOM; 除循环16＋FRAC次 SACL QUOT LAC TEMSGN BGEZ B1;若符号为正，则完成 ZAC SUB QUOT SACL QUOT；若为负，则商为负 B1： RET 与DIV_A相同，这个程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN为暂存单元。FRAC中规定商的精度，如商的精度为Q13，则调用程序前FRAC单元中的值应为13。 4 非线性运算的定点快速实现在数值运算中，除基本的加减乘除运算外，还有其它许多非线性运算，如，对数运算，开方运算，指数运算，三角函数运算等，实现这些非线性运算的方法一般有：(1)调用DSP编译系统的库函数；(2)查表法；(3)混合法。下面我们分别介绍这三种方法。 1.调用DSP编译系统的库函数 TMS320C2X/C5X的C编译器提供了比较丰富的运行支持库函数。在这些库函数中，包含了诸如对数、开方、三角函数、指数等常用的非线性函数。在C程序中(也可在汇编程序中)只要采用与库函数相同的变量定义，就可以直接调用。例如，在库函数中，定义了以10为底的常用对数log10()：＃i nclude＜math.h＞ double，log10(double x)；在C程序中按如下方式调用： float x，y; X=10.0; y=log10(x)；从上例可以看出，库函数中的常用对数log10()要求的输入值为浮点数，返回值也为浮点数，运算的精度完全可以保证。直接调用库函数非常方便，但由于运算量大，很难在实时DSP中得到应用。 2.查表法在实时DSP应用中实现非线性运算，一般都采取适当降低运算精度来提高程序的运算速度。查表法是快速实现非线性运算最常用的方法。采用这种方法必须根据自变量的范围和精度要求制作一张表格。显然输人的范围越大，精度要求越高，则所需的表格就越大，即存储量也越大。查表法求值所需的计算就是根据输入值确定表的地址，根据地址就可得到相应的值，因而运算量较小。查表法比较适合于非线性函数是周期函数或已知非线性函数输入值范围这两种情况、例1.12和例1. 13分别说明这两种情况。例1.12 已知正弦函数y=cos(x)，制作一个512点表格，并说明查表方法。由于正弦函数是周期函数，函数值在-1至+1之间，用查表法比较合适。由于Q15的表示范围为1-至32767/32768之间，原则上讲-1至＋1的范围必须用Q14表示。但一般从方便和总体精度考虑，类似情况仍用Q15表示，此时+1用32767来表示。 (1)产生5l2点值的C语言程序如下所示。 #define N 512 #define pi 3.14l59 int sin_tab[5l2]； void main() { int i; for(i=0；i＜N；i++)sin_tab=(int)(32767*sin(2*pi*i/N))； (2)查表查表实际上就是根据输人值确定表的地址。设输入x在0~2π之间，则x对应于512点表的地址为：index=(int)(512*x/2π)，则y=sin(x)=sin_tab[index]如果x用Q12定点数表示，将512/2π用Q8表示为20861，则计算正弦表的地址的公式为。 index=(x*20861L)>>20；例1.12用查表法求以2为底的对数，已知自变量值范围为0.5-1，要求将自变量范围均匀划分为10等分。试制作这个表格并说明查表方法。 (1)作表： y=log2(x)，由于x在0.5到1之间，因此y在-1到0之间，x和y均可用Q15表示。由于对x均匀划分为10段，因此，10段对应于输入x的范围如表3.2所示。若每一段的对数值都取第一点的对数值，则表中第一段的对数值为y0(Q15)=(int)(log(O.5)*32768)，第二段的对数值为y1(Q15)=(int)(log2(0.55)*32768)，依次类推，如表3.2所示。 (2)查表：查表时，先根据输人值计算表的地址，计算方法为： index=((x-16384)*20)>>15；式中， index就是查表用的地址。例如，已知输人x=26869，则index=6，因此，y= -10549。

表1.2 logtab0 10点对数表地址输入值对数值(Q15) 0 0.50-0.55 -32768 1 0.55-0.60 -28262 2 0.60-0.65 -24149 3 0.65-0.70 -20365 4 0.70-0.75 -16862 5 0.75-0.80 -13600 6 0.80-0.85 -10549 7 0.85-0.90 -7683 8 0.90-0.95 -4981 9 0.95-1.00 -2425

3.混合法 (1)提高查表法的精度上述方法查表所得结果的精度随表的大小而变化，表越大，则精度越高，但存储量也越大。当系统的存储量有限而精度要求也较高时，查表法就不太适合。那么能否在适当增加运算量的情况下提高非线性运算的精度呢？下面介绍一种查表结合少量运算来计算非线性函数的混合法，这种方法适用于在输入变量的范围内函数呈单调变化的情形。混合法是在查表的基础上来用计算的方法以提高当输入值处于表格两点之间时的精度。提高精度的一个简便方法是采用折线近似法，如图1.1所示。图1.1提高精度的折线近似法” 仍以求以2为底的对数为例(例1.12)。设输入值为x，则精确的对数值为y，在表格值的两点之间作一直线，用y'作为y的近似值，则有： y'=y0＋△y 其中y0由查表求得。现在只需在查表求得y0的基础上增加△y既可。△y的计算方法如下： △y=(△x/△x0)△y=△x(△y0/△x0) 其中△y0/△x0对每一段来说是一个恒定值，可作一个表格直接查得。此外计算此时需用到每段横坐标的起始值，这个值也可作一个表格。这佯共有三个大小均为10的表格，分别为存储每段起点对数值的表logtab0、存储每段△y0/△x0值的表logtab1和存储每段输入起始值x0的表logtab2，表logtab1和表logtab2可用下列两个数组表示。 int logtab1[10]={22529，20567，18920，17517，16308， 15255，14330，13511，12780，12124}；/*△y0/△x0：Q13*/ int logtab2[10]={16384，18022，19660，21299，22938， 24576，26214，27853，29491，31130}；/*x0：Q15*/ 综上所述，采用混合法计算对数值的方法可归纳为： (1)根据输人值，计算查表地址：index=((x-16384)*20)>>15； (2)查表得y0=logtab0[index]； (3)计算△x=x-logtab2[index]； (4)计算△y=(△x*logtab1[index])>>13； (5)计算得结果y=y0＋△y。例1.13已知x=0.54，求log2(x)。 0.54的精确对数值为y=log2(0.54)=-0.889。混合法求对数值的过程为： (1)定标Q15，定标值x=0.54*32768=17694； (2)表地址index=((x-16384)*20)>>15=0； (3)查表得y0=logtab0[0]=-32768； (4)计算△x=x-logtab2[0]=17694-16384=1310； (5)计算△y=(△xlogtab1[0]>>13=(13l0*22529L)>>13=3602 (6)计算结果y=y0＋△y=-32768＋3602=-29166。结果y为Q15定标，析算成浮点数为-29166/32768=-0.89，可见精度较高。 (2)扩大自变量范围如上所述，查表法比较适用于周期函数或自变量的动态范围不是太大的情形。对于像对数这样的非线性函数，输入值和函数值的变化范围都很大。如果输入值的变化范围很大，则作表就比较困难。那么能否比较好地解决这个问题，即不便表格太大，又能得到比较高的精度呢？下面我们来讨论一种切实可行的方法。设x是一个大于0.5的数，则x可以表示为下列形式： x=m*2e 式中，0.5

【本文地址】

公司简介

联系我们