附录2 SPSS
函数
excel方差函数excelsd函数已知函数 2 f x m x mx m 2 1 4 2拉格朗日函数pdf函数公式下载
SPSS函数有十类一百多个,根据不同版本函数的数量有所增减。这些函数用符号或者字母表示出函数类型。
函数的表示方法:函数的一般表达方式是在函数关键字后面括号中写入函数自变量。
函数自变量:函数自变量可以是单值或变量名以及算术表达式的形式。如果使用变量名或带有变量名的表达式作为自变量,则必须在使用该函数之前对这些变量赋值,使函数类型为数值型。
下面将重点介绍算术函数和统计函数,并对一些常用的SPSS函数给出一般性的解释。
1.ArithmeticFunctions算术函数
算术函数是最常用的函数,可以满足对变量进行的一般运算,算术函数主要有:
函数名
自变量涵义
函数类型
函数功能及说明
ABS(numexpr)
(算术表达式)﹡
数值型函数
求绝对值,例如:ABS(Y-850):将分别计算变量Y的每个数据与20的差的绝对值
ARSIN(numexpr)
(角度;弧度单位)
数值型函数
求反正弦值,例如:ARSIN(1)=
/2
ARTAN(numexpr)
(角度;弧度单位)
数值型函数,
求反正切值,例如ARTAN(1)=
/4:
COS(radians)
(角度;弧度单位)
数值型函数
求余弦值,例如:COS(
)= -1
EXP(numexPr)
(算术表达式)
数值型函数
求e的指数幂值。例如:Exp(4)=e4=54.60。注意:若函数值太大,其结果会超出SPSS的计算范围。
LGl0(numexp)
(算术表达式)
数值型函数
求以10为底的对数值。例如:Ln(Y):分别计算变量Y中每个数据的以10 为底的对数值
LN(numexpr)
(算术表达式)
数值型函数
求以e为底的对数。例如:Ln(Y):分别计算变量Y中每个数据的自然对数值
MOD(numexpr,modulus)
(算术表达式;摸数(常数))
数值型函数
求算术表达式除以模数的余数。例如:Mod(10.3):函数值=1
SIN(radians)
(角度;弧度单位)
数值型函数
求正弦值。例如:Sin(
)= 0
SQRT(numexpr)
(正数)
数值型函数
求平方根。例如:Sqrt(9)=3
RND(numexpr)
(算术表达式)
数值型函数
求算术表达式的值四舍五入后的整数。例如:RND(2.72)=3
TRUNC(numexpr)
(算术表达式)
数值型函数
求算术表达式的值被截去小数部分的整数。例如:Trunc(2.72)=2
﹡算术表达式也包括单值与变量名的情况。
2.StatisticalFunctions统计函数
统计函数也是统计分析中常用的函数之一,主要反映变量的数据特征,时间序列的滞后期变量等,具体函数有:
函数名
自变量涵义
函数类型
函数功能与说明
CFVAR(numexpr,numexpr,...)
(变量名,变量名,...)
数值型函数
求出多个变量值的变异系数(标准差/均值) 。例如Cfvar(数学,物理,化学):分别计算每个学生三门成绩的变异系数
LAG(variable)
(变量名)
数值型函数或字符型函数
返回滞后一期的变量数据。对第一个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格。
LAG(variable,ncases)
(变量名,自然数n)
数值型函数
返回滞后n期的变量数据。对第前n个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格。
MAX(ivalue,value[,...])
(变量名,变量名,…)
数值型函数
求多个变量值中的最大值;例如MAX(数学,物理,化学):分别计算每个学生三门成绩中的最高分
MEAN(numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数
求多个变量值的平均值;例如MEAN(数学,物理,化学):分别计算每个学生三门成绩的平均值
MIN(value,value[,...])
(变量名,变量名,…)
数值型函数
求多个变量值中的最小值;例如Min(数学,物理,化学):分别计算每个个案三门成绩中的最低分
NVALID(variable, variable,...)
(变量名,变量名,…)
数值型函数
求出变量的(不包括缺失值)的数量
SD(numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数
求多个变量值的标准差;例如SD(数学,物理,化学):分别计算每个学生三门成绩的标准差
SUM(numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数
求多个变量值的和;例如Sum(数学,物理,化学):分别计算每个个案三门成绩的总和
VARIANCE((numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数,
求多个变量值的方差;例如Variance(数学,物理,化学):分别计算每个学生三门成绩的方差
3.LogicalFunctions逻辑函数
● ANY(test,valu,value,…]) 逻辑型函数,自变量为 (变量名,x1,x2,…),函数功能是判断变量值是否是x1、x2…中的一个,例如:Any(数学,80,90,70):分别对每条个案判断其数学成绩是否为80或 90或70分。
● RANGE(test,lo,hi[,10,hi...] 逻辑型函数变量必须都为数值型或都为字符型,自变量为(变量名,x1,x2),其中:x1≤x2,函数功能是判断某变量值是否在x1至x2之间,例如:RANGE (数学,80,90):分别对每条个案判断其数学成绩是否在80至90分之间
4.DateandTimeFunctions日期和时间函数
● DATE.DMY (day,month,year)SPSS日期型格式的数值函数,返回与指定的日、月、年相应的日期值。要正确显示这个值,必须将变量赋予DATE格式。自变量必须为整数。day的范围在1~31,month的范围在1~12,year的范围在4位数时要大于1582,2位数时应是该世纪的后两位年代数值。
● DATE.YRDAY(year,daynum)SPSS格式日期型数值函数,返回与指定的天数、年相应的日期值。要正确显示这个值,必须赋予其DATE格式。Daynum取值范围在1~366。
● XDATE.DATE(datevalue)SPSS日期格式的数值型函数,从具有SPSS的日期格式的自变量数值返回一个日期,自变量数值由DATE.xxx函数产生或按DATEs输入格式读取。该函数用于将日期的数值格式转换为日期格式,因此要想按日期格式显示必须再在Variable View中定义一种日期格式,否则会按SPSS日期的数值格式显示。此函数无2000年问题21世纪的日期也能正确显示。
● XDATE.HOUR(datevalue)数值型函数,从DATE.xxx函数产生或按一种DATE格式读入的SPSS日期格式的数值,返回一个小时数(0~23)。
● XDATE.JDAY(datevalue)数值型函数,通过DATE.xxx产生或由DATE输入格式读入SPSS日期格式的数值,返回一年的天数(1~366)。
● XDATE.MDAY(datevalue)数值型函数,从一个SPSS日期格式的数值通过 DATE.xxx函数产生或由DATE输入格式读入,返回一个月的天数(1~31)。
● XDATE.MINUTE(datevalue)数值型函数,通过DATE.xxx产生或由DATE输入格式读入SPSS日期格式的数值,返回分钟数(0-59)。
● XDATE.MONTH(datevalue)数值型函数,通过DATE.xxx产生或由DATE输入格式读入SPSS日期格式的数值,返回一年中的月数(1~12)。
● XDATE.TDAY(timevalue)数值型函数,自变量是由TIME.XXX函数产生或由TIME输入格式读取的SPSS时间间隔格式的数值,返回整天数(正整数)。
● XDATE.TIME(datevalue)SPSS时间间隔格式的数值型函数,把自变量的值看作从午夜开始的秒数,返回一天中的时间(小时、分、秒)。自变量是SPSS日期格式的数值,可以是由DATE.xxx函数产生的或由DATE输入格式读入的。由该函数建立的变量应该给定一个合适的显示格式。在VariableView中,赋予它一个时间显示格式,将变量值显示成小时和分。
● XDATE.WEEK(datevalue)数值型函数。由一个SPSS日期格式数值(由DATE.xxx函数产生或由一种DATE输入格式读入),返回周数(1~53整数)。
● XDATE.WKDAY(datevalue)数值型函数,由一种通过DATE.xxx函数产生或用 DATE格式读入的SPSS日期格式数值,返回的数值表示一周的星期几(星期1~星期日用1~7之间的整数表示)。
● XDATE.YEAR(datevalue)数值型函数,由DATE.xxx函数产生或用DATE格式读入的SPSS日期格式的数值,返回年数。
● YRMODA(year,month,day)数值型函数,返回一个由1582年10月15日到自变量给定的年月日(year,month,day)之间的天数。
5.RandomVariableFunctions随机变量函数
随机变量函数的一般形式为:RV.分布名(参数,…)。其中圆点前是函数类名,圆点后是分布名称,圆点是半角的圆点,括号内是自变量。自变量是分布参数。如果在数据文件中建立新变量时使用这些函数,变量值的个数等于数据文件中有效观测量数。函数值为产生服从指定统计分布的随机序列。下面列出常用的分布函数的随机数。
● NORMAL(stddev)数值型函数,产生一个来自均值为0标准差为stddev的分布总体的随机数。
● RV.BERNOULLI(p)数值型函数,产生一个来自伯努利分布具有指定概率参数 P的随机数。
● RV.BINOM(n,p)数值型函数,产生一个来自二项式分布具有指定试验次数n和概率参数p的随机数。
● RV.CHISQ(df)数值型函数,产生一个来自卡方分布具有指定自由度df的随机数。
● RV.EXP(shape)数值型函数,产生一个来自指数分布具有指定形状参数的随机数。
● RV.F(df1,df2)数值型函数,产生一个来自F分布具有指定自由度的随机数。
● RV.GEOM(p)数值型函数,产生一个来自几何分布具有指定概率参数P的随机数。
● RV.HYPER(totd,sample,hits) 数值型函数,产生一个来自超几何分布具有指定参数的随机数。
● RV.LOGISTIC(mean,scale)数值型函数,产生一个来自逻辑斯蒂分布具有指定的均数mean和标度scale参数的随机数。
● RV.LNORMAL(a,b)数值型函数,产生一个来自对数正态分布具有指定参数的随机数。
● RV.NORMAL(mean,stddev)数值型函数,产生一个来自正态分布具有指定均值 mean和标准差stddev的随机数。
● RV.PARETO(threshold,shape)数值型函数,产生一个来自帕雷托分布具有指定临界值threshold和形状shape参数的随机数。
● RV.POISSON(mean)数值型函数,产生一个来自泊松分布具有指定均值或比率参数的随机数。
● RV.T(df)数值型函数,产生一个来自学生T分布具有指定自由度的随机数。
● RV.UNIFORM(min,max)数值型函数,产生一个来自具有指定最大值max和最小值mill的均匀一致分布的随机数.
● RV.WEIBULL(a,b)数值型函数,产生一个来自威布尔分布具有指定参数的随机数。
● UNIFORM(max)数值型函数,产生一个来自一致分布的值在0和自变量给定的Max之间的伪随机数。自变量Max必须是一个数值,但可以是负数。
6.InverseDistributionFunctions反分布函数
反分布函数的一般形式为:IDF.分布名(p,参数,…)。其中圆点前是函数类名,圆点后是分布名称,括号内是自变量。第一个自变量p 是这个分布的累积概率,其后的自变量是指定分布的参数。函数值是相应分布的累计概率值为p的临界值。
● IDF.CHISQ( (p,df)数值型函数,产生来自卡方分布的临界值,第一个自变量为概率值p,第二个自变量为自由度df。例如:累积概率为0.95,自由度为5的卡方分布的临界值记作IDF.CHISQ(0.95,5),其函数值IDF.CHISQ(0.95,5)=1.145。
● IDF.EXP(p,scale)数值型函数。产生一个来自指数分布的临界值,该分布具有给定行状参数shape,概率值p。
● IDF.F(p,dfl,df2)数值型函数,产生一个来自F分布的值,该分布自由度为dfl、 df2,累计概率p的临界值。例如显著性概率在0.05水平上,自由度分别为6、5的F值为IDF.F (0.95,6,5)=4.9503。
● DF.LOGISTIC(prob,mean,scale)数值型函数,产生一个均值为mean和标度参数为 scale,累计概率为p的逻辑斯蒂分布的临界值。
● IDF.LNORMAL(p,a,b)数值型函数,产生具有指定参数和累计概率p的对数正态分布的临界值。
● IDF.NORMAL(p,mean,stddev)数值型函数,产生来自正态分布具有指定均值和标准差的累计概率。例如,显著性水平为0.05,均值为0,标准差为1的标准正态分布的临界值IDF.NORMAL(0.95,0,1)=1.645。
● IDF.PARETO(prob,threshold,shape)数值型函数,产生一个来自帕累托分布,累计概率为p的值,该分布的临界值为threshold,尺度参数为scale。
● IDF.T(prob,df)数值型函数,产生一个自由度df,累计概率为p的来自学生T分布的临界值。
● IDF.UNIFORM(p,min,max)数值型函数,产生一个累计概率p的来自均匀分布的临界值,均匀分布的最大值max、最小值min。
● PROBIT(p)数值型函数,产生累计概率为p的标准正态分布的临界值。
7.CumulativeDistributionFunctions累计分布函数
累计分布函数的一般形式为:CDF.分布名(q,参数,…),其中圆点前是函数类名,圆点后是分布名称,括号内是自变量。第一个自变量q是符合分布的数值,后面的自变量是相应分布的参数。函数值是相应分布的随机变量取值小于等于q的概率值。
● CDF.BERNOULLI(q,p)数值型函数,产生来自具有给定概率参数p的伯努利分布,变量值小于q的累计概率值。
● CDF.BETA(q,shapel,shape2)数值型函数,产生来自Bate分布的变量取值小于q累计概率值,该分布具有给定的形状参数shapel、shape2。
● CDF.BINOM(q,n,p)数值型函数,产生来自二项分布的变量取值小于q的累计概率值,该分布具有给定每次实验成功的概率P,成功的实验次数是n,。当n=1时,该函数与CDF.BERNOULLI相同。
● CDF.CAUCHY(q,loc,scale)数值型函数,产生来自柯西分布的变量取值小于q的累计概率值,该分布具有给定的位置参数loc和标度参数scale。
● CDF.CHISQ(q,df)数值型函数,返回来自卡方分布的变量取值小于q的累计概率值,该分布具有给定的自由度df。
● CDF.EXP(q,shape)数值型函数,产生来自指数分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape。
● CDF.F(q,df1,df2)数值型函数,产生来自F分布的变量取值小于q的累计概率值,该分布具有给定的自由度dfl、df2,累计概率值小于quant。
● CDF.GAMMA(q,shape,scale)数值型函数,产生来自伽玛分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape和标度参数scale。
● CDF.GEOM(q,p)数值型函数,产生一个几何分布的变量取值小于q的累积概率,即获得一次成功的试验次数,当成功概率由p确定。
● CDF.HYPER(q,total,sample,hits)数值型函数,产生小于q的累积概率,即具有指定特性的事件数q,当样品sample事件是从尺寸为total的总体中随机选择出来的情况下,其命中数hits具有指定的特性。
● CDF.LAPLACE(q,mean,scale)数值型函数,产生来自拉普拉斯分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale。
● CDF.LOGISTIC(q,mean,scale)数值型函数,产生来自逻辑斯蒂分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale。
● CDF.LNORMAL(q,a,b)数值型函数,产生具有指定参数的对数正态分布变量取值小于q的累计概率值。
● CDF.NEGBIN(q,thresh,p)数值型函数。产生变量取值小于q的累计概率值,即当临界参数为 thresh,p给出成功的概率。
● CDFNORM(zvalue)数值型函数,产生一个具有均值为0,标准差为1的随机变量的取值小于zvalue的概率。
● CDF.NORMAL(q,mean,stddev)数值型函数,产生一个正态分布的变量取值小于q的累计概率,该分布均值为mean,标准差为stddev。
● CDF.PARETO(q,threshold,shape)数值型函数,产生一个变量取值小于q的帕雷托分布的累计概率,该分布具有指定的限值threshold和形状参数shape。
● CDF.POISSON(q,mean)数值型函数,产生一个来自POISSON分布的小于q的累计概率值,它具有指定的均值或率参数。
● CDF.T(q,df)数值型函数,产生一个变量取值小于q的学生T分布的累计概率,该分布具有指定的自由度参数df。
● CDF.UNIFORM(q,min,max)数值型函数,产生一个变量取值小于q的均匀一致分布的累计概率,该分布具有指定的最小值rain和最大值max参数。
● CDF.WEIBULL(q,a,b)数值型函数,产生一个变量取值小于q的威布尔分布的累计概率,该分布具有指定的参数。
8.MissingValueFunctions缺失值函数
● NMISS(variable,… )数值型函数,自变量是当前工作数据文件中的变量名。计算自变量中缺失值的数目。例如:Missing(数学):分别对数学这个变量逐个判断是否为系统缺失值或用户缺失值。l表示是,0为不是。
● MISSING(variable))逻辑型函数,自变量应该是工作数据文件中的变量名。如果变量具有缺失值,返回1或者true。
● SYSMIS(numvar))逻辑型函数,自变量numva是工作数据文件中的一个数值型变量的变量名。如果numvar的值为系统缺失值,返回1或者true。
● VALUE(variable )数值型或字符型函数,忽略用户定缺失值,即将用户缺失值看成是普通的数据,返回变量值。自变量必需是工作数据文件中的变量名。
9.StringFunctions字符串函数
● CONCAT(strexpr, strexpr,...)字符型函数,函数中每个自变量都是一个字符串表达式。该函数值是一个字符串,是各自变量代表的字符串按括号中的顺序串接起来的。此函数要求两个或两个以上的自变量。
● INDEX(haystack, needle)数值型函数,产生一个整数,它表明字符串needle在字符串 haystack中第一次出现的起始位置。如果返回值为0,表明字符串needle不在字符串haystack中存在。例如:INDEX(“ABCDEFG”,“DE”):找到字符串DE在字符串ABCDEFG中第一次出现的位置,INDEX(“ABCDEFG”,“DE”)=4
● INDEX(haystack, needle, divisor)数值型函数,见前一个函数。其第三个自变量divisor是可选择的,它必须是一个整数,表明将字符串needle均匀地分为要被查询的独立字符串的字符数。
● LENGTH(strexpr)数值型函数,自变量是字符串,函数值是字符串表达式值的长度。这里获得的长度包括尾部空格。
● LPAD(strexpr, length)字符型函数,第一个自变量strexpr是字符串,第二个自变量length是正整数,其范围从1到255。函数值是字符串表达式的左侧增加空格扩展到length所规定的长度。
● LTRIM(strexpr)字符型函数,返回的字符串是自变量表达式的值去除打头的空格后的字符串。
● LOWER(strexpr)字符型函数,返回字符串,将字符串中的大写字母改变为小写字母。
● RINDEX(haystack,needlel)数值型函数,产生一个整数,它表明字符串needle在字符串haystack中最后出现的开始位置。返回0表示字符串needle不在haystack中。
● RPAD(strexpr,length)字符型函数,返回字符串,其长度由length决定:在字符串表达式的右侧加空格,以达到length的长度,length的值在1到255之间。
● RPAD(strexpr,length,char)字符型函数,返回字符串,见前一个函数。第三个变量 char是可以选择使用的,它表示在字符串的右侧增加一个字符char。char必需是一个带有引号的单个字符或其值是单个字符的字符表达式。