第3章 非平稳随机过程
从本章起介绍计量经济学近20年来最新研究成果。如果把第1章内容称为经典计量经济学,那么将要介绍的内容则应该称为非经典计量经济学。
从1974年开始计量经济学工作者渐渐意识到当用含有单位根的时间序列建立经典计量经济模型时会出现一些问题,这就是虚假回归。
应该知道通过经济数据了解经济变量的变化规律有时是存在相当大的局限性的,所以在建立模型时,必须依靠经济理论,同时对
参数
转速和进给参数表a氧化沟运行参数高温蒸汽处理医疗废物pid参数自整定算法口腔医院集中消毒供应
进行假设检验。实际上,只有经济理论是不够的。比如处于调整中的经济变量,哪些是它的外生变量,哪些是它的无关变量,单凭经济理论就很难判别清楚。所以当研究经济变量参数变化规律时,常常采用另外一种方法,即依靠统计理论的方法,通过
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
具有某种特征的能生成数据的随机过程或数据生成系统研究经济问题。下面常常用到数据生成系统这个概念。
3.1 单积性
单积(整):若一个随机过程 {xt} 必须经过d次差分之后才能变换成一个平稳的可逆的ARMA过程,则称 {xt} 是d次单积(单整)过程。用xt ( I(d) 表示。
对于平稳过程表示为I(0)。注意:单积过程是指单积次数大于零的过程。
对于I(d) 过程xt
((L) (1- L) d xt = ((L) ut
因为含有d个单位根,所以常把时间序列单积次数的检验称为单位根检验(unit root test)。
若xt ( I(d),yt ( I(c),则
zt = (a xt + b yt) ( I (max[d, c]).
( zt = ( (a xt + b yt) = (a xt + b yt) - (a xt -1 + b yt - 1) = (a ( xt + b ( yt)
当 c > d 时,zt只有差分c次才能平稳。
一般来说,若xt ( I (c),yt ( I (c),则
zt = (a xt + b yt) ( I (c)
但也有zt的单积次数小于c的情形。当zt的单积次数小于c时,则称xt与yt存在协积(整)关系。
3.2单积过程的统计特征
以随机游走过程和平稳的AR(1)过程作比较,对于随机游走过程
xt = xt-1 + ut , x0 = 0, ut ( IN (0, (u2) (3.7)
有 xt = xt-2 + ut-1 + ut = … =
(具有永久记忆性)
Var(xt) =
= t(u2 (随T的增加,方差变为无穷大)
下面求xT 和 xT - k的(相隔k期的)相关系数(k 。
Cov(xT, xT-k) = E(xT xT-k) = E(
EMBED Equation.3 ) = E(
) = (T - k) (u2
(k =
=
=
=
只有当样本容量趋于无穷时,相关系数才等于1。有限样本条件下,特别是小样本条件下,随着滞后期k的增加,相关系数有所衰减。这正是在第2章求序列的自相关函数时看到的结果。
对于AR(1) 过程yt = (1 yt-1 + vt , ( (1( < 1, y0 = 0, vt ( IN(0, (v2) 有 (3.8)
yt = vt + (1vt-1 + (12 yt-2 = … =
(yt只有有限记忆力)
Var(yt) = E(
)2 =
(v2 (方差为有限值)
AR(1) 过程的自相关系数公式,(k =(1k,(推导见上一章)。
表3.1 随机游走过程和平稳的一阶自回归过程统计特征比较
随机游走过程
平稳的一阶自回归过程
方差
t(u2 (无限的)
(u2/(1-(12) (有限的)
自相关系数
(k =
( 1, ( k, T( (
(k =(1k
穿越零均值点的期望时间
无限的
有限的
记忆性
永久的
暂时的
3.3 虚假回归
⑴ 用蒙特卡罗模拟方法
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
相关系数的分布。
ut ( IN(0, 1), ut ( I (0)
vt ( IN(0, 1), vt ( I (0)
每次生成T=100的相互独立的{ut}和{vt},并计算Ruv。重复1万次,从而得到Ruv的分布。
xt = xt-1 + ut , x0 = 0, xt ( I (1)
yt = yt-1 + vt , y0 = 0, yt ( I (1)
利用{ut}和{vt},每次生成T=100的{xt}和{yt}并计算Rxy。重复1万次,从而得到Rxy的分布。
pt = pt-1 + xt , p0 = 0, pt ( I (2)
qt = qt-1 + yt , q0 = 0, qt ( I (2)
利用{xt}和{yt},每次生成T=100的{pt}和{qt}并计算Rpq。重复1万次,从而得到Rpq的分布。
1. 两个相互独立的I(0)变量{ut}和{vt}的相关系数Ruv的分布为正态(见图3.1a)。
2. 两个相互独立的I(1)变量{xt}和{yt}的相关系数Rxy的分布为倒U形(见图3.1b)。
3. 两个相互独立的I(2)变量{pt}和{qt}的相关系数Rpq的分布为U形(见图3.1c)。
图3.1a 图3.1b 图3.1c
问题的严重性在于当变量非平稳时,认为R服从的是正态分布,但实际上R服从的却是图3.1b和图3.1c那样的倒U和U字型分布,因此增加了拒绝概率,本不相关的两个变量结论却是相关!
图3.1三条曲线叠加示意图 图3.2 t(98)分布和虚假回归条件下的t分布
⑵ t统计量的分布
有如下数据生成系统
xt = xt-1 + ut , x0 = 0, ut ( IID(0, 1)
yt = yt-1 + vt , y0 = 0, vt ( IID (0, 1)
E(ui vj) = 0, ( i, j
可知xt和yt为I(1)变量且相互独立。作如下回归
yt = (0 + (1xt + wt ,
t(
)的分布见图3.2。拒绝(1 = 0的概率大大增加。从而造成虚假回归(Granger 1974年提出)。
⑶ 简单回归中(1 = 0的拒绝概率与变量单积阶数的关系
两变量的单积阶数
P(t(
)>2)
I(0) 与I(0)
0.045
I(1) 与I(1)
0.77
I(2) 与I(2)
0.95
⑷ 样本容量与虚假回归的关系(回归变量均为I(1)变量)
随样本容量变化,拒绝 (1 = 0的概率,即P(t(
) > 2 ) 见图3.3。
图3.3
⑸ 虚假回归的直观解释
因为上述数据生成系统是真实的,所以对于回归模型
yt = (0 + (1xt + wt
应有(1 = 0,即yt与xt不相关,则模型变为
yt = (0 + wt 。
已知yt ( I(1),wt ( I(0),所以yt = (0 + wt 两侧的单积阶数出现矛盾。导致(1无法表现为零。
3.4 单积过程的极限分布
维纳过程可看作是一个在 [0, 1] 区间内连续的随机游走过程。
定义:对于任意一个连续的随机过程V(i ),i ( 0,i ( [0, 1],如果满足以下四个条件。
⑴ 对于每个i ( 0,有E[V(i)] = 0。
⑵ 对于每个i ( 0,V(i) 都是正态分布的并且是非退化的。
⑶ V(i) 具有独立的增量。
⑷ P{V(0) = 0} = 1。
则称V(i )为布朗运动(Brownian motion)或Wiener过程,用W(i) 或B(i)表示。Norbert Wiener (1894-1964) 是研究随机过程的美国科学家,第二次世界大战时专门研究鱼雷击中潜艇的问题。Wiener过程是以他的名字命名的。
下面构造一个非平稳随机过程,然后介绍怎样把它变换成一个Wiener过程。
对于{ut}有ut ( IN(0, 1)。定义
xT =
, x0 = 0, ut ( IN(0, 1) (3.14)
由上式
xT = xT-1 + uT. (3.15)
xT 是一个随机游走过程,而且有
E(xT) = E(
) = 0, 满足条件(1) (3.16)
Var(xT) = E(xT2 ) = E[ (
)2 ] =
= T. (3.17)
因为当i = j时,E(ui uj) = 1,当i ( j 时,E(ui uj) = 0,xT是ut的线性函数,由(3.16)和(3.17)式
xT ( N(0, T ), 满足条件(2) (3.18)
由(3.14)和(3.15)式可知xT 是一个I(1) 过程,因为
xt – xt-1 = ut
增量是独立的,满足条件(3),根据定义x0 = 0,有
P{x0 = 0} = 1. 满足条件(4) 0 1
由(3.14)式定义的xT 满足上面给出的四个条件。
用xT 构造一个阶跃函数VT (i)。首先把区间 [0, T ] 映射到固定区间 [0, 1],然后把区间 [0, 1] 分成T个小区间,分点为0,1 / T,2 / T, … 1。
0 1 2 …. T
0 1/T 2/T …. 1
图1 区间[1,T ]映射到区间[0, 1]
定义
VT (i) =
, i ([0, 1] (3.19)
或
0, 0 ( i < 1/T
, 1/T ( i < 2/T
VT (i) = …. , (t-1)/T ( i < t /T
, (T-1) / T ( i < 1
, 1
其中 [T i ] 表示T i 的整数部分。比如T = 1000,i = 0.0204, 则 [T i ] = [20.4] = 20。VT (i) 在以i为起点的区间内是一个常数,VT (i) 是在泛函空间D[0, 1] 内定义的一个右连续的随机变量。随着T的增大,VT (i) 在区间 [0, 1] 内越来越密集。因为 [0, 1] 是固定的,所以VT (i) 变化的频度加大。当T → ∞ 时,
( W(i), i ( [0, 1], (3.20)
其中 ( 表示依概率弱收敛于。因定义ut ( IN(0, 1),W(i) 表示泛函空间D[0, 1] 中的
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
维纳过程。而( W(i) 称作方差为( 2的维纳过程。
连续映射定理:若f(() 是泛函空间D[0, 1] 中的一个连续函数,则由(3.20)有以下结论,当T → ∞ 时,
f (VT (i) ) ( f ( W(i) ). (3.21)
一般渐进理论与适用于非平稳过程的上述渐进理论的区别是对于前者样本矩收敛于一个常数,而对于后者标准化的样本矩收敛于一个随机变量。在推导非平稳随机过程的样本统计量的极限分布过程中泛函中心极限定理代替了传统的中心极限定理。
下面推导 T - 3 / 2
的极限分布。由(3.19)式
VT (i) =
, (
( i <
), 或 (t -1 ( T i ( t ) (3.22)
=
, ( t = 1, 2, …, T )
则VT (i) 是一个阶跃函数(阶跃始自 (t-1) / T, t = 1, 2, …, T )。在每一个阶跃内,函数值保持不变。
对于常数c有下式成立,
= c i
= c (
-
) =
.
则对于VT (i),
=
利用 (3.22) 式和上式,
=
= T - 3 / 2
(T个矩形面积之和)
利用上式,并根据连续映射定理,当T ( (,
T - 3 / 2
=
(
(3.23)
用类似的方法可以证明,当T ( (,
T -2
= T - 2
+ ut ) 2 = T -2
+ 2 xt-1 ut + ut2 )
= T -1
+ T -2
+ ut2 ) =
+ op(1)
(
(其中op(1) 表示依概率收敛于零) (3.24)
3.5 虚假回归的理论解释
给出如下数据生成系统
yt = yt-1 + ut , y0 = 0, ut ( IID (0, (u2)
xt = xt-1 + vt , x0 = 0, vt ( IID (0, (v2)
E(ui vj) = 0, ( i, j
xt和yt是相互独立的。对于以下回归
yt =
+
xt +
,
求
,
,t(
),R2,DW的极限分布。
首先介绍数量级概念。对于数列
{1, 1/2, 1/3, …, 1/T }
当T → ∞ 时,1/T → 0。所以1/T的数量级是O(T -1)。再看和式
= (1 + 2 + 3 + 4 … + T ) =
T (T + 1)
因为其中最大的项T 2 /2,所以这个和式是O(T 2)的。同理
=
T (T +1) (2T +1) = O(T 3)
= [
T (T +1) ] 2 = O(T 4)
对于随机过程yt = yt-1 + ut , y0 = 0, ut ( IID (0, (u2)
E(
) =
=
=
T (T +1) = O(T 2)
若想使
极限存在,就必须除以T 2。见结果 (3.24)。
当T ( (,
T - 3 / 2
= T - 3 / 2
+ ut + x0 ) = T - 3 / 2
+ T - 3 / 2
+ x0 )
= (v
+ op(1) ( (v
同理, 当T ( (,T -3/2
( (u
,
仿(3.24)式,当T ( (,
T -2
( (u 2
同理, 当T ( (,T -2
( (v 2
T -2
= T - 2
- (T - 3 / 2
)2 ( (u2 [
]2 di - (
di )2 ] ,
T -2
= T -2
- (T - 3 / 2
)2 ( (v2 [
]2 di - (
di )2 ]
当T( ∞,
T -2
= T -2
+ ut ) (xt-1 + vt )
= (u (v T -1
/ ((u T 1/ 2 ) ] [xt-1 / ((v T 1/ 2 ) ] + T - 2
+ xt - 1 ut + ut vt )
= (u (v
YT (i) XT (i) di + op(1)
= (u (v
di + op(1)
( (u (v
Wv (i) di. (3.49)
用泛函中心极限定理可以证明,当T ( (,有(给定条件ut , vt (IN (0,1), T = 50,100, 模拟10000次得
,
,t(
),R2,DW的分布模拟结果如下图。)
⑴ T -1/2
服从Wiener过程函数的分布,所以随着T的增大,
的分布发散。
(p130, (3.54) )。T=50,100的模拟结果
当T(∞时,有
T -1/2
( (u [
- (
]
⑵
服从Wiener过程函数的分布。因为表达式分子中两个Wiener过程相互独立,所以其最大可能取值为零。
(p129, (3.51) )。T=50,100的模拟结果
当T (∞时,得
(
EMBED Equation.3
⑶ 因为T -1/2 t(
) 的极限分布存在,所以t(
) 的分布发散。
(p131, (3.58) )。T=50,100的模拟结果
当T ( ∞ 时,
T -1/2 t(
) ( [
-
EMBED Equation.3 ]
( { [
- (
)2 ] - [
-
EMBED Equation.3 ]2 }1 / 2
⑷ R2有非退化的极限分布。不收敛于零。
(p132, (3.59) )。T=50,100的模拟结果
⑸ DW统计量依概率收敛于零。
(p132, (3.60) )。T=50,100的模拟结果
当T ( ∞时,DW ( 0
附录:数量级(阶数)和收敛速度
设 {aT}
是一个实数列,{gT}
是一个正实数列,则有如下定义。
1.如果
= 0,则称aT是gT的低阶数量级。记作aT = o(gT)。
2.如果存在实数M,且对于所有的T有
( M,则称aT的数量级不超过gT 。或aT的最大数量级是gT 。记作aT = O(gT)。
对于随机变量序列,数量级应是概率测度的数量级。设{xT}是一个随机变量序列,{gT}
定义如上。则有如下定义。
3.若对于任何( > 0,有
p{ ( xT - x ( > ( } = 0,则称 {xT} 依概率收敛于随机变量x,或xT的概率极限是x。记作
xT = x。
4.如果
(
) = 0,则称xT是gT的概率测度低阶数量级。记作xT是op(gT)的。
5.若对于任何( > 0,存在一个正实数M(,使
p{ (
( ( M(} ( (,则称xT的概率测度最大数量级不超过gT ,记作xT 是Op(gT)的。
在计量经济学的理论推导中,常用T( 表示gT。
当T→∞时,如果序列
(T)/T( →0,则定义
(T)的数量级低于T(。记为o(T()。如果序列
(T)/ T( 是有界的,则定义
(T)的最大数量级为T(。记为O(T()。
例,对于数列
= (1 + 2 + 3 + 4 … + T ) =
T (T + 1)
当T→∞时,因为
→
, 所以
是O(T 2)的。同理
= (1/6)T (T +1) (2T +1) 是O(T 3)的。
= [
T (T +1)] 2 是O(T 4) 的。
对于数列{
},因为当T→∞时,
→1,所以
是O(T -1)的。
对于随机游走过程yt = yt-1 + ut , y0 = 0, ut ( IID (0, ( 2),因为
E(
)=
=
=
T (T +1)
所以
是Op(T 2) 的。
本书常把随机数列{xT}看作是一个估计量序列。以OLS估计量为例,当变量具有平稳性,则{
- ( } = Op(T -1/2),即
T以速度T1/2 收敛于(。若变量具有非平稳性,则
以更快的速度依概率收敛于(。
对于残差平方和
,因为当T→∞ 时,
有界(表示方差),所以
是Op(T ) 的。
当gT退化为1时,数量级表示为op(1)或Op(1)。
T
1
8
_1051875679.unknown
_1069058537.unknown
_1069058637.unknown
_1202583887.unknown
_1202584538.unknown
_1202585605.unknown
_1202585620.unknown
_1202584052.unknown
_1202584488.unknown
_1097837158.unknown
_1097841967.unknown
_1097842731.unknown
_1097842647.unknown
_1097841294.unknown
_1069058654.unknown
_1069058584.unknown
_1069058620.unknown
_1069058555.unknown
_1052053540.unknown
_1052479693.unknown
_1069058524.unknown
_1052480060.unknown
_1052479021.unknown
_1052479122.unknown
_1052479653.unknown
_1052478656.unknown
_1052053040.unknown
_1052053059.unknown
_1051875905.unknown
_1051875967.unknown
_1052052812.unknown
_1051875940.unknown
_1051875895.unknown
_1051875784.unknown
_1021532543.unknown
_1051858467.unknown
_1051859165.unknown
_1051859667.unknown
_1051864634.unknown
_1051867771.unknown
_1051875308.unknown
_1051867648.unknown
_1051867761.unknown
_1051864268.unknown
_1051864282.unknown
_1051859389.unknown
_1051859214.unknown
_1051858963.unknown
_1051858985.unknown
_1021533093.unknown
_1021533136.unknown
_1051857570.unknown
_1051858453.unknown
_1021533170.unknown
_1026455820.unknown
_1021533250.unknown
_1021533152.unknown
_1021533121.unknown
_1021533131.unknown
_1021533097.unknown
_1021533025.unknown
_1021533084.unknown
_1021532920.unknown
_1021532962.unknown
_1017578251.unknown
_1017646718.unknown
_1018117160.unknown
_1018117351.unknown
_1018193378.unknown
_1021313336.unknown
_1021532532.unknown
_1018120833.unknown
_1018119456.unknown
_1018116420.unknown
_1018116362.unknown
_1018116114.unknown
_1018116145.unknown
_1017581062.unknown
_1017646187.unknown
_1017646219.unknown
_1017646675.unknown
_1017642902.unknown
_1017643074.unknown
_1017641938.unknown
_1017642044.unknown
_1017587043.unknown
_1017579282.unknown
_1017580973.unknown
_1017579254.unknown
_1006159682.unknown
_1017574964.unknown
_1017576862.unknown
_1017577258.unknown
_1017578171.unknown
_1017576643.unknown
_1017573011.unknown
_1017574900.unknown
_1007216894.unknown
_1002639445.unknown
_1005333128.unknown
_1006159678.unknown
_1006159680.unknown
_1005328534.unknown
_1005333125.unknown
_1002600653.unknown
_1002639395.unknown
_1002639412.unknown
_1002607246.unknown
_1002600488.unknown
_989906636.unknown