57830716 发表于 2018-9-12 16:49:15

低频数据向高频数据转换

本帖最后由 57830716 于 2018-9-13 09:45 编辑

低频数据向高频数据转换由于缺少信息,需要采取用插值方法,因此比较困难些。以将季度数据转换为月度数据为例来加以说明:
(1)阶梯函数方法(Constant),对于存量或指数类型的季度数据,直接将当季数据分别放入对应的3个月份里;对于流量类型的季度数据,将当季数据除3,即将当季数据平均值分别放入对应的3个月份里,这样转换得到月度曲线是阶梯式的。
(2)线性插值方法(Linear),对于存量或指数类型的季度数据,直接采用线性插值方法将季度数据的各个点用直线连接成一个折线形式的月度曲线;对于流量类型的季度数据,将当季数据除3,即对季度数据平均值的各个点用直线连接成一个折线形式的月度曲线。
(3)二次插值方法(Quadratic),对于存量或指数类型的季度数据,直接采用局部二次多项式插值方法,形成一个光滑的月度曲线;对于流量类型的季度数据,将当季数据除3,即对季度数据平均值采用局部二次多项式插值方法,形成一个光滑的月度曲线。这种方法的优点是,由于利用相邻的3个点进行局部二次多项式插值,所以更适合于数据较少的季度数据,而且增加数据后不影响前面的插值结果。
(4)三次自然样条插值(Natural cubic spline),三次样条函数S(x)在低频数据序列 yt 的每一时间分段 (i =1, 2, …, N1,N是数据个数)上是三次多项式,整条曲线及其导数是连续的,利用三次样条插值法获得的曲线具有很高的精度。三次样条函数需满足以下条件:① 插值条件:(i = 0,1, …, N1)② 微分条件:一阶导数 S'(x) ,二阶导数S"(x)在 区间都是连续的
即S(x) 曲线是光滑的。所以N个三次多项式分段可以写作                                                                                              i = 1, 2, …, N-1 式中ai, bi, ci, di代表4N个未知系数。
         ③ 边界条件:左右两端点处用自然边界条件给出,
      根据插值点,求出每段样条曲线多项式中的系数,即可得到每段曲线的具体表达式,然后利用分段表达式计算出高频数据插值结果 。注意三次样条函数方法是一个整体插值方法,改变原始序列的一个点将影响插值序列的所有点。
      对于存量或指数类型的季度数据,直接采用三次样条函数插值方法;对于流量类型的季度数据,需将当季数据除 3,即对季度数据平均值采用三次样条函数插值方法。
(5) Denton插值方法,是由Denton (1971) 提出的一个以保持低频数据y的变化趋势为准则,基于数值平滑,通过最优化方法进行的时间序列分解的数学方法。设 y 是已知的低频数据序列,N是其数据个数,y = ( y1, y2, …, yN );设w是待估计的高频数据插值序列,z是与w相关的高频数据序列,T是其数据个数,高频数据序列的样本区间是t = 1, 2, …, T,即w = ( w1,w2, …, wT ) 和z = ( z1, z2, …, zT )。Denton方法假定对于已知的低频数据序列可以构建一个高频数据插值序列w,并可以找到一个与w相关的高频数据序列z,且z与w有非常接近的增长率。惩罚函数P(w, z ) 构造为序列(w /z)的一阶差分函数的平方和,在满足约束条件(2.1.8)下, (2.1.8)最小化惩罚函数P(w, z ):(2.1.9)进而得到高频数据序列。式(2.1.8)中,参数的选择要按数据类型来选取:如果y是流量变量,则约束条件(2.1.8)是插值序列 w 在每个时期的和等于低频数据 y,且 n =1;如果 y 是存量变量,则约束条件(2.1.8)中的 ak=bk,即每个时期 k,插值序列 w 终点的值等于低频数据 y,且 n =1;如果 y 是指数变量,约束条件(2.1.8)是在每个时期 k,插值序列 w 在每个时期平均值的和等于低频数据y,如果 y 为年度数据,需要转换为季度数据时 n =1/4,需要转换为月度数据时 n =1/12,如果 y 为季度数据,需要转换月度数据时 n =1/3。
(6)Chow-Lin插值方法,Chow-Lin方法是由Chow和Lin(1971)提出的一个基于回归分析的插值方法。设y是已知的低频数据序列,N是其数据个数,y = ( y1, y2, …, yN ),建立方程:(2.1.10)式中w = ( w1,w2, …, wT )是满足约束条件(2.1.8)的待估计的高频数据序列,对于存量变量、流量变量和指数变量的约束条件与Denton方法相同;Zt是由与wt相关的1个或多个高频数据指标组成的T×P阶解释变量矩阵;β是P阶系数向量;ut是随机扰动项,其均值为0,协方差矩阵为V。Chow-Lin方法假定方程(2.1.10)的扰动项ut服从AR(1)过程:(2.1.11)式中t ~N (0,  2 ),|ρ|<1。由方程(2.1.10)和(2.1.11)估计的得到 即为转换后的高频数据序列。      注意方程(2.1.10)中也可以没有与w相关的p个高频数据解释变量,这样解释变量矩阵Z是一个全为1的向量,即方程(2.1.10)的右端第一项可以是常数项。此时方程(2.1.10)变为一阶自回归AR(1)模型,这就要求低频数据序列y是平稳的,如果y不平稳,可以通过差分使其转换为平稳后进行上述计算。
(7)Litterman插值方法,Litterman插值方法(1983)与Chow-Lin方法类似,只是Litterman方法假定方程(2.1.10)的扰动项服从随机游走过程:(2.1.12)式中t ~N (0, V ), (2.1.13)并且初始条件ut=0。这个方法是利用状态空间模型方法求解的。如果(2.1.10)中没有解释变量,则要求 y 是平稳的。Denton方法、Chow-Lin方法和Litterman方法都是全局插值方法,因此改变低频数据序列y的任何一个点或增加数据点都将会影响到所估计的高频插值序列 的结果。美国经济分析局(BEA)的研究报告(2007)中对Denton方法、Chow-Lin方法和Litterman这3种方法都有更详尽的叙述。对于含有季节因素的季度数据,先进行季节调整再进行频率转换可以得到较高精度的转换结果。







页: [1]
查看完整版本: 低频数据向高频数据转换