时间序列分析是统计研究中的一大重要分支。通过指定的时间段内记录的一系列数据,时序分析可以提取有意义的统计信息和数据特征,并且对未发生的事件进行预测。传统的时序分析主要针对单变量时间序列数据建立线性模型 (Box et al., 2015; Brockwell and Davis, 2009; Tsay, 2005)、非线性模型 (Engle, 1982; Bollerslev, 1986; Tong, 1990)、非参数模型 (Fan and Yao, 2008) 等,或针对多变量/面板型时序数据进行研究 (Tiao and Box, 1981; Tiao and Tsay, 1989; Engle and Kroner, 1995; Stock and Watson, 2005; Tsay, 2013)。而复杂的观测数据,例如矩阵型时序数据,在各个领域都广泛存在,并且包含了更为复杂、全面的信息,因此本文对矩阵型时序分析方法,以及更复杂的张量型时序分析方法做一回顾。
在传统的对矩阵时序进行分析的研究中,矩阵会被直接向量化,进而使用针对向量时序的研究方法进行研究 (See Chamberlain, 1983; Chamberlain & Rothschild, 1982; Bai, 2003; Bai & Ng, 2002; Bai & Ng, 2007; Forni et al., 2000; Forni et al., 2004; Pan & Yao, 2008; Lam et al., 2011; Lam & Yao, 2012)。这样会严重丢失矩阵观测中本身包含的大量相关信息,割裂了观测数据的内在关联,因此直接基于矩阵型时序分析的研究近几年来开始受到研究者关注。
矩阵型时间序列(matrix-valued time seires)这个词语第一次被提出是一篇信号处理的文章 (Walden and Serroukh, 2002),然而在这个研究中,序列数据的时间依赖性并没有被充分利用来建立模型。对于矩阵型时间序列的统计与计量研究的首次研究被Wang et al. (2019)提出,截至目前还不断涌出新的相关研究。Wang et al. 在研究矩阵时序数据时允许观测值是高维的,因此其研究点侧重于最维度进行处理。作者使用的核心方法是对矩阵型时序数据引入因子模型建模,从而实现维度的降低。
基于上述的基本模型,Chen et al. (2019) 提出通过线性约束的手段将先验知识融入矩阵时序因子模型。这种线性约束对待估参数进行了简化,同时增强了观测矩阵中所隐藏的因子结构的解释性。具体地,约束的矩阵时序因子模型可以表示为
以上的三个重要研究中,对矩阵时序因子模型的估计都是沿着Lam et al. (2011)和Lam and Yao (2012)的思路,对自相关协方差矩阵(auto-cross-covariance)进行特征值分析。而对于矩阵型时序因子模型的另一个研究思路则是借鉴了Bai (2003)和Fan et al. (2013)的研究方法,对同一时刻的观测矩阵的行或列所构成的协方差矩阵进行特征值分析。因此,下面我们介绍第二个研究思路。
在Wang et al. (2019)提出矩阵型时序的研究之后,除了上述使用因子模型对高维的矩阵时序进行降维,也有文章对矩阵时序的自回归模型进行研究。Chen et al. (2021)在其研究中刻画时序上的关联关系,模型可以表示为:
基于矩阵型时序数据,一些研究者将数据类型的范畴拓展到了多维张量。这里我们再举一个栗子,来展示什么是张量型时序数据。Chen et al. (2021) 对这种类型的时序数据做了研究,下图展示了2001年1月至2017年12月期间6个国家(美国、加拿大、墨西哥、德国、英国、法国)的4类产品(化工、食品、机电、鞋帽)月度进出口数量时间序列。每一个类别是一个平面,展示了出口国家(行)对进口国家(列)输送的产品量随时间变化的趋势。如果将这个场景简化为某一中产品从美国输出到别的国家的时序数据,或退化为美国向加拿大输出的4中产品的时序数据,那么问题就退化为了传统的向量时序分析;如果场景简化为某一个类别产品的进出口时序数据,则问题退化为矩阵型时序分析问题。
Chen et al. (2021) 提出了两种估计方法,分别是 TOPUP方法和TIPUP方法,利用张量展开和对滞后若干期的观测张量叉乘,得到张量版本的自相关协方差矩阵,进而使用特征值分解的方法,估计张量时序因子模型。在此基础上,Han et al. (2021)将TOPUP和TIPUP估计的结果作为初始估计量,提出了对应的迭代估计方法iTOPUP和iTIPUP,加快了上述估计的收敛速度。
