Syleir’s note

2020.4.1より統計検定やE資格の勉強の進捗を報告しています。統計検定準1級、E資格、G検定取得しました!当ブログへのリンクはご自由にどうぞ。

MENU

【Part5】統計検定準1級:時系列解析のまとめ【MA過程】

1. はじめに

本記事は統計検定準1級の時系列解析分野の一歩目を高校数学レベルから丁寧に解説してみようという趣旨です。対象は統計検定2級を取ったくらいの方から準1級の入り口で悩んでる方くらいが主な想定です。
さて、前回は、AR過程について勉強しました。今回はAR過程についで時系列分野における主要な統計モデルの双璧、MA過程について触れていきます。

前回までの記事はこちらです。
syleir.hatenablog.com
syleir.hatenablog.com
syleir.hatenablog.com
syleir.hatenablog.com





2. 移動平均過程(MA過程)のお気持ち

移動平均過程とは過去のノイズの影響がある程度現在の値Y_{t}に影響を与えているというモデルです。過去直近のq個のノイズが現在値に影響を与えているとき、それを明示してMA(q)モデルと書きます。ARモデルが直近過去数個の実際の時系列データが次の時系列データに影響を与えているというモデルなのに対して、MRモデルは直近n個のノイズがそれぞれ影響して次の時系列データを形成しているという考え方をします。潜在因子を仮定したりするときのモデリングで都合が良いです。

MAモデルの概念図

2.1. 定義

q次の移動平均過程とはY_{t}が連続した直前q個までの\epsilon_{t}, \epsilon_{t-1}, ... \epsilon_{t-q}で説明され、
Y_{t} = \mu +\epsilon_{t} + \theta_{1} \epsilon_{t-1}  + ... + \theta_{q} \epsilon_{t-q}
で表されるものをいう。。各\epsilonは現在の値に影響を与えているノイズ、各\thetaはそれぞれのノイズが現在の時系列データにどの程度の影響を与えているかを考える係数。\muは定数項である。

さて、MA(q)モデルを書いてみたものの、統計検定上はなかなか出題されないことと、今回の記事の趣旨は初学者向けの記事ということもあり、より簡単なMA(1)モデルから説明をしようと思います。MA(1)モデルはMA(q)モデルのq=1の場合と考えることで同様に考えることができ、

2.2. 定義(MA(1)モデル)

1次の移動平均過程(MA(1)過程)とは、Y_{t}が今のノイズ\epsilon_{t}と直前のノイズ\epsilon_{t-1}で説明され、
Y_{t} = \mu +\epsilon_{t} + \theta_{1} \epsilon_{t-1}
で表されるものをいう。 \theta_{1} は直前のノイズにどの程度の影響を受けているのかを考える係数。
というように定義することができます。ここでは \epsilonにホワイトノイズを仮定することにします。

概念図としては以下の通りで、現在の時系列データが今現在のノイズと直近のノイズに直接の、そして最大の影響を受けていることがわかります。

2.3 \theta_{1}を変えて色々見てみよう

MR(1)モデルの係数を色々変更して挙動を見てみましょうか。 t = 0 から t = 49 まで50個データを出して見てみます。

2.3.1  \theta_{1} = 0.2


2.3.2  \theta_{1} = 1.2


2.3.3 \theta_{1} = 1000


どうでしょうか。スケール自体は変わっている気がしますが概形は同じではないでしょうか。ざっくり言うと、MA過程における\thetaにはスケール調整の役割があることがわかります。
また、どうして概形が同じに見えるのでしょうか。実はMA(1)過程は共分散定常(弱定常)であることが知られています。Part2の記事でも解説しましたが、共分散定常には平均・分散:tにもhにもよらず一定、自己共分散、自己相関係数:tによらずhにのみ依存するという性質があり、これらの性質、特に平均と分散が一定という性質により概形が似て見えるのです。

この常にMR(1)過程が共分散定常という性質はAR(1)過程の|\phi_{1}| < 1|\phi_{1}| \geqq 1で定常性が変わるというところと明確に区別される性質なのでとても重要です。


3. 共分散定常性を示す

さて、ここから共分散定常性を示しに行きましょう。
共分散定常の定義は平均と自己共分散がラグの大きさのみに依存し t に依存していないことでありました。これを示します。

3.1MA(1)過程の期待値

ホワイトノイズの期待値は0なので、\epsilonの期待値は0になります。
Y_{t} = \mu +\epsilon_{t} + \theta_{1} \epsilon_{t-1}  この式の両辺の期待値を取ると、
 E[Y_{t}] = \mu
となり事実、tによらず一定値をとることがわかります。

3.2MA(1)過程の分散と自己共分散

分散については、求める分散を\gamma_{0}とすると、
\gamma_{0}= E[(Y_{t} - \mu) ^ 2]
 = E[(\epsilon_{t} + \theta_{1} \epsilon_{t-1})^2 ]
 = E[\epsilon_{t}^2 + 2 \theta_{1} \epsilon_{t} \epsilon_{t-1} + \theta_{1} ^ 2 \epsilon_{t-1}^2 ]

ホワイトノイズ\epsilonは分散\sigmaで自己共分散0のものを仮定することが多く、それを援用すると、

 = \sigma ^ 2 + \theta ^ 2 \sigma ^ 2
 = (1 + \theta ^ 2) \sigma ^2
となり、tに依存しないことがわかる。

1次の自己共分散については、求める自己共分散を\gamma_{1}とすると、
\gamma_{1}= E[(Y_t - \mu)(Y_{t - 1} - \mu]
 = E[(\epsilon_t + \theta \epsilon_{t - 1})(\epsilon_{t - 1} + \theta \epsilon_{t - 2} ]
ホワイトノイズ\epsilonは分散\sigmaで自己共分散0だったから、 E[\epsilon_{t - 1}^2 ]以外の項は0で、

 = \theta _{1} \sigma ^ 2

となる。

2次以上の自己共分散についてはラグh(>0)として、
\gamma_{h}= E[(Y_t - \mu)(Y_{t - h} - \mu]
 = E[(\epsilon_t + \theta \epsilon_{t - 1})(\epsilon_{t - h} + \theta \epsilon_{t - h - 1} ]

ここで、t, t - 1,t - h, t - h - 1は全て相異なるから、

 = 0 となる。
以上より、自己共分散においても、t に依存していないことがわかり、共分散定常が示される。

3.3 MA(q)過程の共分散定常性

より一般にMA(q)過程の共分散定常性についても同様に示すことができる。ワークブックに計算結果があり、実際に定義通り計算するとできるのでやってみてほしい。(需要があれば追記します。)

4.終わりに

ここで、時系列モデルの双璧、ARモデル、MAモデルの説明が終わりました。次回はスペクトル密度関数について扱いたいと思います。更新時期についてはやる気次第です。目標は1ヶ月以内の執筆です。気長にお待ちください。

→即日執筆しました。えらい。
syleir.hatenablog.com