Syleir’s note

2020.4.1より統計検定やE資格の勉強の進捗を報告しています。統計検定準1級、E資格、G検定取得しました!当ブログへのリンクはご自由にどうぞ。

MENU

【Part6】統計検定準1級:時系列解析のまとめ【スペクトル密度関数・スペクトラム】

1. はじめに

本記事は統計検定準1級の時系列解析分野の一歩目を高校数学レベルから丁寧に解説してみようという趣旨です。対象は統計検定2級を取ったくらいの方から準1級の入り口で悩んでる方くらいが主な想定です。

今回は統計検定頻出のスペクトル密度関数・スペクトラムについて扱っていきます。

前回までの記事はこちらです。
syleir.hatenablog.com
syleir.hatenablog.com
syleir.hatenablog.com
syleir.hatenablog.com
syleir.hatenablog.com

2. 周波数解析について

突然ですが、次のグラフの周期はいくつでしょうか。

もちろん1ですね。

次のグラフの周期はいくつでしょうか。

もちろん2ですね。これもわかりやすいです。

周期とはなんでしょうか。
関数 f が周期 P を持つとは、
任意のxに対して f(x+P)=f(x)が成立することを言います。見かけでもかなりわかりやすいですね。

では周期を持つ2つのグラフを合成するとどうなるでしょうか。

たった2つのグラフの合成ですが、非常に直感的ではなくなってしまいました。よく観察すれば周期1のグラフと周期2のグラフの合成であることがわかりますが、少し時間がかかります。これが個数が増えたらもっと大変になるのはいうまでもありません。でも世の中には周期関数の重ね合わせでできているグラフがどのような周波数の関数の合成でできているのかを知りたいことって結構あると思います。どうですか?

例えば自分がお店を経営していて、店舗の売上のグラフを見て、
・1年ごとの周期があるか、曜日ごとに特徴があるか、月レベルでは何日にピークがあるのか

って知りたくなりませんか?周期というのは時系列解析における重要なモチベーションになっていることがわかります。

3. では具体的にどのように調べればいいのか?

フーリエ変換というものをすれば良いです。現実的には離散データしか取ってこれないので、これをサンプリングして集めてきて、フーリエ変換というものをすると、どのような周波数成分を持っているのかを調べることができます。これには計算の高速化のテクニックがありますが、今回は割愛して結果だけ示します。先程の例だとこうです。

対数表示してしまっているのでわかりにくいですが、ピークが0.5と1のところに現れているのがわかります。周波数成分の合成のものに対してフーリエ変換をするとピークとして周波数成分が現れることがわかります。

4. スペクトル密度関数とは?

めちゃくちゃざっくりいうと自己共分散関数のフーリエ変換です。スペクトラムともいいます。

...これで通じてくださる読者の方はブラウザバックして良いのでこれを解説していこうと思います。


ラグが大きくなると自己共分散\gamma_hが急速に減衰し、
 \sum_{- \infty}^\infty |\gamma_h| < \infty を満たすとき、 \gamma_hに対してフーリエ変換をすることができます。
その結果がこれです。導出はレベルを逸脱するので省略します。
 f(\lambda) = \frac{1}{2 \pi} \sum_{- \infty}^\infty \gamma_h e ^{-i \lambda h}で定義されますが今回はお気持ちの説明なのであまり使いません。

これは自己共分散のフーリエ変換で、フーリエ変換とは元の関数の周期がどのようなものでできているのかを調べる手法でしたから、スペクトル密度関数を作って、グラフを書くことで自己共分散の周波数成分がわかるというのがミソです。

スペクトル密度関数における「高さ」はその周波数領域の成分が多いということを意味します。ただ、実際の時系列モデルから作ったスペクトル密度関数では先程みたいに明らかなピークを持って現れるというわけではありません。滑らかなグラフになることも多いです。この考え方をここから示していきます。

5. スペクトラムとコレログラムの関係

例えば、次のようなスペクトル密度関数が得られた場合を考えてみましょう。

この場合、低周波領域が強く出ており、高周波領域が弱く出ていることがわかります。ということは、自己共分散関数が低周波成分が多いということになります。低周波が多いということは、よりゆっくり振動するということで、コレログラム(Part2参照)で表すと滑らかなグラフになることになります。
逆にスペクトラムで高周波領域が強いグラフの場合、コレログラムだと「ギザギザな」グラフになることがわかります。

今の議論をまとめると、
スペクトラム低周波が強い→コレログラムは滑らか
スペクトラムで高周波が強い→コレログラムはギザギザ

ということになります。

より具体的に説明するために、
ここで、2つのAR(1)モデルを用意します。
 Y_{t} = 0.5 Y_{t-1} + \epsilon_t

 Y_{t} = -0.5 Y_{t-1} + \epsilon_t

これらのコレログラムは以下のようになります。
 Y_{t} = 0.5 Y_{t-1} + \epsilon_t

 Y_{t} = -0.5 Y_{t-1} + \epsilon_t


これから、コレログラムとスペクトラムの関係がわかります。
上の方がコレログラムが滑らかなのでスペクトラムでは低周波が強い
下の方がコレログラムがギザギザなのでスペクトラムでは高周波が強い
と推測できます。実は上に出したスペクトラム Y_{t} = 0.5 Y_{t-1} + \epsilon_tのものです。


この項で大事なのは実際の時系列データ↔︎コレログラム↔︎スペクトラムを自在に行き来できるようになることにあります。
時系列データとスペクトラムを2セットずつ与えられたときに、どちらのグラフがどちらのスペクトラムと対応するかが考えられるのが大事で、コレも過去に何度か出題されている事項です。

6. ペリオドグラムについて

スペクトラムは自己共分散の式から計算によって導出されるものです。
実際には、実際のデータしかなく、自己共分散の式がわからないことも多いです。計算方法は割愛しますが、実際のデータから計算する近似的なスペクトラムをペリオドグラム(ピリオドグラム)といいます。これも過去に出題がありますが、グラフの見方はスペクトラムと同じなので、良く考えて解答すると良いでしょう。

7.終わりに

本日の記事ではスペクトル密度関数について解説しました。フーリエ変換の気持ち、すこしはわかっていただけましたか?ここは自分も勉強していて困ったところなので、はじめの一歩として、何がモチベーションなのか、どういうことをしたい操作なのか、伝わると嬉しいです。次回は時系列シリーズ最後になりますが、ダービンワトソン比(DW比)について扱います。(最近は統計検定で出題されていませんが。)