時系列分析備忘録

ラグ / 確率過程 / 期待値 / 分散、標準偏差 / 自己共分散 / 自己相関

説明サイト:時系列分析で登場する統計量・用語を一つずつ解説



原系列 / 差分系列、階差系列 / 対数系列 / 対数差分系列 / 季節調整系列

説明サイト:時系列分析の基本的なモデルをわかりやすく解説



定常性 = 平均回帰性

下は、平均回帰性が見られないケース


自己相関 

= 時系列データが自分の過去の値からどれくらい影響を受けているかの指標

上の平均開始しているケースでは、一時点前の値からしか影響を受けていないが、下の平均回帰していないケースは、過去遡って影響を受けている


分散不均一性
 = 分散が時間軸に沿って一定していない

上は、分散が均一っぽいケース。下が、分散が不均一なケース

上記画像は、『なぜ統計学がビジネスの 意思決定において大事なのか?』より



定常過程

時間や位置によって確率分布が変化しない確率過程



単位根過程

時系列分析の単位根過程、ランダムウォークとは?

  • 定義:ytが非定常過程、また差分系列yt–yt–1=Δytが定常過程である時、ytは単位根過程である。
  • 経済、金融データが従うランダムウォークは単位根過程の一種です。また、ARIMA、SARIMAモデルも単位根過程のひとつ。
  • 単位根過程に従うxt,yt を回帰分析を行うと、まったく関係のないxt,ytの間に有意な相関を見出してしまう「見せかけの回帰」が行われます。「見せかけの回帰」は、例えば株価と二酸化炭素濃度という関係のない2つの間に相関性を導き出してしまいます。

    そのため時系列データに対して回帰分析を行う時は「見せかけの回帰」に気を付ける必要があります。

  • 「見せかけの回帰」を避けるためには、あらかじめ2つの時系列データxt,ytが単位根過程に従っているかどうか確認しなくてはなりません。そんな時は単位根過程であるかをチェックする単位根検定が行われます。



Ljung-Box検定

Ljung-Box検定は、ある時系列の自己相関が存在するかどうかを次の設定で確かめる検定です。

H0: ラグ1からラグ m までの全てで自己相関が0

H1: ラグ1から m までの自己相関のうち、少なくとも一つが0でない

有意水準を5%としたとき、検定統計量の得られる確率が5%未満であれば「有意な(意味のありそうな)自己相関がある」と判断します。 逆に5%以上であれば、「有意な自己相関があるとは言えない(どちらともいえない)」と判断します。 Ljung-Box検定は、時系列モデルをあてはめた後に残差に対して行われ、残差が独立であることを確認するためにも使用されます。 これには、説明しきれなかった部分が本当にノイズであってほしい、というモチベーションがあります。 statsmodelsではacorr_ljungbox()で実装されています。



ADF検定

拡張Dickey-Fuller (ADF) 検定は、時系列が定常であるかどうかを確かめる検定です。

statsmodelsではadfuller()で実装されています。


時系列解析の検証に使われる2つの仮説検定方法より



非定常 -> 定常 への変換

  • 差分変換
    一時点離れた値との差を取る差分変換により、平均に関して非定常な系列を定常にできる場合があります。
             Δyt = yt – yt − 1
    差分変換は、系列が定常であるとみなせるようになるまで複数回行うことがあります。 一度差分をとることは一階差分と呼ばれ、さらにもう一度差分をとることは二階差分と呼ばれます。 周期性のあるデータに対しては、周期分だけ離れた値との差をとる季節差分を行うことがあります。

    非負な原系列に対して対数を取る対数変換は、トレンドに比例してバラツキが変化するような系列に対して有効です。これは、対数をとることにより積の構造が和の構造に変わるためです。
             log(X×Y) = logX + logY

  • 対数差分変換
    金融の分野では、元の価格推移のデータを対数変換したのち差分変換する対数差分変換がしばしば行われ、変化後のデータは「対数収益率」とよばれます。 対数収益率を用いることには、「100円の銘柄が1円値上がりする」ことと「1000円の銘柄が1円値上がりする」ことの不平等さを解消できることなど、様々なメリットがあります。

非定常な時系列データを変換して定常性を持たせる解析より

機械学習Tips保管庫

データ解析、機械学習のための学習内容の保管庫。復習用。

0コメント

  • 1000 / 1000