時系列分析の基本

参考サイト:



基本用語:

  • 自己相関係数、偏自己相関係数
      • 自己相関係数:
        過去の値とどれくらい似ているか(あるいは似ていないか)を表したもの。たとえば、一日前と大きな正の自己相関があれば、「一日前に多ければ、今日も多い」ということになり、2日前と負の自己相関があれば「二日前に多ければ、 今日は少ない」ということになる。
      • 偏自己相関係数:
        偏自己相関係数は、注目している時以外の要因を無視して計算された自己相関係数。一日前と今日の関係が知りたくて、一昨日の要因何か見たくないよってときにはこちらを使う。
  • ARモデル(自己回帰モデル)
      • 自己回帰とは、その名の通り自分のデータと回帰する手法です。ようするに、一日前の値を横軸に、一日後のデータを縦軸にしてプロットし、線を引っ張ると言うイメージ。一番簡単な時系列モデル。
        1期前のデータだけから回帰したARモデルを AR(1) と表します。同様に p期前までの全てのデータを使って今日のデータを予測するモデルはAR(p)モデルと書きます。

  参考サイト:


  • MAモデル(移動平均モデル)
      • 普通の移動平均の例)
         [4, 2, 6, 10, 14, 18] のデータに対して、3区間移動平均をすると、
          (4+2+6)/3,  (2+6+10)/3,  (6+10+14)/3,  (10+14+18)/3 = [4, 6, 10, 14]
         となる。3地点の平均をずらしながら計算していく。
        一方で、MAモデルは、青い部分を見ると、4番目の結果に使用されているデータが3番目2番目の移動平均結果にも用いられている。同じ数字が使われている->似ている->相関がある (「移動平均みたいに、一部同じ数字を使って表されたデータは自己相関を持つ」)という考えかた。
      • MAモデルだと、一日前と大きな自己相関があるとかいう現象や周期性うまくモデリングすることができる。
      • 3期移動平均モデル(要するに上の例と同じ)はMA(3)と表します。同様にq期移動平均モデルはMA(q)と表記する。MA(q)はq個同じ数字を使っているわけなので、q期前までとは自己相関があり、q+1期前のデータとは自己相関がない。

      • 参考サイト:
        MAモデル
        n次MAモデル


  • ARMAモデル(自己回帰移動平均モデル)
      • ARモデル、MAモデルを両方突っ込んだモデル。
      • 参考サイト:ARMAモデル
  • ARIMAモデル(自己回帰和分移動平均モデル)
      • データの差分を取ってからARMAを適用したモデル。
      • 参考サイト:ARIMAモデル
  • SARIMAモデル(季節自己回帰和分移動平均モデル)
      • ARIMAモデルに、さらに周期的な変動(季節変動とか)を取り入れさせたモデル。
      • 参考サイト:SARIMAモデル



モデリング前の時系列データの分析例

 ー> notebook参照



PythonによるSARIMAモデル作成例

 ー> Pythonによる時系列分析の基礎を参照




Facebook Prophet を使ったモデリング例

 ー> Forecasting multiple time-series using Prophet

機械学習Tips保管庫

データ解析、機械学習のための学習内容の保管庫。復習用。

0コメント

  • 1000 / 1000