移動平均を選択しない理由

カルマンフィルタ・状態空間モデルに対して、移動平均を選択しないことの理由づけ。

下記、書籍を読みながら考えたことです。

www.asakura.co.jp

そもそもなぜ移動平均を求めるのか(現状、使われているのか)?

測定値にはノイズ(観測誤差)が含まれており、過去(数日間)のデータを用いて平均化してノイズの影響を緩和するため。言い換えると、仮にノイズの生じない状態であれば移動平均値を使用する必要はない(例えば、全数測定によって誤差なく目的とする測定ができる場合など)。

移動平均とは(逐次計算の観点から)

移動平均では、前日の予測値と今日の実測値の差分に重みを付けて今日の実測値から補正した今日の真値を予測する。この時の重みの分母にはk日移動平均のkが含まれ、kが大きな程重みが小さくなる。ここでは、k日の数が大きな程ノイズの影響が緩和される一方、補正は緩慢となり真値の推定に対する精度低下が起きうる。 (なお、厳密には前日の予測値と今日の実測値の差分ではなく、k日前の予測値と今日の差分。詳しくは森平本のp.26。)

移動平均を利用しない理由

上記の理由から、k日の移動平均のkを決める方針はノイズの影響を小さくする(kを大きくする)ことと強く補正する(kを小さくする)ことのトレードオフを考え最適点を見つけることであり、数学的に合理的に決定できる。その合理的な決定方法がカルマンフィルタであり、状態空間モデル。

移動平均を利用する理由

  • 計算が簡単
  • よく使われてきたので受け入れやすい
  • 簡単に理解できる気がする。

k日で事象が変わる場合にはk日移動平均が良いのでは?

例えば、1週間ごとに条件を変える製造工程では1週間内は同じものが作られ続けられるものであり、7日移動平均を選択することにある程度の合理性はあるという声もあるかもしれない。しかし、この考えには測定のノイズの大小の考えが欠落しており、何日の移動平均をとるかはノイズとの兼ね合いで考えるべきである(カルマンフィルタor状態空間モデルを使うことの合理性)。