AICとBICについて
最近、重回帰分析やx-means法について調べていて、
AICとBICという指標について気になったので、メモ代わりに。
簡潔に言うと、この2つの値はモデルの当てはまりの良さを表すために使われています。
定義としては以下の式で表されます。
AIC = T * log(s^2) + 2 * K BIC = T * log(s^2) + K * log(T) T: データ数 K: モデルに含まれるパラメータ数 s^2: モデルの誤差項の分散推定量
2項目がペナルティ項と呼ばれていて、複雑なモデルほど大きくなる値です。
この項がないとやたら複雑なモデルが良いモデルということになってしまいます。
これが違うことによって、BICを使った方がよりシンプルなモデルになります。
使い方としてはモデルに合わせて使う情報量を変えるとよいみたいです。
たとえば、モデルパラメータをBayes流で推定するならばBIC
最尤法で求めるならAICというようになります。