lightGBMとXGBoostの交差検証方法

参考サイト:



lightGBMの交差検証

lightGBMのcvメソッドで交差検証が可能。n_foldで分割数を指定する。

結果は、ブートラウンドごとのスコアを出力し、最大スコアが出たラウンドで終了するので、全出力数を数えると、汎化性能を最大にするブートラウンド数がわかる。


コード例)kaggle Hose Price predict : lightgbmを用いて、RMSEで交差検証

結果:

ブートラウンド数が100を過ぎた当たりから、RMSEスコアがあまり減少しなくなり、400過ぎたあたりで、全く下がらなくなっている。計算コストを上げたいなら、ブートラウンド数を100ちょっとにしても、耐えられるかもしれない・・・。



XGBoostの交差検証

lightGBMと同じように、cvメソッドで交差検証が可能だが、使い勝手が悪いとのことで、sklearnのKFoldやcross_val_scoreを使う方法を進めるサイトが多い。


例)kaggle Hose Price predict : sklearnのKFoldとcross_val_scoreで交差検証

機械学習Tips保管庫

データ解析、機械学習のための学習内容の保管庫。復習用。

0コメント

  • 1000 / 1000