田中TOMのめざせKaggleMaster #13 LightGBMを触ってみる

Pocket

動画

相関ヒートマップの見方

ほとんど同じ内容の特徴量をあぶり出す

  • house pricesの特徴量にはほぼ同じ情報を持つものが多く含まれる
  • 重複した特徴量は不要なので使用しない
  • ヒートマップの色が濃くなっているところが重複した特徴量

GBDT(Gradient Boosting Decision Tree)

アンサンブル学習のブースティングとバギングの違いについて \| データ分析とインテリジェンス

  • アンサンブル学習は、大きく2通りに別れる
    • バギング(bagging)
    • 復元抽出によってたくさんモデルを作成し、それらを平均化する手法
    • 例)ランダムフォレスト
    • ブースティング(boosting)
    • モデルを逐次更新していく手法
    • 例)GBDT

Julia Now

今週のニュース

Pocket

“田中TOMのめざせKaggleMaster #13 LightGBMを触ってみる” への1件の返信

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です