田中TOMのめざせKaggleMaster #16 家具画像分類問題にチャレンジ

動画

次の参加コンペ

iMaterialist Challenge (Furniture) at FGVC5

  • 128種類の家具や生活グッズの分類
  • Train: 194,828枚
  • Validation: 6,400枚
  • Test: 12,800枚

まずは、json形式のURLから画像をローカルにダウンロードする所から始まる。(画像のデータが置いてあるホストサイトはバラバラで、いつ無くなるか分からないと公式にも書いてある)

kaggle api
これを使えばファイルのダウンロードを簡単にできます

画像ファイルをダウンロードするスクリプト

画像例
画像例1

画像例2

今週のKernel関連

  • https://twitter.com/kaggle/status/976164020410552320

ニュース

田中TOMのめざせKaggleMaster #15 半分松江、半分東京

動画

今後やること

  • kaggleのコンペを覗いたら画像解析のコンペが殆どだった
  • ゼロから始めるディープラーニングの畳み込みNNの章をやってなかった
  • 畳み込みNNの勉強をしてから取り組んでいきたい

Kernels Awards

EagerFMNIST | Kaggle
– データは Fashion MNIST
– TensorFlow の Eager Execution を利用している
Tensorflow 1.5のEager Executionを触ってみた - Qiita

Julia now

【お知らせ】たのは島根の松江に引っ越しました。
– せっかくなので普段仕事でも使ってるRubyと趣味で使っているJuliaで何かしたい。
データサイエンスにおけるRubyの現在の位置づけと可能性 | しまねソフト研究開発センター
– 記事著者の村田 賢太さんはRubyでPythonが呼べるpycall.rbも作ってる人
– 記事ではJuliaについても触れていてRubyでJuliaが呼べるruby-juliaも作ってるけどメンテはされていない
– Matsue.rb とか勉強会でここらへんの技術を触っていく予定

今週のニュース

田中TOMのめざせKaggleMaster #14 TOMは めのまえが まっくらに なった!

動画

Kaggle

いろいろやってみたけど順位は上がらなかった

これまでのやり方

・特徴量選択(10)
・XGBoost

スコア:0.13660

試行1

・特徴量選択をする(10)
・主成分分析を行う(5)
・XGBoost

生の特徴量使ったほうが良かった

試行2

・特徴量選択をする(10)
・XGBoostとSVMで学習する
・スタッキング

SVMが足を引っ張る

試行3

・特徴量選択をする(10)
・主成分分析(5)からのXGBoost
・主成分分析(5)からのSVM
・スタッキング

SVMが足を引っ張る

今週のKernels award

毎週優秀なKernelが選ばれるのでそれを取りあげてモダンな解析方法を学んでいく
KB-->MB-->GB-->TB-->?B (BigQuery)

Julia

今週のニュース