Kaggleの始め方-Titanicコンペに参加-

機械学習




Kaggleの始め方

Kaggleは、データ予測のコンペティションです。

Kaggleでは、賞金ありのコンペティションが開催されています。

この賞金に関わらず、Kaggleにはデータサイエンスを実践的に学べる機能があります。

Kaggleは、データサイエンスや機械学習を学びたい方におすすめです。

Kaggleに登録する

https://www.kaggle.com/
上のリンクから、Kaggleのサイトにアクセスできます。

まずは登録しましょう。

Kaggleコンペの参加の仕方

登録が完了したら、コンペに参加してみましょう!!(下の画像)

コンペに参加Join Competition!

何か好きなコンペが見つかったら、右端にある「Join Competition」から、コンペに参加することができます。

まずは、Getting Startedから始めていきましょう!!

私は、house-prices-advanced-regression-techniquesから、始めました。
住宅価格予測です。

TitanicコンペでKaggleを知る

Titanic: Machine Learning from Disasterで、Kaggleに慣れていきましょう。

Lets Try!!

早速予測をしていきましょう!!

コンペの予測学習モデルを作るには、2つの方法があります。

1つは、データセットを自分のパソコン(ローカル)にダウンロードして、自分のパソコン(ローカル)で学習プログラムを走らせる方法です。

私は、自分のパソコンで実行しています。

2つ目は、KaggleのKernelを使う方法です。
Kernelから、New Kernelで、Kernelを作ることができます。
オンラインプログラミング環境が提供されています。

Wifi環境があれば、自分のパソコンにプログラム環境がなくても、どこでも実行できます。

自分のパソコンでTry!

Dataから、コンペに必要なデータをダウンロードします。
あとは、自分のPCの環境でガツガツ学習させましょう!

KernelでTry!

New Kernelから新しいカーネル(実行環境)を作ります。

実行環境は、Scriptタイプか、JupyterNotebookかで選ぶことが出来ます。

個人的には、Jupyterがおすすめです。

(右の画像は、Kernelの状況のスクリーンキャプチャ)
データが既にあるので、PCにダウンロードする手間が省けます。また、PCのスペックに関係なく、GPUがある環境が提供されているので、いいかもしれません。

Kernelの右下にGPUの有無が選べます。

ただ、セッション時間が6時間となっているようです。

Kernel-先輩たちの知恵

Kernelには、一般公開されているものがあります。

これはKagglerの先輩たちが残したものです。

Kaggle入門者は、これらのKernelをまずは写経することから始めましょう!!

データの扱い・モデル選択・提出ファイルの作り方など、ものすごく勉強になります。

ひとまず、ここではKernelのプログラムをコピーして、提出ファイルを作成しましょう。

予測を提出しよう

予測データが入った、提出用ファイルを、Kaggleに提出しましょう。
Submit Predictionsから、ファイルを提出します。

まず、作成した予測データのファイルをアップロードします。

次に提出ファイルの説明を書きます。
私は、面倒なので、予測モデルをメモしておきます。
例えば、ランダムフォレストで予測した場合、”RandomForestClassifier”とメモしておきます。

また、選択した変数名をメモするときもあります。

結果発表

自分の予測の結果は、My Submissionsで確認することが出来ます。

順位を確認しよう

順位は、Leaderboardから確認することが出来ます。

Kernelで勉強しよう

Kernelでは、Kagglerの先輩方の分析・モデル構築のプログラムを見ることが出来ます。

分析方法の勉強にかなりなると思います。

おすすめのKaggleコンペ

まず初めは、Getting Startedから始めるといいでしょう。
コンペが終了してしまったものは、順位が付かないので、モチベーションは少し上がらないかもしれない。。。

アクティブコンペに参加することをおすすめします!

慣れてきたら、Playgroundもいいと思います。

Competitionって夢がある

コンペには、賞金が発生するものがあります。

例えば、こんな感じ。。。

入賞したら、賞金がもらえる。。。
自分の能力次第で、賞金が。。。

コンペ頑張っていきましょう。

おまけ

Titanic_tutorial_for_study

参考書

下の参考書で学んだ知識をKaggleで実践するといいかもしれない、

タイトルとURLをコピーしました