MENU

IT導入のヒントブログ IT BLOG

【参加レポート】福岡Kaggleもくもく会 #27

こんにちは、スミリオンの長嶋です。
下記のもくもく会に参加してきましたので、内容をレポートします。
 
福岡Kaggleもくもく会 #27
https://fukuoka-kaggle.connpass.com/event/160918/

 
まず最初は、軽く自己紹介ともくもく会でやることを一人一人発表していきました。
私は、初参加だったので、とりあえずKaggleのチュートリアルのTitanicをやってみると宣言しました。
 
まずは、Kaggleにログイン

 
その後は、下記のサイトを参考にしながら、Titanicチュートリアルにチャレンジ!
【Kaggle超初心者向け】Titanicにチャレンジしてみた
https://qiita.com/5sigma_AAA/items/0c23907da9330681147b
 
まずは、こちら(https://www.kaggle.com/c/titanic/data)のサイトにアクセス

 
「Notebooks」を選択し、環境を作成します。

 
「Select language」で「Python」を選択
「Select type」で「Notebook」を選択し、「Create」をクリック

 
そうすると、Kaggleのサイト内にjupter Notebookが作成されます。
後は、ここにpythonのコマンドを打っていきます。

 
項目やデータ形式の確認

df.head()


 
基本的な統計量の確認

df.describe()


 
ヒストグラムを作成

df.hist(figsize = (12,12))



 
各項目の相関関係を可視化

plt.figure(figsize = (15,15))
sns.heatmap(df.corr(),annot = True)



 
試しに性別と目的変数の関係を可視化

sns.countplot(‘Sex’ , hue = ‘Survived’,data = df)


 
欠損値処理とカテゴリ変数の置換

df.isnull().sum()


 
決定木のコードと結果

 
ランダムフォレストのコードと結果

 
予測結果の提出用のコードと結果

 
提出用ファイルのダウンロード
作成したcsvファイル(submission.csv)の横にあるボタンをクリックします

ファイルを一旦ローカルに保存します。
 
再び、Titanicのページ(https://www.kaggle.com/c/titanic)に戻って、「Submit Predictions」をクリックします

 
ファイルをアップロードして、

画面下部にある「Make Submission」をクリックします

 
結果が表示されます。
私の結果は、5114位でした

 
今回、初めてkaggleを触ってみましたが、なかなか面白かったです。
Titanicのチュートリアルは、結構いろんな人が情報を公開してくれているので、もっといろいろなアリゴリズムやパラメータのチューニング方法などを覚えていき、今よりもいい結果が出るようにチャレンジしたいと思いました。
 
では、また