murohi@AIチャンネル

一流のAIエンジニア目指して奮闘中

AI初学者の為の最短勉強法~Kaggleとは?~

今日ご紹介するのは、機械学習初心者の実践の積み方について説明できたらと思います。

 

データサイエンティストに初心者だけどなりたいと思っている方は多いはず。でも実際に実績なくして転職するのはかなり厳しいです。そういう人達は「実績」が必要になるのですがそんなときに最適なのがkaggle。

https://www.kaggle.com/

 

f:id:hiromushoji:20190707205407p:plain

 

ここでは、企業から提供されているデータを用い、世界各国のデータサイエンティストたちが「Competetion(コンペ)」という形で自身が作成したアルゴリズムにより精度
などを競いあいます。このコンペティションで上位に入賞すると転職の際「実績」としてみなされるので、ここで結果を残すのが最優先と考えたほうがいいでしょう。

 

 

この話を聞くと本当の超初心者にとっては、はいりずらいじゃん。。。と思うかもしれませんが、Kaggleには「Kernels(カーネル)」と呼ばれる機能があり、他のユーザーが構築した予測モデルのコードや説明を無料でみることができます。人のアルゴリズムを参考にできるのは正直初心者にとっては相当ありがたいです。

 

 

このKaggleの中でも特に有名な課題として「Titanic : Machine Learning from Disaster」というものがあり、ほぼ初めて参加する人はここからスタートします。

 

f:id:hiromushoji:20190707211414p:plain

 


コンペティションの内容は非常にシンプルで、各乗客が生き残ったかどうかを予測するアルゴリズムを考え、誰が一番精度よく予測できるかを競いあいます。

 

 

この「Titanic : Machine Learning from Disaster」が初心者向けと呼ばれる所以は、下記の通りだと私は推察しています。

・テーマがわかりやすい
・欠損値が少ない
カーネル/その他ブログでチュートリアルがたくさんあり参考になるものが多い

 


ですので機械学習初心者でPYTHON等プログラミング初心者においても、他の人のカーネル等みながらやればすぐに
できてしまいます。

 

 

このブログでもチュートリアルという形でPGや考え方に関してのプロセス載せていきたいなと思います。

 

というのも他ブログはすでに完成したものを載せていて初心者にはわかりずらいように思えました。ですのでどういう風にして機械学習初心者が学んでいったかの過程も含め記載していきたいと思います。目標としては計7回の提出で上位30%になろうと思います。

 

初心者の苦労も盛りだくさんで記載したいと思います!

 

それでは次回をお楽しみに!

 

 

初心者から「データサイエンティストへの道」を立ち上げました

皆さん、はじめまして。私は昨年度までハード開発のエンジニアでしたが、転職活動の末、データサイエンティストになりました。

 

始めてのAIの勉強ということでかなり苦労しながら勉強しましたが、なんとか職につくところまでできました。

 

そこで、せっかく苦労して勉強してきたのでブログという形でアウトプットし下記目標のもと頑張っていこうと思っています。

 

f:id:hiromushoji:20190704001654j:plain



 

ブログを書く上での目標

1:データサイエンティストとしての知識の向上

2:副業としての収益化を狙う

 

2019年以降、今後より世の中は「個」の時代になっていきます。そうなってきたときに最終的に頼れるのは、自らお金を稼ぐ力が必要です。

 

私自身も「個」の時代に対応できるようにデータサイエンティストになりました。

 

ですのでまず第1に知識の向上を図っていこうと思います。第2は実際に「個」として稼ぐという集大成として、データサイエンティストとしての副業も行っていこうという思いです。

 

本ブログでは基本的に「データサイエンティストの知識」「副業」の二本柱で進めさせていただきたいと思います。

 

 

データサイエンティストの知識

データサイエンティストはAIエンジニアのようにAIのシステム構築だけをするのではなく、さまざまな意思決定の局面において、データにもとづいて合理的な判断を行えるように意思決定者をサポートする職務です。そんなデータサイエンティストに求められる知識は下記4個です。

 

1:プログラミング力

2:数学力(統計学、線形台数,微分積分

3:提案力(ビジネス、市場トレンド)

4:専門領域(医療・教育等・・)

 

上記の4個の掛け算によってデータサイエンティストとしての価値が変わってきます。

そこでこのブログでは上記4個に関しての内容も随時更新し載せていきたいと思います。

 

 

副業としての収益化

データサイエンティストとして副業していく上で、私が想定している副業は下記の3個です。

 

1:クラウドワークスなどによる副業

2:kaggleコンテスト参加

3:ブログ(アフェリエイト/クリック)

 

 

詳細の内容に関しては次回以降説明していこうと思いますが、各コンテンツにおいてどういうふうに対策をとり、マネタイズをしていくかは今後のブログで書いていこうと思います。

 

 

これからデータサイエンティスト/AIエンジニアになりたい人や副業をしていきたい人にとっては参考になるような知識等も記載していきたいと思いますので、今後の記事にご注目お願いします!