こんにちはsatoshiです。
「データサイエンスの本を何冊か読んだけどどうやって実践経験を積めば良いの?」、「Kaggleは初心者には難しいし、基本全部英語だから理解できないよ(泣)」といった、方々も多くおられると思います。そんな初心者の方向けに是非お勧めしたいのは、データサイエンスのコンペに参加することです。今回は、データサイエンスのコンペについてご紹介したいと思います。是非、何かしらのコンペに挑戦してみてください。勉強になりますよ。
Kaggle(カグル):言わずと知れたデータサイエンスの超有名コンペサイトです。世界中のデータサイエンティスト達が集う、いわば世界大会、野球で例えるとメジャーリーグのような存在です。すべて英語のサイトではありますが、データサイエンティストなら知っていて当然のコンペサイトです。
コンペの種類も豊富にあり、初心者用のコンペもあります。コンペ上位者にはメダル(称号)が付与され、データサイエンティストとして就職する際に、かなり有利に働きます。また、ノートブックというコードの解説をしてくれているページもあり、グーグル翻訳をしながら見ると、かなり勉強になります。まずは、入門編の「タイタニック号コンペ」から始めてみてはいかがでしょうか?
SIGNATE(シグネイト):日本版カグルと言ってもよいと思います。野球で例えるとセリーグのような存在です。コンペ上位者には、称号が付与され、ビギナーからグランドマスターまでランクがあります。また、ビギナー専用のコンペも時々開催されており、まず初めに挑戦してみるのも良いのではないでしょうか。また、コンペだけでなく動画学習(一部有料)もあるため、初めは動画で学習するのも良いかもしれません。
Probspace(プロッブスペース):少しマイナーかもしれませんが、データサイエンスのコンペサイトです。私は、1度だけ参加してみましたが、参加者はあまり多くないので好成績を獲れる可能性有りだと感じました。とにかく上位にランクインしたいという人はお勧めです。野球で例えると、独立リーグのようなポジションでしょうか?
Atoma(アートマ):データサイエンスのコンペサイトですが、どちらかというとデータサイエンティストの育成に重きを置いているというのが感想です。コンペの期間が非常に短い(2週間程度)のが特徴で、すぐに結果を出したい人は良いかもしれません。また、運営によるYouTubeでの解説動画もあり初心者は、動画を見るだけでも雰囲気がつかめると思います。野球で例えると、育成リーグですね。
Nishika(ニシカ):音楽をテーマにしたコンペなどのかなりオリジナリティの高いコンペを実施しています。音の機械学習はLibROSA(リブロサ)というPythonのモジュールを使ったりするのですが、あまりコンペでは見かけないライブラリなので、勉強する良い機会だと思います。野球で例えると、変化球多めの独立リーグ?
Solafune(ソラフネ):これは、衛星データを活用したデータ分析に特化したコンペになります。はっきり言って初心者には難しいと思いますが、覗いてみると画像系コンペの勉強になります。野球で例えると…ネタ切れです。
今回は、データサイエンスの勉強としてのコンペサイトについてお話しましたがいかがだったでしょうか?
最初は、簡単なテーブルコンペ(表のみのデータのコンペ)にサブミットすることを目標にすると良いと思います。私も、いつかKaggleでメダルが取れるように日々精進致します。
コメント