こんにちはsatoshiです。
最近、キーワード検索でデータサイエンティストという言葉が良く検索されているそうです。大学でもデータサイエンティスト学科が誕生しており、目指す人も多くいると思われます。
そこで、今回はデータサイエンティストになるには何が必要かベスト3を述べたいと思います。
ちなみに私は、データサイエンティストではありませんが、会社内で育成する動きがあり今後のキャリアを考えても、データサイエンスを身に付けることは有意義だと感じています。
1位 ビジネスの経験
これは必須の経験です。一番大事です。ドメイン知識と言われたりもしますが、業界ごとに経験するビジネスの知識が非常にデータサイエンティストにとっては重宝されます。例えば、他業界からすると医療業界のことは全く分かりません。血液検査データを見ても、各項目(カラム)の数値がどの範囲に入っていれば良いとか、この値はエラーだとか判断ができません。どの業界でもドメイン知識があるため、現在全く違う仕事をしていれば、それはチャンスなのかもしれません。
2位 プログラミングスキル
プログラミングスキルも大切です。初心者にはPythonがお勧めですが、Rでも大丈夫です。また、SQLについても学びましょう。SQLがわからない人はググってほしいのですが、簡単に言うとビッグデータを扱うためのツールです。YouTubeやUdemyにたくさん学習動画があるので、一度見てみると良いでしょう。そんなに難しいことはできなくて良いです。
3位 統計学の知識
データサイエンティストは最低限統計学の知識が必要です。避けては通れないです。データサイエンスの命題としては「回帰」と「分類」の2つがあり、分布と回帰のモデルを理解するのに必要になります。
(回帰・・・マンション価格などを予測する命題のことで、代表的なものに単回帰や重回帰、ロジスティック回帰がある。
分類・・・アヤメの分類に代表されるような仲間分けの命題。Kaggleの初心者用の問題「タイタニック号」も分類の課題で、生存と死亡に分類する)
以上がデータサイエンティストになるには何が必要かベスト3です。こうして見てみると、データサイエンティストになるには、プログラミングスキルだけでは十分ではないことが分かると思います。今の仕事が、データサイエンスからかけ離れていれば、それは逆にチャンスだと、個人的には思います。
少しでも興味がある人は、21世紀最もカッコいい仕事と呼ばれているデータサイエンティストを目指しましょう!
コメント