こんにちは!フリーランスデータサイエンティストのあおいです。
今日は、未経験からデータサイエンティストになる際に考えておきたい事や方法を解説していきます。
この記事を見ている方は
「21世紀で最もセクシーな職業はデータサイエンティストである」
という話を聞いた事がある方もいらっしゃるのではないでしょうか?
普段データサイエンティストとして働いている人間からすると「セクシーって何やねん笑」って話です笑。
そもそも、人の役に立っていない仕事なんてないと思っているので、「最もセクシーな職業」なんて存在しないのでは?とも感じてもいます。
一方、
「高給を目指せそう」
とか
「手に職をつけたいから」
と言う理由でデータサイエンティストを目指している方も多いのではないのでしょうか?
未経験からデータサイエンティストになるには研修やOJTが充実している会社に入社出来れば可能であると感じています。
しかし、今までデータサイエンスの事を何も勉強していないのに、その様な会社に就職しようとしても採用はされないでしょうし、仮に運良く採用されたとしても本当に充実して仕事が出来るとも思えません。
この前、「僕と契約してデータサイエンティストになってよ!」 分析少女ありさ☆アリスの悲劇と言う面白い記事を読みました。
この記事は面白いだけでなく、現在のデータサイエンス業界のあるあるもリアルに描画していて就職者に参考になる記事です。
仕事は自分の人生を左右する重要な要素です。
本記事が「未経験からデータサイエンティストになる」という選択がプラスになるかどうかを考えるきっかけになれば幸いです。
また、私自身が非情報科学の学部を卒業し、独学や研修を組み合わせながらデータサイエンスを身につけてきました。
初任給は24万円で一般的な相場だったとはおもいますが、その後独立し実務2年目以降から単価80万円ぐらいのフリーランスになる事ができました。
私の経験を元にした高額なスクールに通わず勉強する方法も解説します!
目次
現役データサイエンティストがよくあるデータサイエンティストになりたい理由を潰す?
「データサイエンティストになれば将来安泰!」と思っている人があまりにも多すぎて驚きます。
結論から言うと、「安泰かどうかは自分次第」です。
なぜなら、データサイエンティストとして成功するには、常に努力し、自分で道を切り開いていく必要があるからです。
そして、話を聞いていると「データサイエンティストではない仕事の方が合っているのでは?」と言う方にも多く出会って来ました。
つまり、万人が目指すような職業ではないということです。
だから、データサイエンティストを目指している方に、この記事では「優しさ」として、データサイエンティストになりたい理由を潰していきます笑。
あなたはなぜデータサイエンティストになりたいと思ったのでしょうか?
- 人材需要がありそうだから
- 食いっぱぐれなさそうだから
- 高給が目指せそうだから
- 手に職をつけたいから
- 最新技術に触れられるのは面白そうだから
未経験者がデータサイエンティストになりたい理由をざっと考えましたが、こんな所でしょうか。
私はインターンの時も含めると3年間ぐらいデータサイエンティストとして働いて来ました。
なので、まだ3年間しか働いていないゆえ私もまだまだ未熟な点がありますが、上記に対して私が思う反論を書いて行きます。
人材需要がありそうだから
現段階で仕事は経験者の所に集中しています。
少し前まで未経験者だったデータサイエンティストに仕事を教えながらプロジェクトをこなすより、シニアデータサイエンティストが1人で仕事をこなした方が早く成果も出るからです。
なので、「ちょっと勉強しました!」程度ではスキルアップにつながる仕事は来ないです。その為、未経験者を採用し、データサイエンティストとして育てたいと言う企業は少ないんです。
ちなみに「未経験者歓迎!」と謳いデータサイエンティストを採用している企業は、任せられる仕事が本当にデータサイエンティストの仕事なのかを確認しましょう。
データサイエンティストの仕事として、
- エクセルのスクショ
- アノテーション※
- PCを使えれば誰でも出来る単純作業
例えば犬の画像があって、ここは目、ここは耳、ここは鼻・・・と言う様に印をつける事でAIに学習させる時に使いやすくする事が出来ます。
を任せられる企業も残念ながら多いです。これらの仕事はどう考えてもデータサイエンティストの仕事ではないですよね・・・。
また、AIに力を入れていると有名な誰もが知っている巨大企業でエンジニアとして働いている知人がいるのですが、「その会社のデータサイエンティストよりDataRobotを使って分析した方が精度が高く出る事も多い」と話していました。
知人の会社でデータサイエンティストとして働くには相当凄腕でないと入社出来ないので、衝撃的でした。
DataRobotとはデータ分析自動化ツールの事ですが、「もうそこまで技術は進歩しているんだなあ」としみじみ。
会社の最大コストは人件費です。ツールで出来る事をコストフルな人間には頼まないですよね。
あおい
食いっぱぐれなさそうだから
今後の日本のAI・データサイエンス産業が必ず右肩上がりとは言えないのではないでしょうか。
不況の際には研究開発費が真っ先に削られます。
東京オリンピック以降は経済状況が落ち込むと言われていて、そうなったらAI・データサイエンス系の研究開発予算を削る会社も多く出てくるはず。
また日本の少子高齢化問題を解決する為に、今後外国人労働者の規制が緩和されると予想しています。その場合は、外国人労働者と仕事を奪い合う事になります。
IT業界は学歴・年齢不問の実力主義な会社が多いので、当然国籍不問の会社は今後より多くなるでしょう。実際、すでに「外国人のエンジニアを増やしたい」と採用を積極的に行っている会社も多いです。
一方「日本語が武器になるよ!」と思っている方もいるかもしれません。先日こんな記事を見つけました。
コンビニの外国人店員に勝てる要素がない
若く異国にやって来てさ、勉強しながら働いててさ、そんな立派なお姿にさ、我恥じ入るわけよ?
引用:はてな匿名ダイアリー
今ままでそんなに意識して来ませんでしたが、コンビニで働く外国人店員さんって日本語を話してますよね。
外国人店員さん達はめちゃくちゃ努力して日本語を勉強しているはずですが、決して日本で生まれて育たないと日本語を話せる様にはならない訳ではないですよね。
私の知人に日本で働く中国人のデータサイエンティストの方がいます。
北京大学卒業してから日本の大手企業に入社した方なのですが、会社の日本語研修とその方の努力を2年間続けた所、日本語がペラペラでした。
あおい
難関の北京大学でデータ分析を専門に学ばれて、日本語もとても流暢(もちろん中国語も話せる)。
うーん・・・。
未経験の場合も含む、全データサイエンティストには他に強みを見つけないと食いっぱぐれる事もありそうです。
高給が目指せそうだから
確かに一部のデータサイエンティストは高給です。
しかし、高給をもらえるデータサイエンティストになるには険しい道のりです。
こちらはDeNAの新卒の募集要項なのですが、新卒でも1000万円ももらえると書いてます。
他にもIndeedやNECなどの会社が「新卒のデータサイエンティストに1000万円の年収を出す」と言っています。
これだけ見ると
データサイエンティスト志望
と思えそうですが、実際に年収1000万円をもらっている人の経歴を見ると、
- 学生の時に国際学会に論文を通した
- Kaggleで上位入賞した
などなど日本トップではなく、世界トップの新卒な訳です。
国際学会に論文を通すのも上位入賞するのも、言わずもがな、めちゃくちゃ努力しないと出来ません。
他の人が遊んでいる間も毎日データサイエンスに取り組んだはずです。
その為、世界トップの新卒に年収1000万円は普通ではないでしょうか。
決してデータサイエンティストだから高給と言う訳でもないと感じています。
あおい
人が出来ない事が出来るから、会社の売り上げに貢献出来るのです。
データサイエンティスト職で新卒で年収1000万円を獲得した人を知っているのですが、エンジニアリングとコミュニケーション力もピカイチな方です。
一方、こんな出来事もありました。
親しくして下さるトップアフィリエイターの方と話している時、トップエンジニアの給料の話になったのですが、
私が「Go◯gleでデータサイエンティストとして働いている方は年収1500〜2000万円ぐらいもらってますよ」と言うと、
「そのぐらいなんやな。アフィリエイトならもっと稼げるけどな」とおっしゃっていてハッとしました。
エンジニア職なら年収2000万円なんて夢のまた夢です。でもそれはエンジニア職だからその値段なんですね。
金儲けをしたいなら、自分でビジネスを始めた方が良さそうです-_-
手に職をつけたい
手につけた職でご飯を食べる為に、技術のアップデートを随時していかなければなりません。
その為には休日も勉強に使う事が多々あるはず。
ちなみに、これはデータサイエンティスト職に限ったことではなくて、美容系とか医療系でも当てはまります。
私の父は医療系の仕事をしているのですが、休日に技術講習会なるものに参加していて、「技術系の仕事は定期的な勉強が不可欠なんだなあ」と感じました。
もちろん、業務時間内に必要技術の勉強は済ませられた方が良いですが、光った技術を持っているデータサイエンティスト はみんな休日も勉強しています。
例えば、Aさんは休日はオフ日と決め休んでいて、Bさんは業務時間内も効率的に勉強し休日も勉強していたとします。
それが10年ぐらい続くと、AさんとBさんの間のスキルの価値に差がないかと言うとそんなはずはないですよね。
その時に、AさんとBさんの活躍度合いや給料の差も当然発生します。
若い方は「活躍したいし勉強するのは苦ではないよ!」と思うかもしれません。
しかし、40代・50代の方は子育てや介護があって体力も落ちてくる訳で、若い間と同じ様に勉強するのが辛いと言う声も多く聞きます。
その様な方はマネジメント職に移る場合が多いですが、あらかじめ今後のキャリアは考えておきたいですね。
最新技術に触れられるのは面白そう
ちょっと触ったぐらいじゃ役立たないし、趣味と一緒です。仕事にはなりません。
最新技術は、理解して腑に落として使えるようになって、初めて仕事で役に立ちます。
その過程は上手く出来ない困難もあるし、時間もかかります。
また、仕事なので成果を出さなければいけないと言うプレッシャーもありますし、残業もあります。
全て面白そうだけでは済まされないのです。
楽して楽しく食いっぱぐれなく高給を目指せる仕事はありません。
あおい
何を専門とするデータサイエンティストになりたいのか
純粋に「データサイエンティストになりたい!」と思っている人も多いはず。
実際私も「データサイエンスが楽しい!」と思い、この仕事を選びました。
インターンでデータ分析の実務に携わった時に「データ分析ってこんな事まで分かるんだな」と感動しました。その気持ちが今も仕事を続けられる原動力になっています。
一方、データサイエンティストの仕事は色々とあり、「データサイエンティストと呼ばれるとあまりにも一つにまとめられ過ぎじゃない?」と感じます。
例えば、データサイエンティストを細分化すると以下の職種の人がいます。
職種 | 仕事内容 |
エクセル・統計解析ソフト(SPSSなど)を使い分析するSE | エクセル・統計解析ソフトを使い分析する。 データ量はそこまで多くない事が多い。また、算出された精度が厳密でないといけない場合も多い。 |
データベースエンジニア | SQLを使いデータ分析をする。 比較的単純な指標の算出の事が多い。 |
機械学習エンジニア | 仮説に基づき機械学習の手法を用い分析を行う。 分類・回帰がメイン。 |
ディープラーニングエンジニア | 特徴があると考えられるデータに対してディープラーニングの手法を使ってアウトプットを出す。 データベースエンジニア・機械学習エンジニアが分析を行なった結果、特徴があると考えられるデータに対してディープラーニングの手法を使う事が多い。 |
難易度的には、エクセル・統計解析ソフトを使い分析するSE が最もなり易く、下に行くに従って難易度が高くなると感じています。
業務で色々と引き受ける事にはなるのですが、どのエンジニアとして自分の最も強みを持ちたいのか考えてみましょう。
ちなみに個人的に、エクセル・統計解析ソフトを使い分析するSEを目指す事はあまり勧めません。
理由は、スキルがツールに依存してしまい、ツールが変更されたとか使われなくなったとかがあった時に、スキルが初心者の人と横並びになってしまうリスクがあるからです。
SQLやPythonなどのプログラムをゴリゴリ書くデータサイエンティストになるのとスキルアップや転職をしやすいので、特に理由がない限りはそちらを目指すと良いです。
一方、
- マーケター目線のデータベースエンジニア
- コンサルタント目線の機械学習エンジニア
など文系職寄りのデータサイエンティストもいます。これらの職種ではデータ分析もするのですが、どちらかと言うとコンサル業がメインです。
なので将来的にでも
- マーケター観点でアウトプットを出すのか
- コンサルタント観点でアウトプットを出すのか
- エンジニア・サイエンティスト観点でアウトプットを出すのか
と言う視点も考えたほうが良いです。
もちろん、マーケター観点でアウトプットを出すならマーケティング力が必要で、コンサルタントも同様です。
マーケター・コンサルタント職で働いていなく、これらの視点で強みを持ちたいと考えるなら、マーケティングorコンサルティングに強みを持つデータ分析会社に就職するのが一番でしょう。
データサイエンティストの必要スキル6個
「データサイエンスを勉強する」と言っても未経験者なら何から手をつければ良いのか分からないはず。
この項目では、データサイエンティストとして働く為に必要なスキル6個をご紹介します。
まずはデータサイエンスに使われる技術を細分化してみましょう。
理由は、
- Pythonが使われている現場の方が多い
- Pythonの方がディープラーニングライブラリが豊富
- WEBに組み込む時にRだと不便
と言う点があるからです。
なので、今回はPythonに焦点を当てて解説します。
- Python
- 数学(数学、特に統計学の知識)
- データ取得・前処理 (SQL・Pythonのデータ分析フレームワークを使った取得など)
- 機械学習 (回帰・分類など)
- ディープラーニング(CNN・RNNなど)
- WEB (Django・Flaskなど)
1・2・3は全員にとって必須スキルで、4・5はまずどちらかができればOK、6は3・4が出来る様になった後に取り組めばOKです。
データ分析やAI開発では特に統計学の知識が土台となります。
学習にさける時間は限られているはずなので、時間の大部分は統計学に回すと良いです。
次にそれぞれ、どの様に身につけて行くのが良いのかお話ししますね。
データサイエンティストの必要スキルの身につけ方
データサイエンティストとして働くのに必要なスキルの身につけ方を解説します。
ステップ1:Python
Pythonを勉強する際は、
- 文法を理解する
- 簡単なアルゴリズム問題を解く
の2ステップに取り組むと良いです。
文法を理解するにはUdemyの活用すると低コストで効率的に勉強出来ます。
詳しくはこちらの記事をご覧下さい。

並行してこちらの書籍も読むとUdemyで学んだ事が復習しやすいです。
「みんなのPython」ではPythonの文法が詳しく分かりやすく解説されています。
この本に載っている内容は全て理解しているのが次のステップに進む時の指標です。
次に簡単なアルゴリズム問題を解いてみましょう。
その際には、Paizaと言うサイトのスキルチェックが有効です。
最低Cランク、理想はBランクの問題を解ける様になりましょう。
あおい
まずPythonと言う基礎がないと、3〜6が全く手をつけられなくなります。
中々理解出来なくても焦らずじっくり取り組んで下さい。
この2ステップを完了する事でPythonの基礎知識の理解はひとまずOKです。
ステップ2:数学
数学は
- 線形代数
- 統計学
を押さえておけば大丈夫です。
本当は多変量解析とかも必要なのですが、一旦はこの2つを重点的に勉強しましょう。
ですが、いきなりこの2つを勉強出来るのは高校で理系を選択している人のみでしょう。
文系の人は高校数学もやり直す必要があります。数3を勉強しましょう!
高校数学をやり直す際は、マセマシリーズが分かりやすいです。
マセマシリーズは私が大学受験の時に使ったのですが、他の参考書より説明が圧倒的に丁寧です。 数学に苦手意識のある方も無理なく勉強出来ますよ。
線形代数の勉強法は

統計学の勉強法は

にまとめてあります。
ステップ3:データ取得・前処理
データ取得・前処理では、
- SQL
- データ分析フレームワーク
の知識を学ぶ必要があります。
まず、なぜこの2つなのかをご説明しますね。
データ分析でデータ取得してくる方法は2つあります。
- SQLを使いデータベースから取得
- エクセル・CSV形式でデータが渡され取得
どちらかと言うとSQLを用いて取得する事の方が多いですが、セキュリティ的にエクセルorCSV形式でしか取得出来ない事も多いです。
後者の場合だとデータ分析フレームワークを使いデータ取得して来ます。
1・2どちらの方法でもデータ分析フレームワークで前処理を行います。
では、それぞれの学び方を見ていきましょう。
SQL
SQLはデータベースをいじりたい時に使う言語です。
データを取得したり、条件を設定してその条件に合ったデータのみを取得したりがSQLを使うと出来ます。
SQLを学ぶにもUdemyを活用しましょう。
私のオススメの講座は中村祐太先生の「はじめてのSQL・データ分析入門 – データベースのデータをビジネスパーソンが現場で活用するためのSQL初心者向コース」です。
データ分析に特化したSQLの講座で、実務で使いそうな文法が幅広く網羅されている所が良いです。
セール期間中だと1300〜2000円で購入出来るのでお見逃しなく!
また本で学ぶなら「スッキリわかるSQL入門」が分かりやすいです。
- ドリル形式になっていて実際にSQLを書きながら学べる
- 分からない事が出て来た時に辞書代わりに出来る
と言う点が勉強しやすいポイントです。
あおい
データ分析フレームワーク
データ分析フレームワークの知識は、
- 前処理※
- 機械学習
- ディープラーニング
と幅広い場面で不可欠です。
※前処理とはデータを使い易くしたり、無いデータを取り除いたりする工程です。
前処理をしないと、データが機械学習やディープラーニングで扱えない事も多いです。
また、機械学習・ディープラーニングで精度を上げる為には前処理を工夫しないといない場合も多く、前処理はかなり重要です。
データ分析フレームワークの知識は、機械学習とディープラーニングの勉強をしていれば基礎的なものは身につきます。
より詳しく勉強したい方はPyQで勉強するのが格安で深い知識を身につけられる方法です。
PyQの体験レビューはこちらの記事でしているので興味のある方はご一読して下さい。

ステップ4:機械学習
機械学習の知識を身につけるには、
- Udemyで基礎知識を身につける
- Kaggleに取り組んで知識を定着させる
- 本を読んで色々な手法を学ぶ
の3ステップを踏む必要があります。
まず機械学習を勉強する際にはこちらの記事で紹介しているUdemyの講座を活用すると良いです。

Udemyを勉強し終わったら、Kaggleの「タイタニックチャレンジ」というKaggleビギナー向けのものをやってみましょう。
KaggleのHPに行ったら、検索キーワードボックスに「Titanic」と打ちましょう。
Kaggleとはデータ分析に興味がある人たちが集まるプラットフォームで、分析のコンペティションが開催されています。世界中のデータサイエンティストと競い合う事が出来ます。
まずは自力でTitanicのデータを分析してみて下さい。
しかし最初だと分からなくなる事も多いので、その際はこちらのように既にTitanicチャレンジに取り組んでいる人のコードを参考にしましょう。
あおい
楽しみながら勉強出来るのが1番です!
最後に本を読んで知識を深めましょう。
勉強の際には、
「Pythonによるデータ分析入門」と
「Python言語によるビジネスアナリティクス 実務家のための最適化・統計解析・機械学習」が基礎から応用まで幅広く載っていて網羅的です。
Pythonによるデータ分析入門は基礎的な内容が豊富で、Python言語によるビジネスアナリティクスでは実践的な内容が豊富なので、読む順はPythonによるデータ分析入門→Python言語によるビジネスアナリティクスの順が良いです。
Python言語によるビジネスアナリティクスには演習問題も付いているので取り組んで見ましょう。
ステップ5:ディープラーニング
ディープラーニングには
- CNN
- LSTM
- 強化学習
- GAN
などの種類があります。
自分が取り組みたいものから勉強するのが良いです。全て勉強する必要はありません。
それぞれで何が出来るかと言うと、
モデル | 利用シーン |
CNN | 画像認識・物体検出など |
LSTM | チャットボット・経済予測・音声認識など |
強化学習 | ゲーム攻略・アドテクノロジーなど |
GAN | 画像生成・文章の画像起こし・動画の翻訳 |
の様な事が出来ます。
CNNの勉強法はこちらに

RNN・LSTMの勉強法はこちらに

にまとめました。
それぞれのモデル作成のための基礎を身につけたら、自分でオリジナルなディープラーニングを作ってみましょう。
データはKaggleにあるものを使うと良いです。
私が画像認識の勉強をしていた時、犬と猫の識別器を作りました。犬と猫が好きなので、データを見る度に幸せな気持ちになりました笑。
ちなみに、その識別器に友人の写真を入れると犬と判定されたので、まだ改善の余地がありそうですね苦笑。
そうやって色々と工夫しながら学ぶのが一番勉強になりますよ。
ステップ6:WEB
WEBは1〜5が出来る様になってから取り組むので問題ないです。
WEBがデータサイエンティストにとって必須スキルかと言えば微妙な所だからです。
ただ、WEBが出来ると活躍の幅が広がります。
データ分析した結果をWEBに組み込んだりする事は結構あるので、WEBが出来ると特です。
PythonのWEBフレームワークはDjangoとFlaskがありますが、最初全くWEBの事が分からない状態で勉強をするのならDjangoに手をつけてみるのが良いでしょう。
理由はDjangoの方が本やネットでの情報などが多く、調べやすいからです。
Djangoの勉強法は

Flaskの勉強法は

に書いたので見てみて下さい!
まとめ
「データサイエンティストになりたい!」と漠然と思うのではなく、
- なぜデータサイエンティストになりたいのか
- 何を専門とするデータサイエンティストになりたいのか
を明確化しましょう。
すると、目指すべき方向がクリアになり勉強の効率や目標の達成速度が早くなります。
また会社でも活躍出来、昇給も目指せるという良い事づくめです。
この記事が自分の思いに振り返るきっかけになると幸いです。
[…] 未経験からデータサイエンティストになる シリーズの第一弾である目標設定編をまだ読んでいない人がいたら読んで見てください(^^) […]
[…] 未経験からデータサイエンティストになる〜目標設定編〜 […]