【22歳で月収100万円達成】
フリーランスエンジニア"あおい"のプロフィール

機械学習とは?月単価80万円データサイエンティストが勉強法も解説

こんにちは!フリーランスデータサイエンティストのあおいです。

今日は機械学習の勉強法を解説します。

「データサイエンティストになりたい!」

とか

「データサイエンスを理解してビジネスに生かしたい」

と考えている方は機械学習を勉強すると良いですよ。

機械学習が出来る様になると、

  • 株価予測
  • グループ分け
  • レコメンドシステム
  • 評判分析

などの仕組みが作れるようになり、ビジネス改善や売り上げ増加にとっても役立つんです!

もちろん、技術を理解するにはそれなりの努力は必要ですが、機械学習はほぼ独学の私でも理解出来たのだから、みなさんにも出来ます!

本記事では出来るだけ分かりやすく解説するので、ぜひ参考にして下さいね^^

機械学習をマスターする上で持っておくべき6つの知識

機械学習を習得して仕事に活かす為には6つの知識が必要です。

それがどの様な知識かと言うと、

  1. Pythonの文法
  2. 基礎的な統計学
  3. データ分析ライブラリ
  4. 特徴量作成・削減
  5. 主なアルゴリズムのメリット・デメリット
  6. 課題整理

の理解をすると良いです。

なお、1〜5までは勉強すれば身につくものですが、6に関しては実践や人からのフィードバックで身につくものと考えています。

先日私はこんなツィートをしたのですが、

その時お会いしたデータサイエンスの技術顧問の方は本当に問題の細分化力と整理力が優れていました。

機械学習も何かの課題を解決する為に使われるものです。

例えば、「レコメンドエンジンを作成して欲しい」と依頼された時、何の為にレコメンドエンジンが必要なのかを明確にする事で作成方法が変わって来ます。

  • 関連商品を紹介する事で売り上げUPを目指す
  • ユーザーが欲しいものを検索しなくても買える様にしECサイトのユーザー満足度のUPを目指す

のかでは作成方法が異なって来ると思いませんか?

また、この必要な理由があやふやだと機械学習がビジネスに役立つものにはなりません。

ビジネス側の担当者が必要な理由をよく理解していない場合も多いので、ニーズを引き出すヒアリング力やそれに伴った課題の細分化や整理も行えると良いです。

あおい

「機械学習が必要な意図」を理解出来、技術的なスキルも十分なデータサイエンティストになりましょう

機械学習を勉強する時に注意すべき事

機械学習を勉強する時に注意すべき事は

  • 機械学習で何を実現したいのか明確にする
  • 機械学習の仕組みを理解する
  • 自分のレベルにあった学習教材を選択する
  • 座学だけで終わらない

以上の4つです。

それぞれを詳しく見ていきましょう!

機械学習で何を実現したいのか明確にする

機械学習にも色々とあり、何を実現したいのかで勉強すべき内容が大きく変わります。

例えば、ユーザー分類を行いたい場合はクラスタリングという手法を、株価予測を行いたい場合は回帰という手法をメインで学ぶと良いです。

もちろん、機械学習の全体感を把握するのは重要なのですが、ざっくりした知識しかないと業務に生かせなくなってしまいます。

一度概要をつかんだら、枝葉の部分である具体的な手法を詰めていきましょう。

機械学習の仕組みを理解する

機械学習の仕組みを理解しないと何も始まりません!

なので、まずは「XXは何なのか?」や「なぜXXは必要なのか?」に注目して勉強を進めていきましょう。

あおい

機械学習のアルゴリズムを書いて、そこにデータを入れて精度を出す事は驚くべき程簡単です。

しかしそんな、

  • なぜその手法なのか
  • 何を分析しているのか
  • 設定しているパラメーターは本当に正しいのか
  • なぜその精度が有効と言えるのか

を答えられない機械学習は全く意味がないですよね。

さらに、その機械学習が売り上げUPの為のものなのにアルゴリズムが完全に間違っていて、導入後売り上げが大幅に下がってしまったら・・・。

恐ろしすぎますね・・・-_-

業務委託なら損害賠償沙汰ですし、正社員ならその後昇格出来る未来はないでしょう。

なので、しっかり仕組みを理解する事は大事なのです。

自分のレベルにあった学習教材を選択する

自分のレベルにあった学習教材で勉強するのは、効率的な学習をしたり挫折しない為にも重要です。

と言うのも、機械学習の本でかなり難しい数学が含まれているのに、「初学者向け」として売られているのはかなり多いからです。

私自身、理系の大学を卒業(生命科学部)しデータサイエンティストとして3年ぐらい働いていますが、その手の初学者向けの本の内容は未だ理解出来ません・・・。

例えば、

  • オライリー出版
  • 講談社の機械学習プロフェッショナルシリーズ
  • 共立出版

は要注意です!ちゃんと中身を確認してから購入しましょう。

“ちなみに”
データサイエンスは未経験だけど物理系で慶應大学・大学院卒の友人が、上記の難解な数学が含まれる初学者向けの機械学習本を読んだ所、「ちょっと数学の復習が必要だったけど、何とか理解出来たよ」と言っていました。

なので、大学数学以上の知識がある人はどんな本を読んでも大丈夫かもしれません。

座学だけで終わらない

実際に働く事は学んだ事を趣味で終わらせず、仕事にする第一歩です。

これには2つの意味があります。

まず、「どの機械学習アルゴリズムを使うべきかを考える」点で今まで勉強した事の総復習が出来ます。

そして、実際にデータサイエンティストとして働いてみると感じるかもですが、

  • 現状ビジネス的に何が問題なのか
  • どの様な状態になるのがベストなのか
  • 本当に機械学習が必要なのか(別の方法で課題解決を出来ないのか)
  • 機械学習の分からないお客さんにどの様に説明するか

など、機械学習が全く関係ないビジネス力が必要になる所も多いです。

私は大学生の頃、データサイエンティストのインターンをしていたのですが、その時インターン先の社長からこんな話を聞きました。

データサイエンティストとして働くにはデータサイエンス力・ビジネス力・エンジニア力の3つを身につけると将来需要の高い人になるよ。3つの内、2つだけでもいいんだけど、3つ身につけると最強だよ。

社長

この言葉は今になっても分かりみが深いです。

例えば、私の知人に3つの力を備えている最強データサイエンティストがいるのですが、今は技術顧問として何十社ものコンサルをしています。需要の高い最強人材ですね!

データサイエンスとエンジニア力は独学でも頑張れば身につきますが、ビジネス力だけは実践してみないと身につきません。

あおい

すぐには身につかないかもしれませんが、焦らず学んで行きましょう!

独学で機械学習を身につけた私の勉強法5ステップ

次に、ほぼ独学で機械学習を身につけた私の勉強法をご紹介します。

私がデータサイエンスを始めたのは4年前の大学生の時で、当然お金もなく「何とか格安で身につけられないかな?」と思い色々試行錯誤してきました。

その後、独学と所属していた会社の研修を上手く組み合わせて、今まで1万円もかけずに機械学習の知識を身につける事に成功しました!

では、その方法を見て行きましょう。

“ちなみに”
私が受けた会社の研修は外販もしていて、今学べる機会はみんな平等だなあと感じています。
また、その会社の研修よりもっと格安で学びやすい方法もあるので、そちらをご紹介します。

ステップ1:Udemyで機械学習の概要を掴む

まずは、Udemyというオンライン教材で機械学習の概要を掴みましょう。

Udemyとはシリコンバレー発のオンライン学習教材のプラットフォームです。

Udemyの魅力は何と言っても「格安で充実した教材」である事です。

と言うのも、通常なら1つの教材につき1万円ぐらいしてしまうのですが、セール時期だと1300円程度で購入出来ます。

また、質問をすると返信が返ってくる教材も多く、「独学ゆえに理解出来ないで終わってしまった・・・」と言う事もないです。

機械学習の知識を身につけられるUdemyの教材は以下の記事で紹介しています。

【Pythonは独学でOK】Udemyのおすすめの講座でデータサイエンティストになる方法

Pythonの基礎が固まっていない人も記事の通りに勉強していけば機械学習の概要を理解出来るレベルになります。

あおい

Udemyを使って効率的に概要を身につけましょう!動画を2倍速にして学んでいくのがおすすめです。

ステップ2:線形代数・統計学の知識を身につける

線形代数や統計学の知識は機械学習を”正しく”理解する為に必要です。

なので、「数学が苦手・・・」と言う人も頑張って身につけましょう!

とは言え、線形代数や統計学も深く勉強しようと思えばキリがないので、まずは機械学習の理解に必要になる部分だけで大丈夫です。

線形代数なら「大学の教養課程で学ぶ程度」、統計学は「統計検定2級に合格出来るぐらい」で十分と感じています。

線形代数と統計学の勉強法は

未経験からデータサイエンティストになる具体的方法と私がおすすめしない理由

の記事の「ステップ2:数学」に書いてあるので参考にして下さい。

あおい

線形代数が理解出来ないと統計学は理解出来ません。そして、統計学が理解出来ないとなぜこの機械学習のアルゴリズムが有益かを理解出来ません。

ステップ3:データ取得・前処理の手法を理解する

次に、機械学習を理解するなら絶対に必要になるデータ取得&前処理の知識を身につけましょう。

ちなみに、前処理とはざっくり説明すると「機械学習でデータを使う際にデータを扱いやすくする方法」です。

データ取得は言わずもがなデータを取ってくる方法です。

そして今、機械学習の精度を上げるには前処理の工程で90%決まると言われています。

あおい

それだけ前処理は大切なのです。

データ取得と前処理の勉強法も以下の記事の「ステップ3:データ取得・前処理」にまとめてあります。

未経験からデータサイエンティストになる具体的方法と私がおすすめしない理由

記事中で紹介しているPyQと言うオンライン教材も格安で機械学習に必要な知識を勉強出来ます。興味のある方はチェックしてみて下さい。

あおい

格安で知識を身につけるのがあおい流です笑

ステップ4:主要な機械学習のアルゴリズムを理解する

ここでようやく機械学習アルゴリズムの理解に突入です。

ステップ4が機械学習の勉強のメインに思われがちですが、ここまで読んで下さった読者さんならアルゴリズムの理解は勉強の一部である事を知っていただけたのではないでしょうか。

さて、機械学習アルゴリズムの勉強もUdemyやPyQを活用すると良いです。

もはやお馴染みになりつつあるこちらの記事

未経験からデータサイエンティストになる具体的方法と私がおすすめしない理由

の「ステップ4:機械学習」の所に詳しい方法や教材が書いてあります。

“ちなみに”
記事中で紹介している「Python言語によるビジネスアナリティクス 実務家のための最適化・統計解析・機械学習」と言う本は私が新卒の時から実務で機械学習が必要になった時はいつも参考にしている本です。

機械学習を実務でどう活かすかについて詳しく解説してあり、働く際には買っておいて損がない一冊と感じています。

ステップ5:ビジネスに活かす方法を身につける

最後に今まで学んで来た機械学習をビジネスにどう活かせるのかを学びましょう。

その際には「AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル、ベストプラクティス、アーキテクチャ」と言う本が便利です。

こちらの本は一部数学的に難しい内容も含まれるのですが、機械学習が必要になるケーススタディが詳しく載っていてとても参考になる一冊です。

ビジネスに機械学習をどう活かすのかはケースバイケースになので正解はないのですが、この本には基本的な考え方が網羅されています。

あおい

私は実務で何度もこの本に助けられました!

では、最後に機械学習を身につけた後の将来について見ていきましょう。

機械学習を身につけた後の活動の幅

この記事を読んでいる方は「ただ機械学習を身につけたいから勉強する」と思ってはいないでしょう。

身につけた先に何らかの目標があり、それを達成する為に学んでいるはず。

こちらでは機械学習を身につけたらどの様に活躍出来るのかを見ていきましょう。

データサイエンティストになる

機械学習を身につけたらデータサイエンティストになれる”可能性が開けます”。

「可能性が開ける」と濁しているのはデータサイエンティストになるにはディープラーニングやWEBも理解しておいた方が良いからです。

ちなみに、ディープラーニング&WEBも勉強したい方はこちらの記事の「ステップ5:ディープラーニング&ステップ6:WEB」を参考にしてみて下さい。

未経験からデータサイエンティストになる具体的方法と私がおすすめしない理由

一方、未経験でデータサイエンティストになれる求人はとても少ないのが現状です。

「データサイエンティストは不足する!」と騒がれていますが、だからと言って企業は1からデータサイエンティストを育てる余力はないのです。

そして、データサイエンティストの求人は経験者に集中します。

なので、未経験からデータサイエンティストを目指している方は時間はかかるかもしれませんが、縁がある企業を探すしかありません。

なお、データサイエンティスト求人を探すには「ギークリー(Geekly)」と「ワークポート(WORKPORT)」という転職エージェントが便利です。

私も転職活動の際にお世話になりました。

評判の良い転職エージェントのギークリー(Geekly)を利用した感想と口コミ 評判は?転職エージェントのワークポート(WORKPORT)を利用した感想と口コミ

転職の際に求人を探している方は上の2つの記事を参考にして下さいね。

ビジネスに活かす

自社のビジネスに活かしたく機械学習を勉強した人は、他の企画職やエンジニア職と連携しながらより良いビジネスを作っていきましょう。

機械学習を理解していると企画職とエンジニア職のパイプ役になれ、社内での人材需要が高くなれます。

また、機械学習を使いビジネス企画した経験はのちに転職活動をした時他社からも高く評価れてるはず。

一方で、学んだ事ですぐにビジネス的な成果が出るかは別の話です。

現在、データサイエンスを活かして売り上げUPや業務改善を達成出来た企業はまだ少ないです。大抵の企業はR&Dを抜け出せず、今も研究・検証段階です。

その理由は、

  • データ量が十分にあるか
  • データに相関が見られるか
  • プロジェクトを継続出来るだけの予算が十分にあるか

などの全部の条件が揃わないとビジネス的な成功にならないからです。

ちなみに、私の肌感にはなってしまいますが、ほとんどの企業は「データ量が十分になく」終わってしまいます。

あおい

今まで携わって来たプロジェクトで、5000ぐらいのデータを渡され「これで機械学習をして下さい」と言われる事が多かったのですが、「5000では足りないですね・・・」と残念な結果が出た事が多々ありました。もちろん、5000で足りないかは実現したい事によるのですが。

なので、プロジェクトを始める前に「機械学習プロジェクトが成功するかは外的要因の部分も大きい」と言う事を頭の片隅に入れておきましょう。

まとめ

一見、どこから手をつけていいのか分からない機械学習ですが、段階を経ていくと無理なく勉強出来る事が分かっていただけたと思います。

もちろん、すぐには身につかないかもしれませんが、諦めずコツコツ勉強していきましょう。

現在ITに全く関係がない企業が少ない様に、これからデータサイエンスに関係がない企業が少なくなっていくと予想されています。

そして、その時に機械学習の知識があると、自分がエンジニアにならなくても大いに役立ちます。

この記事を見たのをきっかけに勉強にチャレンジしてみましょう!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です