1章機械学習プロジェクトのはじめ方
本章では、機械学習プロジェクトのはじめ方についてまとめます。
機械学習のプロジェクトは、普通のコンピューターシステムの開発に比べて予測精度を求めるなど試行錯誤をすることが多く、手戻りが発生しやすいため、ポイントを押さえて進めることが重要です。まずは機械学習の概要から、プロジェクトの流れ、機械学習特有の問題、成功させるためのチームづくりについて紹介します。
1.1 機械学習はどのように使われるのか
はじめに、機械学習とはどのように使われるものかについて簡単におさらいしておきましょう。
機械学習がよく使われる用途として、未知のデータに対して過去の経験(=過去のデータ)を元に機械が予測をする、というものがあります。たとえばGmailの「迷惑メール」の判定やAmazonの「この商品を買った人はこんな商品も買っています」の推薦など、過去の膨大なデータの傾向を元に、未知のデータに対して予測をします。
このように未知のデータに対して予測を行う場合、ビジネスで頻繁に使われるのが教師あり学習(Supervised Learning)というアプローチです。図1.1に、教師あり学習の処理の概要をあらわしています。教師あり学習は、大雑把に言うと既知のデータと何かしらのアルゴリズムを用いて、入力データ(画像のRGBや日時、気温などの数値をベクトル化したもの)と出力データ(「犬」「猫」などのカテゴリや降水量などの数値)の関係性を獲得し(これを ...
Get 仕事ではじめる機械学習 第2版 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.