2章教師あり学習
前に述べた通り、教師あり機械学習は、最もよく用いられ、そしてうまく機能しているタイプの機械学習だ。本章では教師あり学習について詳しく述べ、いくつかのよく使われる教師あり学習アルゴリズムについて説明する。既に「1章 はじめに」でアイリスの花を物理的に測定することでいくつかの品種にクラス分類する機械学習のアプリケーションを紹介した。
教師あり学習は、ある入力に対して特定の出力を予測したい場合で、入力出力のペアの例が入手できる際に用いられることを思い出そう。入力出力のペアが訓練セットとなり、それから機械学習モデルを構築する。目的は、新しい見たことのないデータに対して正確な予測を行うことである。一般に、教師あり学習を行うには訓練セットを作るために人手が必要になるが、ひとたび学習が終われば、非常に人手がかかるタスクを高速化したり、不可能なタスクを可能にすることができる。
2.1 クラス分類と回帰
教師あり機械学習問題は2つに大別することができる。クラス分類(classification)と回帰(regression)だ。
クラス分類の目的は、あらかじめ定められた選択肢の中からクラスラベルを予測することである。「1章 はじめに」では、例としてアイリスの品種を3つの選択肢の1つを選んだ。クラス分類はしばしば、2クラス分類(binary classification)と多クラス分類(multiclass classification)に分けられる。2クラス分類は2つだけのクラスを分離する特殊ケースで、多クラス分類は、3つ以上のクラスを分離する問題である。2クラス分類は、答えがイエス/ノーになる問いに答えるようなものと考えればよい。メールがSPAMであるかどうかを判断する問題は、2クラス分類の例である。この2クラス分類タスクでは、「このメールはスパムか」というイエス/ノー問題が問われている。 ...
Get Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.