41章詳細:ナイーブベイズ分類

これまでの4つの章で、機械学習の概念を説明しました。この章以降は、4つの教師あり学習のアルゴリズムと4つの教師なし学習のアルゴリズムについて詳しく説明します。まず、教師あり学習アルゴリズムの1つ目、ナイーブベイズ分類から始めます。

ナイーブベイズモデルは高速で簡単な一連の分類アルゴリズムであり、多くの場合、高い次元のデータセットに適しています。このアルゴリズムは非常に高速であり、調整可能なパラメータが少ないため、分類問題の最初の一手として有用です。この章では、ナイーブベイズ分類器がどのように動作するかを直感的に説明し、いくつかのデータセットで使用した例を示します。

41.1 ベイズ分類

ナイーブベイズ分類器(Naive Bayes classifiers)はベイズ分類法に基づいて作られています。これは統計量に対する条件付き確率の関係を説明するベイズの定理に依存しています。ベイズ分類では、ある特徴量(features)が観測された際に、そのラベルがLである確率に興味があります。これをP(L | features)と記述します。ベイズの定理は、これを直接的に計算できる量から求める方法を与えます。

[eq_410]

2つのラベル(ここではL1L2としましょう)を決定することを考えます。1つの方法は各ラベルの事後確率P(L|features)の比を計算することです。

ここで必要なのは、各ラベルに対するを計算するモデルです。このようなモデルは、データを生成する仮想的なランダム過程を指定するため、 ...

Get Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.