ステップ4混合ガウスモデル

正規分布は身の回りで多く見られます。しかし、1つの正規分布では表せない現象もたくさんあります。次のステップは、複数の正規分布を組み合わせるアプローチです。これによって、複数の山を表現することができ、より複雑な表現が可能になります。このモデルは「混合ガウスモデル」として知られています。混合ガウスモデルは統計学や機械学習の分野で幅広く用いられており、データ生成においても重要な手法となります。

4.1 身の回りにある多峰性分布

世の中には複数の山を持つ分布——これは「多峰性分布」と呼ばれます——が意外と多く見られます。本節では、身の回りにある多峰性分布の例をいくつか紹介します。また、多峰性データの具体的なデータセットを示し、可視化して確認します。

男女混合の身長の分布

人の身長は、年齢と性別を限定した場合(たとえば17歳男性など)正規分布になることが知られています。では、性別を限定しない男女混合の場合は、どうでしょうか? 図4-1は、17歳日本人の男女別の身長の分布です。図4-1より、男女ごとに山のピークが異なります。集団を通じてみると、2つの山の分布としてモデル化することが望まれます。

17歳男子生徒と17歳女子生徒の身長の分布(データは2016年度学校保健統計調査<span class="bibref"><a href="ch28bib.xhtml#bib-id__EF_BC_BB1_EF_BC_BD">[1]</a></span>より取得してグラフを作成)

図4-1 17歳男子生徒と17歳女子生徒の身長の分布(データは2016年度学校保健統計調査[1]より取得してグラフを作成)

アリの体長

アリを一匹一匹捕まえて、その体長を計測する実験を想像してみましょう。多くの実験では、アリの体長の分布が多峰性になることが示されています( ...

Get ゼロから作るDeep Learning ❺ ―生成モデル編 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.