17章オートエンコーダとGANを使った表現学習と生成型学習
オートエンコーダは、教師なしで(つまり、ラベルのない訓練セットで)潜在表現(latent representation)とかコーディング(coding)と呼ばれる入力データの深層表現を学習できる人工ニューラルネットワークである。一般にコーディングは入力データよりも次数がずっと少ないため、オートエンコーダは次元削減、特に視覚化のための次元削減に役立つ(8章参照)。また、強力な特徴量検出器として機能し、深層ニューラルネットワークの教師なし事前学習でも使える(11章参照)。そして、一部のオートエンコーダは生成モデル(generative model)にもなる。生成モデルは、訓練データとよく似た感じの新しいデータを無作為に生成することができる。たとえば、顔写真でオートエンコーダを訓練すると、新しい顔の画像を生成できる。しかし、このようにして生成された画像は、通常不明瞭であまりリアルではない。
それに対し、GAN(generative adversarial network:敵対的生成ネットワーク)が生成した顔の画像は説得力があり、そのような顔の人が存在しないとは信じられないくらいの顔になる。StyleGANという新しいGANアーキテクチャが生成した顔の画像を表示するhttps://thispersondoesnotexist.com/に行って、実際に自分の目で確かめてみよう(GANが生成したAirbnbのベッドルームを表示しているhttps://thisrentaldoesnotexist.com/もある)。現在、GANは超解像度(画像の解像度アップ)、カラライゼーション(https://github.com/jantic/DeOldify ...
Get scikit-learn、Keras、TensorFlowによる実践機械学習 第2版 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.