Teil III. Anwendungen
In Teil III werden wir einige der wichtigsten Anwendungen der generativen Modellierungstechniken, die wir bisher gesehen haben, in den Bereichen Bilder, Text, Musik und Spiele untersuchen. Wir werden auch sehen, wie diese Bereiche mit modernen multimodalenModellen durchquert werden können.
In Kapitel 9 widmen wir uns Transformers, einer hochmodernen Architektur, die den meisten modernen Textgenerierungsmodellen zugrunde liegt. Insbesondere werden wir das Innenleben von GPT erforschen und unsere eigene Version mit Keras bauen, und wir werden sehen, wie es die Grundlage für Tools wie ChatGPT bildet.
In Kapitel 10 werden wir uns einige der wichtigsten GAN-Architekturen ansehen, die die Bilderzeugung beeinflusst haben, darunter ProGAN, StyleGAN, StyleGAN2, SAGAN, BigGAN, VQ-GAN und ViT VQ-GAN. Wir werden die wichtigsten Beiträge der einzelnen Architekturen untersuchen und herausfinden, wie sich die Technik im Laufe der Zeit weiterentwickelt hat.
Kapitel 11 befasst sich mit der Musikgenerierung, die zusätzliche Herausforderungen wie die Modellierung von Tonhöhe und Rhythmus mit sich bringt. Wir werden sehen, dass viele der Techniken, die bei der Texterzeugung funktionieren (z. B. Transformers), auch in diesem Bereich angewandt werden können, aber wir werden auch eine Deep-Learning-Architektur namens MuseGAN kennenlernen, die einen GAN-basierten Ansatz zur Erzeugung von Musik anwendet.
Kapitel 12 zeigt, wie generative Modelle in anderen Bereichen des maschinellen ...
Get Generatives Deep Learning, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.