Parte III. Aplicaciones
En la Parte III, exploraremos algunas de las aplicaciones clave de las técnicas de modelado generativo que hemos visto hasta ahora, a través de imágenes, texto, música y juegos. También veremos cómo se pueden recorrer estos dominios utilizandomodelos multimodales de última generación.
En el Capítulo 9 centraremos nuestra atención en los Transformadores, una arquitectura de vanguardia que impulsa la mayoría de los modelos modernos de generación de texto. En concreto, exploraremos el funcionamiento interno de GPT y construiremos nuestra propia versión utilizando Keras, y veremos cómo constituye la base de herramientas como ChatGPT.
En el Capítulo 10 examinaremos algunas de las arquitecturas GAN más importantes que han influido en la generación de imágenes, como ProGAN, StyleGAN, StyleGAN2, SAGAN, BigGAN, VQ-GAN y ViT VQ-GAN. Exploraremos las contribuciones clave de cada una y trataremos de comprender cómo ha evolucionado la técnica con el tiempo.
El Capítulo 11 se ocupa de la generación de música, que presenta retos adicionales como el modelado del tono y el ritmo musicales. Veremos que muchas de las técnicas que funcionan para la generación de texto (como Transformers) también pueden aplicarse en este ámbito, pero también exploraremos una arquitectura de aprendizaje profundo conocida como MuseGAN que aplica un enfoque basado en GAN para generar música.
El Capítulo 12 muestra cómo pueden utilizarse los modelos generativos en otros dominios del aprendizaje ...
Get Aprendizaje profundo generativo, 2ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.