Capítulo 12. Generación de imágenes y textos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Hasta ahora en este libro, nos hemos centrado en en los métodos de visión por ordenador que actúan sobre imágenes. En este capítulo, veremos los métodos de visión que pueden generar imágenes. Pero antes de llegar a la generación de imágenes, tenemos que aprender a entrenar un modelo para que comprenda lo que hay en una imagen, de modo que sepa qué generar. También veremos el problema de generar texto (pies de foto) basándonos en el contenido de una imagen.

Consejo

El código de este capítulo está en la carpeta 12_generación del repositorio GitHub del libro. Proporcionaremos los nombres de archivo de los ejemplos de código y de los cuadernos cuando proceda.

Comprensión de la imagen

Una cosa es saber qué componentes de hay en una imagen, pero otra muy distinta es comprender realmente lo que ocurre en la imagen y utilizar esa información para otras tareas. En esta sección, recapitularemos rápidamente las incrustaciones y luego veremos varios métodos (autocodificadores y autocodificadores variacionales) para codificar una imagen y conocer sus propiedades.

Incrustaciones

Un problema habitual en los casos de uso del aprendizaje profundo es la falta de datos suficientes, o de datos de calidad suficiente. En el Capítulo 3 hablamos del aprendizaje por transferencia, que proporciona una forma de extraer las incrustaciones que ...

Get Aprendizaje automático práctico para visión por ordenador now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.