Capítulo 6. Redes neuronales recurrentes

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo, trataremos las redes neuronales recurrentes (RNN), una clase de arquitecturas de redes neuronales pensadas para manejar secuencias de datos. Las redes neuronales que hemos visto hasta ahora trataban cada lote de datos que recibían como un conjunto de observaciones independientes; no existía la noción de que algunos de los dígitos MNIST llegaran antes o después que otros dígitos, ni en las redes neuronales totalmente conectadas que vimos en el Capítulo 4 ni en las redes neuronales convolucionales que vimos en el Capítulo 5. Sin embargo, muchos tipos de datos están intrínsecamente ordenados, ya sean datos de series temporales, con los que podríamos tratar en un contexto industrial o financiero, o datos lingüísticos, en los que los caracteres, las palabras, las frases, etc., están ordenados. Las redes neuronales recurrentes están diseñadas para aprender a tomar secuencias de datos de este tipo y devolver una predicción correcta como salida, tanto si esa predicción correcta es sobre el precio de un activo financiero al día siguiente o sobre la siguiente palabra de una frase.

Tratar con datos ordenados requerirá tres tipos de cambios respecto a las redes neuronales totalmente conectadas que vimos en los primeros capítulos. En primer lugar, implicará "añadir una nueva dimensión" a los ndarrays con los que alimentamos ...

Get Aprendizaje profundo desde cero now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.