Capítulo 10. Aprendizaje profundo por refuerzo para la predicción de series temporales

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

El aprendizaje por refuerzo es una rama del aprendizaje automático que se ocupa de los problemas de toma de decisiones secuenciales. Los algoritmos de esta rama aprenden a tomar decisiones óptimas interactuando con un entorno y recibiendo retroalimentación en forma de recompensas. En el contexto de la previsión de series temporales, puede utilizarse para desarrollar modelos que hagan predicciones secuenciales basadas en datos históricos. Los enfoques tradicionales de previsión suelen basarse en métodos estadísticos o técnicas de aprendizaje supervisado, que suponen la independencia entre los puntos de datos. Sin embargo, los datos de las series temporales presentan dependencias y patrones temporales, que pueden captarse eficazmente mediante el aprendizaje por refuerzo.

Los modelos de aprendizaje por refuerzo para la previsión de series temporales suelen implicar a un agente que realiza acciones basándose en los estados observados y recibe recompensas en función de la precisión de sus predicciones. El agente aprende mediante ensayo y error a maximizar las recompensas acumuladas a lo largo del tiempo. El reto clave es encontrar un equilibrio óptimo entre la exploración (probar nuevas acciones) y la explotación (utilizar el conocimiento aprendido).

Este capítulo ofrece una visión ...

Get Aprendizaje profundo para las finanzas now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.