Capítulo 11. Error de medición

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En capítulos anteriores utilizamos diversas medidas para comparar modelos o juzgar lo bien que un modelo realizaba su tarea. En este capítulo examinamos las buenas prácticas para juzgar la precisión de las previsiones, haciendo hincapié en las cuestiones específicas de los datos de series temporales.

Para los principiantes en la previsión de series temporales, lo más importante es comprender que la validación cruzada estándar no suele ser aconsejable. No puedes seleccionar conjuntos de datos de entrenamiento, validación y prueba seleccionando al azar muestras de los datos de cada una de estas categorías de forma agnóstica al tiempo.

Pero es aún más complicado. Tienes que pensar en cómo se relacionan en el tiempo las distintas muestras de datos, aunque parezcan independientes. Por ejemplo, supongamos que estás trabajando en una tarea de clasificación de series temporales, de modo que tienes muchas muestras de series temporales distintas, donde cada una es su propio punto de datos. Podría ser tentador pensar que en este caso puedes elegir aleatoriamente series temporales para cada una de entrenamiento, validación y prueba, pero te equivocarías si siguieras esa idea. El problema de este planteamiento es que no reflejará cómo utilizarías tu modelo, es decir, que tu modelo se entrenará con datos anteriores y se probará con datos posteriores. ...

Get Análisis Práctico de Series Temporales now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.