Capítulo 11. Entrenamiento de redes neuronales profundas
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el Capítulo 10 construiste, entrenaste y pusiste a punto tus primeras redes neuronales artificiales. Pero eran redes poco profundas, con sólo unas pocas capas ocultas. ¿Y si necesitas abordar un problema complejo, como detectar cientos de tipos de objetos en imágenes de alta resolución? Puede que necesites entrenar una RNA mucho más profunda, quizá con 10 capas o muchas más, cada una de ellas con cientos de neuronas, enlazadas por cientos de miles de conexiones. Entrenar una red neuronal profunda no es un paseo por el parque. He aquí algunos de los problemas que podrías encontrarte:
-
Puedes enfrentarte al problema de que los gradientes se hagan cada vez más pequeños o más grandes, cuando fluyen hacia atrás a través de la DNN durante el entrenamiento. Ambos problemas hacen que las capas inferiores sean muy difíciles de entrenar.
-
Puede que no tengas suficientes datos de entrenamiento para una red tan grande, o puede que sea demasiado costoso etiquetarla.
-
El entrenamiento puede ser extremadamente lento.
-
Un modelo con millones de parámetros correría el grave riesgo de sobreajustar el conjunto de entrenamiento, sobre todo si no hay suficientes instancias de entrenamiento o si son demasiado ruidosas.
En este capítulo repasaremos cada uno de estos problemas y presentaremos técnicas para resolverlos. Empezaremos ...
Get Aprendizaje automático práctico con Scikit-Learn, Keras y TensorFlow, 3ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.