Capítulo 2. Fundamentos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 1, describí el principal bloque de construcción conceptual para comprender el aprendizaje profundo: las funciones anidadas, continuas y diferenciables. Mostré cómo representar estas funciones como gráficos computacionales, en los que cada nodo del gráfico representa una única función simple. En concreto, demostré que tal representación mostraba fácilmente cómo calcular la derivada de la salida de la función anidada con respecto a su entrada: simplemente tomamos las derivadas de todas las funciones constituyentes, evaluamos estas derivadas en la entrada que recibieron estas funciones, y luego multiplicamos todos los resultados juntos; esto dará como resultado una derivada correcta para la función anidada debido a la regla de la cadena. He ilustrado que esto funciona de hecho con algunos ejemplos sencillos, con funciones que tomaban ndarrays de NumPy como entradas y producían ndarrays como salidas.

He demostrado que este método de cálculo de derivadas funciona incluso cuando la función toma múltiples ndarrays como entradas y las combina mediante una operación de multiplicación matricial, que, a diferencia de las otras operaciones que vimos, cambia la forma de sus entradas. En concreto, si una entrada de esta operación -llamémosla entrada X-es un B × N ndarray, y otra entrada de esta operación, W, es un N × M ndarray, entonces ...

Get Aprendizaje profundo desde cero now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.