Capítulo 13. Modelos de cimentación

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Cuanto más alto sea el edificio, más profundos deben ser los cimientos.

-Thomas à Kempis

Escalado extremo de los modelos de aprendizaje profundo en varias dimensiones (datos, computación, capacidad) ha conducido al desarrollo de modelos de propósito general capaces de realizar muchas tareas diferentes sin supervisión explícita. Estos modelos evolutivos suelen tener capacidades generativas y adaptativas y son tan eficaces en muchas tareas, desde la percepción y la cognición básicas hasta la comprensión de escenas o textos y el seguimiento de instrucciones, que cada vez ocupan un lugar más central en la IA aplicada.

En este capítulo, conocerás los fundamentos de los llamados modelos fundacionales y su evolución hasta la fecha. Leerás sobre los retos que plantea el desarrollo y la adaptación de estos modelos, explorarás cómo se están convirtiendo en multimodales y repasarás las arquitecturas pioneras LLaVA, Flamingo y BLIP-2.

¿Qué son los modelos de cimentación?

El término modelo de cimentación fue acuñado por el Centro de Investigación sobre Modelos de Cimentación del Instituto de Inteligencia Artificial Centrada en el Ser Humano de Stanford para describir modelos de aprendizaje profundo a gran escala que fueron entrenados en conjuntos de datos muy grandes y tienen la capacidad de rendir bien en muchas tareas sin haber ...

Get Aprendizaje profundo a escala now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.