Capítulo 13. Procesamiento del lenguaje natural

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

No es difícil utilizar Scikit-Learn para construir modelos de aprendizaje automático que analicen el sentimiento de un texto, identifiquen el spam y clasifiquen el texto de otras formas. Pero hoy en día, la clasificación de texto más avanzada se realiza más a menudo con redes neuronales. Ya sabes cómo construir redes neuronales que aceptan números e imágenes como entrada. Vamos a partir de ahí para aprender a construir modelos de aprendizaje profundo que procesen texto, un segmento del aprendizaje profundo conocido como procesamiento del lenguaje natural o PLN.

PNL engloba diversas actividades, como la clasificación de textos, el reconocimiento de entidades con nombre, la extracción de palabras clave, la respuesta a preguntas y la traducción de idiomas. La precisión de los modelos de PNL ha mejorado en los últimos años por varias razones, entre las que destacan nuevas y mejores formas de convertir palabras y frases en densas representaciones vectoriales que incorporan significado, y una arquitectura de red neuronal relativamente nueva llamada transformador, que puede centrarse en las palabras más significativas e incluso diferenciar entre distintos significados de la misma palabra.

Un elemento de que tienen en común prácticamente todas las redes neuronales que procesan texto es una capa de incrustación, que utiliza ...

Get Aprendizaje Automático Aplicado e IA para Ingenieros now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.