Capítulo 11. Análisis de flujos y aprendizaje automático

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los capítulos anteriores, hemos supuesto que tenemos todos nuestros datos disponibles en una ubicación estática centralizada, como nuestro lago de datos basado en S3. Los datos del mundo real fluyen continuamente desde muchas fuentes diferentes de todo el mundo de forma simultánea. Necesitamos realizar aprendizaje automático en flujos de datos para casos de uso como la prevención del fraude y la detección de anomalías, donde la latencia del procesamiento por lotes no es aceptable. También es posible que queramos ejecutar análisis continuos en flujos de datos en tiempo real para obtener ventajas competitivas y acortar el tiempo de obtención de información empresarial.

En este capítulo, pasamos de nuestro conjunto de datos de entrenamiento de reseñas de clientes a un escenario del mundo real. Nos centraremos en analizar un flujo continuo de mensajes de reseñas de productos que recopilamos de todos los canales online disponibles. Las opiniones de los clientes sobre los productos aparecen en todas partes, incluidos los canales de las redes sociales, los sitios web de los socios y los sistemas de atención al cliente. Necesitamos captar esta valiosa opinión de los clientes sobre nuestros productos lo antes posible para detectar tendencias y reaccionar con rapidez.

Con la analítica de flujos de y el aprendizaje ...

Get Ciencia de datos en AWS now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.