Capítulo 3. Transformación de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Introducción

La visualización es una herramienta importante para generar conocimiento, pero es raro que obtengas los datos exactamente en la forma que necesitas para hacer el gráfico que deseas. A menudo necesitarás crear nuevas variables o resúmenes para responder a tus preguntas con tus datos, o tal vez sólo quieras cambiar el nombre de las variables o reordenar las observaciones para que sea un poco más fácil trabajar con los datos. Aprenderás a hacer todo eso (¡y más!) en este capítulo, que te introducirá en la transformación de datos utilizando el paquete dplyr y un nuevo conjunto de datos sobre los vuelos que salieron de Nueva York en 2013.

El objetivo de este capítulo es darte una visión general de todas las herramientas clave para transformar un marco de datos. Empezaremos con funciones que operan sobre filas y luego sobre columnas de un marco de datos, y luego volveremos para hablar más sobre la tubería, una herramienta importante que se utiliza para combinar verbos. A continuación, introduciremos la posibilidad de trabajar con grupos. Terminaremos el capítulo con un caso práctico que muestra estas funciones en acción, y volveremos a las funciones con más detalle en capítulos posteriores, cuando empecemos a profundizar en tipos concretos de datos (por ejemplo, números, cadenas, fechas).

Requisitos previos

En este capítulo ...

Get R para la Ciencia de Datos, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.