Capítulo 8. Manipulación y visualización de datos en R
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
El estadístico estadounidense Ronald Thisted bromeó una vez: "Los datos crudos, como las patatas crudas, suelen requerir limpieza antes de su uso". La manipulación de datos lleva tiempo, y habrás sentido el dolor si alguna vez has hecho lo siguiente:
-
Selecciona, suelta o crea columnas calculadas
-
Ordenar o filtrar filas
-
Agrupa por categorías y resúmelas
-
Unir varios conjuntos de datos por un campo común
Lo más probable es que hayas hecho todas estas cosas en Excel...muchas veces, y probablemente hayas hurgado en célebres funciones como VLOOKUP()
y Tablas dinámicas para llevarlas a cabo. En este capítulo, aprenderás los equivalentes en R de estas técnicas, sobre todo con la ayuda de dplyr
.
La manipulación de datos suele ir de la mano de la visualización: como ya se ha dicho, los humanos somos extraordinariamente hábiles para procesar visualmente la información, por lo que es una forma estupenda de dimensionar un conjunto de datos. Aprenderás a visualizar datos utilizando el magnífico paquete ggplot2
, que al igual que dplyr
forma parte del paquete tidyverse
. Esto te pondrá sobre una base sólida para explorar y probar las relaciones en los datos utilizando R, que se tratará en el Capítulo 9. Empecemos por llamar a los paquetes pertinentes. En este capítulo también utilizaremos con el conjunto de datos ...
Get Avanzar en la Analítica now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.