library
(
tidyverse
)
library
(
repurrrsive
)
library
(
jsonlite
)
Capítulo 23. Datos jerárquicos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Introducción
En este capítulo, aprenderás el arte de rectangular datos, tomando datos que son fundamentalmente jerárquicos, o en forma de árbol, y convirtiéndolos en un marco de datos rectangular formado por filas y columnas. Esto es importante porque los datos jerárquicos son sorprendentemente comunes, especialmente cuando se trabaja con datos que proceden de la web.
Para aprender a rectangular, primero tendrás que aprender sobre las listas, la estructura de datos que hace posible los datos jerárquicos. Luego aprenderás sobre dos funciones cruciales de tidyr tidyr::unnest_longer()
y tidyr::unnest_wider()
. A continuación, te mostraremos algunos casos prácticos, aplicando estas sencillas funciones una y otra vez para resolver problemas reales. Terminaremos hablando de JSON, la fuente más frecuente de conjuntos de datos jerárquicos y un formato habitual para el intercambio de datos en la web.
Requisitos previos
En este capítulo, utilizaremos muchas funciones de tidyr, un miembro básico del tidyverse. También utilizaremos repurrrsive para obtener algunos conjuntos de datos interesantes para practicar el rectangulamiento, y terminaremos utilizando jsonlite para leer archivos JSON en listas de R.
Listas
Hasta ahora has trabajado con marcos de datos que contienen vectores ...
Get R para la Ciencia de Datos, 2ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.