Capítulo 18. Valores perdidos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Introducción

Ya has aprendido los conceptos básicos de los valores perdidos anteriormente en el libro. Los viste por primera vez en el Capítulo 1, donde daban lugar a una advertencia al hacer un gráfico, así como en "resumir()", donde interferían con el cálculo de los estadísticos de resumen, y aprendiste sobre su naturaleza infecciosa y cómo comprobar su presencia en "Valores perdidos". Ahora volveremos sobre ellos más a fondo para que conozcas más detalles.

Empezaremos discutiendo algunas herramientas generales para trabajar con valores omitidos registrados como NAs. A continuación, exploraremos la idea de valores omitidos implícitamente, valores que simplemente están ausentes de tus datos, y mostraremos algunas herramientas que puedes utilizar para hacerlos explícitos. Terminaremos con un debate relacionado sobre los grupos vacíos, causados por niveles de factores que no aparecen en los datos.

Requisitos previos

Las funciones para trabajar con datos que faltan proceden principalmente de dplyr y tidyr, que son miembros principales del tidyverse.

library(tidyverse)

Valores perdidos explícitos

Para empezar, vamos a explorar algunas herramientas útiles para crear o eliminar valores explícitos omitidos, es decir, celdas en las que aparece un NA.

Última observación trasladada

Un uso común de los valores omitidos es la comodidad ...

Get R para la Ciencia de Datos, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.