library
(
tidyverse
)
Capítulo 16. Factores
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Introducción
Los factores se utilizan para variables categóricas, variables que tienen un conjunto fijo y conocido de valores posibles. También son útiles cuando quieres mostrar vectores de caracteres en un orden no alfabético.
Empezaremos motivando por qué se necesitan factores para el análisis de datos1 y cómo puedes crearlos con factor()
. A continuación, te presentaremos el conjunto de datos gss_cat
, que contiene un montón de variables categóricas con las que puedes experimentar. A continuación, utilizarás ese conjunto de datos para practicar la modificación del orden y los valores de los factores, antes de terminar con un debate sobre los factores ordenados.
Requisitos previos
La base R proporciona algunas herramientas básicas para crear y manipular factores. Las complementaremos con el paquete forcats, que forma parte del núcleo tidyverse. Proporciona herramientas para tratar variables categóricas(¡y es un anagrama de factores!) utilizando una amplia gama de ayudantes para trabajar con factores.
Factor Básico
Imagina que tienes una variable que registra el mes:
x1
<-
c
(
"Dec"
,
"Apr"
,
"Jan"
,
"Mar"
)
Utilizar una cadena para registrar esta variable tiene dos problemas:
-
Sólo hay 12 meses posibles, y no hay nada que te salve de las erratas:
x2
<-
c
(
"Dec"
,
"Apr"
,
"Jam"
,
"Mar"
)
-
No clasifica de forma útil:
sort ...
Get R para la Ciencia de Datos, 2ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.