Capítulo 7. Importación de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Introducción

Trabajar con datos proporcionados por paquetes de R es una forma estupenda de aprender herramientas de ciencia de datos, pero en algún momento querrás aplicar lo que has aprendido a tus propios datos. En este capítulo, aprenderás los fundamentos de la lectura de archivos de datos en R.

En concreto, este capítulo se centrará en la lectura de archivos rectangulares de texto plano. Empezaremos con consejos prácticos para manejar características como nombres de columnas, tipos y datos que faltan. A continuación, aprenderás a leer datos de varios archivos a la vez y a escribir datos desde R a un archivo. Por último, aprenderás a crear a mano marcos de datos en R.

Requisitos previos

En este capítulo, aprenderás a cargar archivos planos en R con el paquete readr, que forma parte del núcleo tidyverse:

library(tidyverse)

Leer datos de un archivo

Para empezar en , nos centraremos en el tipo de archivo de datos rectangulares más común: CSV, que es la abreviatura de "valores separados por comas". Éste es el aspecto de un archivo CSV sencillo. La primera fila, comúnmente llamada fila de encabezamiento, da los nombres de las columnas, y las seis filas siguientes proporcionan los datos. Las columnas están separadas, es decir, delimitadas, por comas.

Student ID,Full Name,favourite.food,mealPlan,AGE 1,Sunil Huffmann,Strawberry ...

Get R para la Ciencia de Datos, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.