Capítulo 2. Cómo empezar

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo, voy a asegurarme de que tienes todos los requisitos previos para hacer ciencia de datos en la línea de comandos. Los requisitos previos son tres: (1) disponer de los mismos conjuntos de datos que utilizo en este libro, (2) tener un entorno adecuado con todas las herramientas de la línea de comandos que utilizo a lo largo de este libro, y (3) comprender los conceptos esenciales que entran en juego al utilizar la línea de comandos.

En primer lugar, describo cómo descargar los conjuntos de datos. En segundo lugar, explico cómo instalar la imagen Docker, que es un entorno virtual basado en Ubuntu Linux que contiene todas las herramientas de línea de comandos necesarias. Por último, repaso los conceptos esenciales de Unix mediante ejemplos.

Al final de este capítulo, tendrás todo lo que necesitas para continuar con el primer paso de la ciencia de datos, es decir, la obtención de datos.

Obtener los datos

Los conjuntos de datos que utilizo en este libro pueden obtenerse en de la siguiente manera:

  1. Descarga el archivo ZIP del sitio web del libro.

  2. Crea un directorio nuevo. Puedes darle a este directorio el nombre que quieras, pero te recomiendo que te ciñas a letras minúsculas, números y tal vez un guión o un guión bajo para que sea más fácil trabajar con el nombre en la línea de comandos; por ejemplo, dsatcl2. Recuerda dónde ...

Get Ciencia de datos en la línea de comandos, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.