Capítulo 7. Manejo de fechas y horas

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

7.0 Introducción

Las fechas y tiempos (datetimes), como la hora de una venta concreta o la fecha de una estadística de salud pública, se encuentran con frecuencia durante el preprocesamiento para el aprendizaje automático. Los datos longitudinales (o datos de series temporales) son datos que se recogen repetidamente para las mismas variables a lo largo de puntos en el tiempo. En este capítulo, construiremos una caja de herramientas de estrategias para tratar los datos de series temporales, incluyendo el tratamiento de las zonas horarias y la creación de características temporales retardadas. En concreto, nos centraremos en las herramientas de series temporales de la biblioteca pandas , que centraliza la funcionalidad de muchas otras bibliotecas generales como datetime.

7.1 Convertir cadenas en fechas

Problema

Dado un vector de cadenas que representan fechas y horas, quieres transformarlos en datos de series temporales.

Solución

Utiliza pandas' to_datetime con el formato de fecha y/o hora especificado en el parámetro format:

# Load libraries
import numpy as np
import pandas as pd

# Create strings
date_strings = np.array(['03-04-2005 11:35 PM',
                         '23-05-2010 12:01 AM',
                         '04-09-2009 09:09 PM'])

# Convert to datetimes
[pd.to_datetime(date, format='%d-%m-%Y %I:%M %p') for date in date_strings]
[Timestamp('2005-04-03 23:35:00'), ...

Get Recetario de Aprendizaje Automático con Python, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.