Capítulo 7. Manejo de fechas y horas
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
7.0 Introducción
Las fechas y tiempos (datetimes), como la hora de una venta concreta o la fecha de una estadística de salud pública, se encuentran con frecuencia durante el preprocesamiento para el aprendizaje automático. Los datos longitudinales (o datos de series temporales) son datos que se recogen repetidamente para las mismas variables a lo largo de puntos en el tiempo. En este capítulo, construiremos una caja de herramientas de estrategias para tratar los datos de series temporales, incluyendo el tratamiento de las zonas horarias y la creación de características temporales retardadas. En concreto, nos centraremos en las herramientas de series temporales de la biblioteca pandas , que centraliza la funcionalidad de muchas otras bibliotecas generales como datetime
.
7.1 Convertir cadenas en fechas
Problema
Dado un vector de cadenas que representan fechas y horas, quieres transformarlos en datos de series temporales.
Solución
Utiliza pandas' to_datetime
con el formato de fecha y/o hora especificado en el parámetro format
:
# Load libraries
import
numpy
as
np
import
pandas
as
pd
# Create strings
date_strings
=
np
.
array
([
'03-04-2005 11:35 PM'
,
'23-05-2010 12:01 AM'
,
'04-09-2009 09:09 PM'
])
# Convert to datetimes
[
pd
.
to_datetime
(
date
,
format
=
'
%d
-
%m
-
%Y
%I:
%M
%p'
)
for
date
in
date_strings
]
[Timestamp('2005-04-03 23:35:00'), ...
Get Recetario de Aprendizaje Automático con Python, 2ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.