Capítulo 7. Manejo de fechas y horas
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
7.0 Introducción
Las fechas y tiempos (datetimes), como la hora de una venta concreta o la fecha de una estadística de salud pública, se encuentran con frecuencia durante el preprocesamiento para el aprendizaje automático. Los datos longitudinales (o datos de series temporales) son datos que se recogen repetidamente para las mismas variables a lo largo de puntos en el tiempo. En este capítulo, construiremos una caja de herramientas de estrategias para tratar los datos de series temporales, incluyendo el tratamiento de las zonas horarias y la creación de características temporales retardadas. En concreto, nos centraremos en las herramientas de series temporales de la biblioteca pandas , que centraliza la funcionalidad de muchas otras bibliotecas generales como datetime.
7.1 Convertir cadenas en fechas
Problema
Dado un vector de cadenas que representan fechas y horas, quieres transformarlos en datos de series temporales.
Solución
Utiliza pandas' to_datetime con el formato de fecha y/o hora especificado en el parámetro format:
# Load librariesimportnumpyasnpimportpandasaspd# Create stringsdate_strings=np.array(['03-04-2005 11:35 PM','23-05-2010 12:01 AM','04-09-2009 09:09 PM'])# Convert to datetimes[pd.to_datetime(date,format='%d-%m-%Y%I:%M%p')fordateindate_strings]
[Timestamp('2005-04-03 23:35:00'), ...