Capítulo 12. Introducción a las bibliotecas de modelado en Python
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En este libro, me he centrado en proporcionar una base de programación parahaciendo análisis de datos en Python. Dado que los analistas y científicos de datos suelen decir que dedican una cantidad de tiempo desproporcionada a la manipulación y preparación de datos, la estructura del libro refleja la importancia de dominar estas técnicas.
La biblioteca que utilices para desarrollar modelos dependerá de la aplicación. Muchos problemas estadísticos pueden resolverse con técnicas más sencillas, como la regresión por mínimos cuadrados ordinarios, mientras que otros problemas pueden requerir métodos de aprendizaje automático más avanzados. Afortunadamente, Python se ha convertido en uno de los lenguajes preferidos para implementar métodos analíticos, por lo que hay muchas herramientas que puedes explorar después de terminar este libro.
En este capítulo, repasaré algunas características de pandas que pueden resultarte útiles cuando vas y vienes entre la gestión de datos con pandas y el ajuste y la puntuación de modelos. A continuación, haré una breve introducción a dos populares conjuntos de herramientas de modelado, statsmodels y scikit-learn. Dado que cada uno de estos proyectos es lo suficientemente amplio como para justificar su propio libro dedicado, no me esforzaré en ser exhaustivo y, en su lugar, te ...