Capítulo 9. Almacenar datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Aunque imprimir en el terminal es muy divertido, no es increíblemente útil cuando se trata de agregar y analizar datos. Para que la mayoría de los raspadores web sean remotamente útiles, necesitas poder guardar la información que raspan.
Este capítulo cubre tres métodos principales de gestión de datos que son suficientes para casi cualquier aplicación imaginable. ¿Necesitas alimentar el backend de un sitio web o crear tu propia API? Probablemente querrás que tus scrapers escriban en una base de datos. ¿Necesitas una forma rápida y sencilla de recopilar documentos de Internet y ponerlos en tu disco duro? Probablemente querrás crear un flujo de archivos para ello. ¿Necesitas alertas ocasionales, o datos agregados una vez al día? ¡Envíate un correo electrónico!
Más allá del web scraping, la capacidad de almacenar e interactuar con grandes cantidades de datos es increíblemente importante para casi cualquier aplicación de programación moderna. De hecho, la información de este capítulo es necesaria para implementar muchos de los ejemplos de las secciones posteriores del libro. Te recomiendo encarecidamente que al menos hojees este capítulo si no estás familiarizado con el almacenamiento automatizado de datos.
Archivos multimedia
Puedes almacenar archivos multimedia de dos formas principales : por referencia y descargando el propio archivo. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access