Capítulo 3. Aplicaciones del Web Scraping
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Aunque los rascadores web pueden ayudar a casi cualquier empresa, a menudo el verdadero truco consiste en averiguar cómo. Al igual que la inteligencia artificial o, en realidad, la programación en general, no puedes agitar una varita mágica y esperar que mejore tu cuenta de resultados.
Aplicar la práctica del web scraping a tu negocio requiere una verdadera estrategia y una cuidadosa planificación para utilizarla con eficacia. Tienes que identificar problemas concretos, averiguar qué datos necesitas para solucionar esos problemas y, a continuación, esbozar las entradas, salidas y algoritmos que permitirán a tus raspadores web crear esos datos.
Clasificación de proyectos
Al planificar un proyecto de web scraping, debes pensar en cómo encaja en una de varias categorías.
¿Tu raspador web es "amplio" o "específico"? Puedes escribir plantillas para instruir a un raspador web dirigido, pero necesitas técnicas diferentes para uno amplio:
- ¿Vas a raspar un único sitio web o incluso un conjunto fijo de páginas dentro de ese sitio web? Si es así, se trata de un proyecto de web scraping muy específico.
- ¿Necesitas raspar un número fijo de sitios web conocidos? Éste sigue siendo un raspador bastante específico, pero puede que necesites escribir una pequeña cantidad de código personalizado para cada sitio web e invertir un poco más ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access