Overview
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Si la programación es magia, entonces el web scraping es sin duda una forma de brujería. Escribiendo un simple programa automatizado, puedes consultar servidores web, solicitar datos y analizarlos para extraer la información que necesitas. Esta tercera edición, completamente actualizada, no solo te introduce en el web scraping, sino que también sirve como guía completa para extraer casi cualquier tipo de datos de la web moderna. La Parte I se centra en la mecánica del web scraping: usar Python para solicitar información a un servidor web, realizar un manejo básico de la respuesta del servidor e interactuar con los sitios de forma automatizada. La Parte II explora una variedad de herramientas y aplicaciones más específicas para
La Parte I se centra en la mecánica del web scraping: el uso de Python para solicitar información a un servidor web, la realización de un manejo básico de la respuesta del servidor y la interacción con los sitios de forma automatizada. La Parte II explora una variedad de herramientas y aplicaciones más específicas para adaptarse a cualquier escenario de web scraping que puedas encontrar.
- Analizar páginas HTML complicadas
- Desarrolla rastreadores con el marco Scrapy
- Aprende métodos para almacenar los datos que extraes
- Lee y extrae datos de documentos
- Limpiar y normalizar datos mal formateados
- Lee y escribe en lenguajes naturales.
- Rastrear formularios e inicios de sesión
- Raspar JavaScript y rastrear a través de API
- Utiliza y escribe software de imagen a texto.
- Evita trampas de scraping y bloqueadores de bots.
- Utiliza scrapers para poner a prueba tu sitio web
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access