Capítulo 2. Extraer información textual con las API
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Cuando quieres determinar el enfoque de una pregunta de investigación o empezar a trabajar en un proyecto de análisis de texto, la disponibilidad de datos suele ser el primer escollo. Una simple búsqueda en Google o una búsqueda más específica en Conjuntos de datos arrojará conjuntos de datos curados, y utilizaremos algunos de ellos en capítulos posteriores de este libro. Dependiendo de tu proyecto, tales conjuntos de datos pueden resultar genéricos y no adecuados para tu caso de uso. Puede que tengas que crear tu propio conjunto de datos, y las interfaces de programación de aplicaciones (API) de son una forma de extraer datos mediante programación de forma automatizada.
Lo que aprenderás y lo que construiremos
En este capítulo, proporcionaremos una visión general de las API e introduciremos planos para extraer datos para tu proyecto de sitios web populares como GitHub y Twitter. Aprenderás sobre el uso de tokens de autenticación, el manejo de la paginación, la comprensión de los límites de velocidad y la automatización de la extracción de datos. Al final de este capítulo, serás capaz de crear tus propios conjuntos de datos haciendo llamadas a la API de cualquier servicio identificado. Aunque los planos se ilustran con ejemplos concretos como GitHub y Twitter, pueden utilizarse para trabajar con cualquier API. ...
Get Planos para el análisis de textos con Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.