Capítulo 1. Criando APIs que os cientistas de dados vão adorar
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
As interfaces de programação de aplicações (API) são importantes para os cientistas de dados. Mas com que frequência os cientistas de dados são considerados pelos criadores e programadores de API? Os cientistas de dados utilizam frequentemente as API como fontes de dados para o seu trabalho. Têm algumas necessidades que são diferentes das dos programadores de software ou de outros consumidores. Se os produtores de API quiserem satisfazer os cientistas de dados, farão bem em satisfazer essas necessidades.
Como é que os cientistas de dados utilizam as API?
O relatório Anaconda State of Data Science descobriu que os cientistas de dados passam a maior parte do seu tempo a realizar três actividades principais: preparar ou limpar dados (38%); criar relatórios, apresentações ou visualizações de dados (29%); e selecionar, treinar e implementar modelos (27%). Este livro demonstra como os cientistas de dados usam APIs para essas tarefas.
A preparação ou limpeza de dados ocorre frequentemente quando os cientistas de dados efectuam uma análise exploratória de dados (EDA) num novo conjunto de dados, analisando o seu conteúdo, formatos e padrões. Outras vezes, este trabalho faz parte de um pipeline de dados programado, que é uma sequência de tarefas de software que extraem de várias fontes de dados e reformatam ...