Capitolo 1. Creare API che piacciano agli scienziati dei dati
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Le interfacce di programmazione delle applicazioni (API) sono importanti per i data scientist. Ma quanto spesso i data scientist vengono presi in considerazione dai progettisti e dagli sviluppatori di API? Gli scienziati dei dati utilizzano spesso le API come fonti di dati per il loro lavoro. Hanno esigenze diverse da quelle degli sviluppatori di software o di altri consumatori. Se i produttori di API vogliono rendere felici gli scienziati dei dati, faranno bene a soddisfare queste esigenze.
Come usano le API gli scienziati dei dati?
Il rapporto Anaconda State of Data Science ha rilevato che i data scientist di dedicano la maggior parte del loro tempo a tre attività principali: la preparazione o la pulizia dei dati (38%); la creazione di report, presentazioni o visualizzazioni di dati (29%); la selezione, l'addestramento e l'implementazione di modelli (27%). Questo libro mostra come gli scienziati dei dati utilizzano le API per queste attività.
La preparazione o la pulizia dei dati avviene spesso quando i data scientist di eseguono un 'analisi esplorativa dei dati (EDA) su un nuovo set di dati analizzandone i contenuti, i formati e i modelli. Altre volte, questo lavoro fa parte di una pipeline di dati programmata, ovvero una sequenza di attività software che prelevano da più fonti ...