Capítulo 5. La pila de análisis de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

A estas alturas del libro, ya conoces bien los principios y métodos clave de la analítica, tras haberlos aprendido en Excel. Este capítulo sirve de interludio a las siguientes partes del libro, donde harás pivotar ese conocimiento existente hacia el uso de R y Python.

Este capítulo delimitará aún más las disciplinas de estadística, análisis de datos y ciencia de datos, y profundizaremos en cómo Excel, R y Python forman parte de lo que yo llamo la pila de análisis de datos.

Estadística frente a Análisis de datos frente a Ciencia de datos

El objetivo de este libro es ayudarte a dominar los principios de la analítica de datos. Pero como has visto, la estadística es tan esencial para la analítica que a menudo es difícil delimitar dónde acaba un campo y empieza el otro. Para aumentar la confusión, puede que también te interese saber cómo encaja la ciencia de datos en la mezcla. Dediquemos un momento a precisar estas distinciones.

Estadísticas

La Estadística es sobre todo se ocupa de los métodos de recogida, análisis y presentación de datos. Hemos tomado prestado mucho de este campo: por ejemplo, realizamos inferencias sobre una población a partir de una muestra, y representamos distribuciones y relaciones en los datos mediante gráficos como histogramas y diagramas de dispersión.

La mayoría de las pruebas y técnicas que hemos ...

Get Avanzar en la Analítica now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.