Capítulo 10. Ciencia de datos políglota

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Un políglota es alguien que habla varios idiomas. Un científico de datos políglota, tal y como yo lo veo en , es alguien que utiliza varios lenguajes de programación, herramientas y técnicas para obtener, depurar, explorar y modelar datos.

La línea de comandos estimula un enfoque políglota. A la línea de comandos no le importa en qué lenguaje de programación esté escrita una herramienta, siempre que se adhiera a la filosofía Unix. Lo vimos muy claramente en el Capítulo 4, donde creamos herramientas de línea de comandos en Bash, Python y R. Además, ejecutamos consultas SQL directamente en archivos CSV y ejecutamos expresiones R desde la línea de comandos. En resumen, ¡ya hemos estado haciendo ciencia de datos políglota sin darnos cuenta del todo!

En este capítulo voy a llevar esto más allá dándole la vuelta. Voy a mostrarte cómo aprovechar la línea de comandos de varios lenguajes y entornos de programación. Porque seamos sinceros: no vamos a pasarnos toda nuestra carrera en la ciencia de datos en la línea de comandos. En cuanto a mí, cuando estoy analizando algunos datos, suelo utilizar el entorno de desarrollo integrado (IDE) RStudio; y cuando estoy implementando algo, suelo utilizar Python. Utilizo lo que me ayude a hacer el trabajo.

Me reconforta saber que la línea de comandos está a menudo al alcance de la mano, sin que ...

Get Ciencia de datos en la línea de comandos, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.