Capítulo 10. Ciencia de datos políglota
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Un políglota es alguien que habla varios idiomas. Un científico de datos políglota, tal y como yo lo veo en , es alguien que utiliza varios lenguajes de programación, herramientas y técnicas para obtener, depurar, explorar y modelar datos.
La línea de comandos estimula un enfoque políglota. A la línea de comandos no le importa en qué lenguaje de programación esté escrita una herramienta, siempre que se adhiera a la filosofía Unix. Lo vimos muy claramente en el Capítulo 4, donde creamos herramientas de línea de comandos en Bash, Python y R. Además, ejecutamos consultas SQL directamente en archivos CSV y ejecutamos expresiones R desde la línea de comandos. En resumen, ¡ya hemos estado haciendo ciencia de datos políglota sin darnos cuenta del todo!
En este capítulo voy a llevar esto más allá dándole la vuelta. Voy a mostrarte cómo aprovechar la línea de comandos de varios lenguajes y entornos de programación. Porque seamos sinceros: no vamos a pasarnos toda nuestra carrera en la ciencia de datos en la línea de comandos. En cuanto a mí, cuando estoy analizando algunos datos, suelo utilizar el entorno de desarrollo integrado (IDE) RStudio; y cuando estoy implementando algo, suelo utilizar Python. Utilizo lo que me ayude a hacer el trabajo.
Me reconforta saber que la línea de comandos está a menudo al alcance de la mano, sin que ...