Skip to Content
Ciencia de datos en la línea de comandos, 2ª edición
book

Ciencia de datos en la línea de comandos, 2ª edición

by Jeroen Janssens
October 2024
Intermediate to advanced
282 pages
6h 36m
Spanish
O'Reilly Media, Inc.
Content preview from Ciencia de datos en la línea de comandos, 2ª edición

Capítulo 3. Obtención de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Este capítulo trata del primer paso del modelo OSEMN: la obtención de datos. Al fin y al cabo, sin datos no podemos hacer mucha ciencia de datos. Doy por supuesto que los datos que necesitas para resolver tu problema de ciencia de datos ya existen. Tu primera tarea consiste en introducir estos datos en tu ordenador (y posiblemente también dentro del contenedor Docker) de una forma con la que puedas trabajar.

Según la filosofía Unix, el texto es una interfaz universal. Casi todas las herramientas de línea de comandos toman texto como entrada, producen texto como salida, o ambas cosas. Ésta es la razón principal por la que las herramientas de línea de comandos pueden funcionar tan bien juntas. Sin embargo, como veremos, incluso el simple texto puede adoptar múltiples formas.

Los datos pueden obtenerse de varias formas, por ejemplo, descargándolos de un servidor, consultando una base de datos o conectándose a una API Web. A veces, los datos vienen comprimidos o en formato binario, como una hoja de cálculo de Microsoft Excel. En este capítulo, hablo de varias herramientas que ayudan a abordar esto desde la línea de comandos, como curl,1 in2csv,2 sql2csv,3 y tar.4

Visión general

En este capítulo aprenderás a:

  • Copia los archivos locales a la imagen Docker

  • Descargar datos de Internet

  • Descomprimir archivos

  • Extraer datos de hojas de ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Estadística Práctica para Científicos de Datos, 2ª Edición

Estadística Práctica para Científicos de Datos, 2ª Edición

Peter Bruce, Andrew Bruce, Peter Gedeck
Arquitectura de Plataformas de Datos y Aprendizaje Automático

Arquitectura de Plataformas de Datos y Aprendizaje Automático

Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner

Publisher Resources

ISBN: 9798341603790Supplemental Content