Skip to Content
Ciencia de datos desde cero, 2ª edición
book

Ciencia de datos desde cero, 2ª edición

by Joel Grus
September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos desde cero, 2ª edición

Capítulo 9. Obtener datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Para escribirlo, necesité tres meses; para concebirlo, tres minutos; para recopilar los datos que contiene, toda mi vida.

F. Scott Fitzgerald

Para ser un científico de datos necesitas datos. De hecho, como científico de datos pasarás una fracción vergonzosamente grande de tu tiempo adquiriendo, limpiando y transformando datos. En caso de apuro, siempre puedes teclear los datos tú mismo (o si tienes secuaces, hacer que lo hagan), pero normalmente esto no es un buen uso de tu tiempo. En este capítulo, veremos distintas formas de introducir datos en Python y en los formatos adecuados.

stdin y stdout

Si ejecutas tus scripts de Python en la línea de comandos, puedes canalizar datos a través de ellos utilizando sys.stdin y sys.stdout. Por ejemplo, aquí tienes un script que lee líneas de texto y escupe las que coinciden con una expresión regular:

# egrep.py
import sys, re

# sys.argv is the list of command-line arguments
# sys.argv[0] is the name of the program itself
# sys.argv[1] will be the regex specified at the command line
regex = sys.argv[1]

# for every line passed into the script
for line in sys.stdin:
    # if it matches the regex, write it to stdout
    if re.search(regex, line):
        sys.stdout.write(line)

Y aquí tienes uno que cuenta las líneas que recibe y luego escribe el recuento:

# line_count.py
import sys

count = 0
for line in sys.stdin ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Ciencia de datos en AWS

Ciencia de datos en AWS

Chris Fregly, Antje Barth

Publisher Resources

ISBN: 9781098182625