Capítulo 8. Tuberías paralelas

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los capítulos anteriores, nos hemos ocupado de comandos y pipelines que se encargan de toda una tarea a la vez. En la práctica, sin embargo, puedes encontrarte ante una tarea que requiera que el mismo comando o pipeline se ejecute varias veces. Por ejemplo, puede que necesites:

  • Raspa cientos de páginas web

  • Haz decenas de llamadas a la API y transforma su resultado

  • Entrenar un clasificador para una serie de valores de los parámetros

  • Genera gráficos de dispersión para cada par de características de tu conjunto de datos

En cualquiera de estos ejemplos, hay una cierta forma de repetición implicada. Con tu lenguaje de scripting o programación favorito, podrías ocuparte de esto con un bucle for o un bucle while. En la línea de comandos, lo primero que podrías inclinarte a hacer es pulsar la tecla de flecha arriba para traer de vuelta el comando anterior, modificarlo si es necesario, y pulsar Intro para ejecutar el comando de nuevo. Esto está bien para hacerlo dos o tres veces, pero imagínate hacerlo docenas de veces. Un enfoque así se convierte rápidamente en engorroso, ineficaz y propenso a errores. La buena noticia es que también puedes escribir bucles de este tipo en la línea de comandos. De eso trata este capítulo.

A veces, basta con repetir un comando rápido una y otra vez de forma sucesiva (en serie ). Cuando dispones ...

Get Ciencia de datos en la línea de comandos, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.