book

Escalando Python con Ray

Name: Escalando Python con Ray
ISBN: 9798341602809

by Holden Karau, Boris Lublinsky

October 2024

Intermediate to advanced

268 pages

6h 56m

Spanish

O'Reilly Media, Inc.

Read now

Unlock full access

Prólogo
Prefacio
Lo que aprenderásUna nota sobre la responsabilidadConvenciones utilizadas en este libroLicenciaUtilizar ejemplos de códigoAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientosDesde HoldenDe Boris
1. ¿Qué es el Rayo y dónde encaja?
¿Por qué necesitas a Ray?¿Dónde puedes correr Ray?Ejecutar tu código con Ray¿Dónde encaja en el ecosistema?Big Data / Marcos de datos escalablesAprendizaje automáticoProgramación del flujo de trabajoStreamingInteractivoLo que Ray no esConclusión
2. Cómo empezar con Ray (localmente)
InstalaciónInstalación para x86 y M1 ARMInstalación (desde el código fuente) para ARMHola MundosRay Remote (Tarea/Futuro) Hola MundoDatos Hola MundoActor Hola MundoConclusión
3. Funciones remotas
Fundamentos de las funciones remotas del rayoComposición de las funciones de rayo remotoBuenas prácticas de Ray RemoteReuniéndolo con un ejemploConclusión
4. Actores remotos
Comprender el modelo de actorCreación de un Actor Remoto de Rayos BásicoImplementación de la Persistencia del ActorEscalar actores remotos de rayosBuenas prácticas de los actores remotos del rayoConclusión
5. Detalles del diseño del rayo
Tolerancia a fallosObjetos RayosSerialización/PicklingcloudpickleFlecha ApacheRecursos / Escalado verticalAutoescaladorGrupos de Colocación: Organizar tus tareas y actoresEspacios de nombresGestión de dependencias con entornos de tiempo de ejecuciónImplementación de aplicaciones Ray con la API de trabajo RayConclusión
6. Implementación de aplicaciones de streaming
Apache KafkaConceptos básicos de KafkaAPI KafkaUtilizar Kafka con RayAmpliar nuestra aplicaciónConstruir aplicaciones de procesamiento de flujos con RayEnfoque basado en clavesEnfoque independiente de la llaveMás allá de KafkaConclusión
7. Implementar microservicios
Comprender la arquitectura de microservicios en RayImplementaciónCapacidades adicionales de ImplementaciónComposición de la ImplementaciónUtilizar Ray Serve para servir modelosEjemplo de servicio modelo simpleConsideraciones para las implantaciones que sirven de modeloServicio especulativo de modelos utilizando el marco de microservicios RayConclusión
8. Flujos de trabajo de rayos
¿Qué son los flujos de trabajo de rayos?¿En qué se diferencia de otras soluciones?Funciones de los flujos de trabajo de rayos¿Cuáles son las características principales?Primitivas del flujo de trabajoTrabajar con conceptos básicos de flujo de trabajoFlujos de trabajo, pasos y objetosFlujos de trabajo dinámicosActores virtualesFlujos de trabajo en la vida realCrear flujos de trabajoGestionar flujos de trabajoConstruir un flujo de trabajo dinámicoConstruir flujos de trabajo con pasos condicionalesManejo de excepcionesManipulación Garantías de durabilidadAmpliar los flujos de trabajo dinámicos con actores virtualesIntegrar flujos de trabajo con otras primitivas de rayoActivar Flujos de Trabajo (Conectarse a Eventos)Trabajar con metadatos de flujo de trabajoConclusión

9. Datos avanzados con Ray
Crear y guardar conjuntos de datos de rayosUtilizar conjuntos de datos de rayos con diferentes herramientasUtilizar herramientas en conjuntos de datos de rayosDataFrames tipo pandas con DaskIndexaciónBarajaOperaciones embarazosamente paralelasTrabajar con varios DataFramesLo que no funcionaQué es más lentoManejo de algoritmos recursivosQué otras funciones son diferentesDataFrames tipo pandas con ModinBig Data con SparkTrabajar con herramientas localesUso de las operaciones incorporadas del conjunto de datos de rayosImplementar conjuntos de datos de rayosConclusión
10. Cómo Ray potencia el aprendizaje automático
Utilizar scikit-learn con RayUso de algoritmos de refuerzo con RayUtilizar XGBoostUtilizar LightGBMUtilizar PyTorch con RayAprendizaje por refuerzo con RayAjuste de hiperparámetros con RayConclusión
11. Uso de GPU y aceleradores con Ray
¿Para qué sirven las GPU?Los bloques de construcciónBibliotecas de nivel superiorAdquisición y liberación de recursos de GPU y aceleradoresBibliotecas ML de RayAutoescalado con GPUs y AceleradoresCPU Fallback como patrón de diseñoOtros aceleradores (no GPU)Conclusión
12. Rayos en la empresa
Problemas de seguridad de la dependencia del rayoInteractuar con las herramientas existentesUsar Ray con herramientas CI/CDAutenticación con RayMultiarrendamiento en RayCredenciales para fuentes de datosAgrupaciones permanentes frente a efímerasAgrupaciones efímerasConglomerados permanentesMonitoreoInstrumentar tu código con métricas de rayoEnvolver programas personalizados con RayConclusión
A. Caso práctico del Castor Espacial: Actores, Kubernetes y más
Diseño de alto nivelAplicaciónCliente de correo salientePatrones y utilidades de actores compartidosActor Servidor de CorreoActor satéliteUsuario ActorImplementación de Actor y Servidor SMSPruebaImplementaciónConclusión
B. Instalación e Implementación de Ray
Instalar Ray localmenteUtilizar imágenes Docker de RayUtilizar grupos de rayosInstalar Ray en AWSInstalar Ray en IBM CloudInstalación de Ray en KubernetesInstalar Ray en un clúster tipoUtilizar ray upUso del Operador Ray KubernetesInstalación de Ray en OpenShiftConclusión
C. Depurar con Ray
Consejos generales de depuración con RayErrores de serializaciónDepuración local con Ray LocalDepuración remotaDepurador integrado de Ray (mediante Pdb)Otras herramientasCódigos de Salida de Rayos y ContenedoresTroncos de rayoErrores de contenedorErrores nativosConclusión
Índice
Sobre los autores

Content preview from Escalando Python con Ray

Capítulo 5. Detalles del diseño del rayo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Ahora que has creado y trabajado con funciones y actores remotos, es hora de aprender lo que ocurre entre bastidores. En este capítulo, aprenderás conceptos importantes de los sistemas distribuidos, como la tolerancia a fallos, la gestión de recursos de Ray y formas de acelerar tus funciones y actores remotos. Muchos de estos detalles son más importantes cuando se utiliza Ray de forma distribuida, pero incluso los usuarios locales se benefician. Conocer a fondo el funcionamiento de Ray te ayudará a decidir cómo y cuándo utilizarlo.

Tolerancia a fallos

La tolerancia a fallos se refiere a cómo un sistema gestionará los fallos de todo, desde el código de usuario hasta el propio marco o las máquinas en las que se ejecuta. Ray tiene un mecanismo de tolerancia a fallos diferente adaptado a cada sistema. Como muchos sistemas, Ray no puede recuperarse del fallo del nodo principal .¹

Advertencia

Existen algunos errores no recuperables en Ray, que no puedes (de momento) desconfigurar. Si falla el nodo principal, el GCS o la conexión entre tu aplicación y el nodo principal, tu aplicación fallará y no podrá ser recuperada por Ray. Si necesitas tolerancia a fallos para estas situaciones, tendrás que desarrollar tu propia alta disponibilidad, probablemente utilizando ZooKeeper o herramientas similares de nivel inferior.

En general, la ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341602809

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design