book

Aprendizaje automático fiable

Name: Aprendizaje automático fiable
ISBN: 9781098199340

by Cathy Chen, Niall Richard Murphy, Kranti Parisa, D. Sculley, Todd Underwood

September 2024

Intermediate to advanced

410 pages

14h 46m

Spanish

O'Reilly Media, Inc.

Read now

Unlock full access

Prólogo
Prefacio
Por qué escribimos este libroLa ESR como lente del LDPúblico al que va dirigidoCómo está organizado este libroNuestro enfoque¡Vamos a tejer!Navegar por este libroSobre los autoresConvenciones utilizadas en este libroAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientosCathy ChenNiall Richard MurphyKranti ParisaD. SculleyTodd Underwood
1. Introducción
El ciclo de vida del MLRecogida y análisis de datosPipelines de entrenamiento MLConstruir y validar aplicacionesEvaluación de la calidad y el rendimientoDefinir y medir los SLOLanzaMonitoreo y bucles de retroalimentaciónLecciones del Bucle
2. Principios de gestión de datos
Los datos como responsabilidadLa sensibilidad de los datos de las tuberías MLFases de los datosCreaciónIngestiónProcesandoAlmacenamientoGestiónAnálisis y visualizaciónFiabilidad de los datosDurabilidadCoherenciaControl de versionesRendimientoDisponibilidadIntegridad de los datosSeguridadPrivacidadPolítica y cumplimientoConclusión
3. Introducción básica a los modelos
¿Qué es un modelo?Un flujo de trabajo básico para la creación de modelosArquitectura del modelo Versus definición del modelo Versus modelo entrenado¿Dónde están las vulnerabilidades?Datos de entrenamientoEtiquetasMétodos de formaciónInfraestructuras y tuberíasPlataformasGeneración de funcionesActualizaciones y correccionesUna serie de preguntas útiles sobre cualquier modeloUn ejemplo de sistema MLModelo de predicción de clics de productos de hiloCaracterísticasEtiquetas para funcionesActualización del modeloModelo de servicioFallos comunesConclusión
4. Características y datos de entrenamiento
CaracterísticasSelección e ingeniería de rasgosCiclo de vida de una funciónSistemas de característicasEtiquetasEtiquetas generadas por humanosAnotación PlantillasMedir la calidad de la anotación humanaUna plataforma de anotaciónAprendizaje activo y etiquetado asistido por IADocumentación y formación para etiquetadoresMetadatosVisión general de los sistemas de metadatosMetadatos del conjunto de datosMetadatos de característicasMetadatos de la etiquetaMetadatos del oleoductoPrivacidad e imparcialidad de los datosPrivacidadEquidadConclusión
5. Evaluación de la validez y calidad del modelo
Evaluación de la validez del modeloEvaluar la calidad del modeloEvaluaciones offlineDistribuciones de evaluaciónAlgunas métricas útilesOperacionalizar la verificación y la evaluaciónConclusión
6. Imparcialidad, privacidad y sistemas éticos de LD
Imparcialidad (también conocida como Lucha contra los prejuicios)Definiciones de equidadAlcanzar la equidadLa equidad como proceso y no como finNota legal rápidaPrivacidadMétodos para preservar la intimidadNota legal rápidaIA responsableExplicaciónEficaciaAdecuación social y culturalIA responsable a lo largo de la tubería de LDLluvia de ideas sobre casos prácticosRecogida y limpieza de datosCreación de modelos y formaciónValidación del modelo y evaluación de la calidadImplementación de modelosProductos para el mercadoConclusión
7. Sistemas de formación
RequisitosImplantación del Sistema de Formación BásicaCaracterísticasTienda de artículosSistema de Gestión de ModelosOrquestaciónEvaluación de la calidadMonitoreoPrincipios generales de fiabilidadLa mayoría de los fallos no serán fallos de LDSe reentrenarán los modelosLos modelos tendrán varias versiones (¡al mismo tiempo!)Los buenos modelos se volverán malosLos datos no estarán disponiblesLos modelos deben ser mejorablesSe añadirán y modificarán funcionesLas modelos pueden entrenar demasiado rápidoLa utilización de los recursos es importanteUtilización = EficienciaLas interrupciones incluyen la recuperaciónProblemas habituales de fiabilidad del entrenamientoSensibilidad de los datosEjemplo de problema de datos en YarnItReproducibilidadEjemplo de problema de reproducibilidad en YarnItCapacidad de recursos informáticosEjemplo de problema de capacidad en YarnItFiabilidad estructuralDesafíos organizativosConsideraciones éticas y de equidadConclusión
8. Servir
Preguntas clave para servir de modelo¿Cuál será la carga de nuestro modelo?¿Cuáles son las necesidades de latencia de predicción de nuestro modelo?¿Dónde tiene que vivir el modelo?¿Cuáles son las necesidades de hardware para nuestro modelo?¿Cómo se almacenará, cargará, versionará y actualizará el modelo de servicio?¿Cómo será nuestra línea de productos para servir?Arquitecturas Servidoras de ModelosServir sin conexión (Inferencia por lotes)Servir en línea (Inferencia en línea)Modelo como servicioServir en el perímetroElegir una arquitecturaDiseño del modelo APIPrueba¿Servir para la precisión o para la resistencia?EscaladoAutoescaladoAlmacenamiento en cachéRecuperación en caso de catástrofeConsideraciones éticas y de equidadConclusión

9. Monitoreo y observabilidad de los modelos
¿Qué es el monitoreo de la producción y por qué hacerlo?¿Qué aspecto tiene?Las preocupaciones que el ML aporta al monitoreoRazones para la observación continua del ML en producciónProblemas con el monitoreo de la producción MLDificultades del desarrollo frente al servicioEs necesario un cambio de mentalidadBuenas prácticas para el monitoreo de modelos MLRecomendaciones genéricas sobre el modelo de preservicioFormación y reciclajeValidación del modelo (antes de la implantación)Sirviendo aOtras cosas a tener en cuentaRecomendaciones de alto nivel para la estrategia de monitoreoConclusión
10. ML continuo
Anatomía de un sistema de ML continuoEjemplos de formaciónEtiquetas de formaciónFiltrar los datos erróneosAlmacenes de características y gestión de datosActualizar el modeloEmpujar modelos actualizados al servicioObservaciones sobre los sistemas de ML continuoLos acontecimientos mundiales externos pueden influir en nuestros sistemasLos modelos pueden influir en sus propios datos de entrenamientoLos efectos temporales pueden surgir en varias escalas temporalesLa respuesta de emergencia debe hacerse en tiempo realLos nuevos lanzamientos requieren una rampa de aceleración escalonada y líneas de base establesLos modelos deben gestionarse en lugar de enviarseOrganizaciones continuasRepensar los sistemas de ML no continuosConclusión
11. Respuesta a incidentes
Aspectos básicos de la gestión de incidentesLa vida de un incidenteFunciones de respuesta a incidentesAnatomía de una interrupción centrada en el MLRecordatorio terminológico: ModeloLa hora del cuentoRelato 1: Buscar pero no encontrarRelato 2: Compañeros repentinamente inútilesHistoria 3: Te recomiendo que busques nuevos proveedoresPrincipios de gestión de incidentes de LDPrincipios rectoresDesarrollador de Modelos o Científico de DatosIngeniero de softwareML SRE o Ingeniero de ProducciónJefe de Producto o Líder de NegocioTemas especialesLos ingenieros de producción y la ingeniería ML frente al modeladoEl Manifiesto Ético del Ingeniero de GuardiaConclusión
12. Cómo interactúan el producto y el ML
Diferentes tipos de productos¿LM ágil?Fases de desarrollo del producto MLDescubrimiento y definiciónFijación de objetivos empresarialesConstrucción y validación del MVPDesarrollo de modelos y productosImplementaciónAsistencia y mantenimientoConstruir frente a comprarModelosInfraestructura de procesamiento de datosPlataformas integralesMétodo de puntuación para tomar la decisiónTomar la decisiónMuestra de las características de la tienda YarnIt Powered by MLMuestra de hilos populares por ventas totalesRecomendaciones basadas en el historial de navegaciónVenta cruzada y upsellingFiltrado basado en el contenidoFiltrado ColaborativoConclusión
13. Integrar el ML en tu organización
Supuestos del capítuloPunto de vista basado en el líderLos detalles importanML necesita saber sobre el negocioLa suposición más importante que hacesEl valor del MLRiesgos organizativos significativosEl ML no es magiaInercia del modelo mental (forma de pensar)Corregir el riesgo en diferentes culturasLos equipos aislados no resuelven todos los problemasModelos de aplicaciónRecordar el objetivoGreenfield frente a BrownfieldFunciones y responsabilidades del MLCómo contratar a gente de MLDiseño organizativo e incentivosEstrategiaEstructuraProcesosRecompensasPersonasNota sobre la secuenciaciónConclusión
14. Ejemplos Prácticos de Implementación de ML Org
Escenario 1: Un nuevo equipo de ML centralizadoAntecedentes y descripción organizativaProcesoRecompensasPersonasAplicación por defectoEscenario 2: Infraestructura y conocimientos descentralizados de MLAntecedentes y descripción organizativaProcesoRecompensasPersonasAplicación por defectoEscenario 3: Híbrido con infraestructura centralizada/modelado descentralizadoAntecedentes y descripción organizativaProcesoRecompensasPersonasAplicación por defectoConclusión
15. Estudios de casos: MLOps en la práctica
1. Acomodar las políticas de privacidad y retención de datos en las tuberías de MLAntecedentesProblema y resoluciónPara llevar2. Modelo ML continuo que afecta al tráficoAntecedentesProblema y resoluciónPara llevar3. Inspección del aceroAntecedentesProblema y resoluciónPara llevar4. NLP MLOps: Prueba de carga de perfiles y etapasAntecedentesProblema y resoluciónPara llevar5. Predicción de clics publicitarios: Las bases de datos frente a la realidadAntecedentesProblema y resoluciónPara llevar6. Comprobación y medición de las dependencias en el flujo de trabajo de MLAntecedentesProblema y resoluciónPara llevar
Índice
Sobre los autores

Content preview from Aprendizaje automático fiable

Capítulo 11. Respuesta a incidentes

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este mundo, a veces pasan cosas malas, incluso a los datos y sistemas buenos. Los discos fallan. Los archivos se corrompen. Las máquinas se averían. Las redes se caen. Las llamadas a la API devuelven errores. Los datos se atascan o cambian sutilmente. Los modelos que antes eran precisos y representativos dejan de serlo. El mundo también puede cambiar a nuestro alrededor: cosas que antes nunca, o casi nunca, ocurrían pueden convertirse en habituales; esto a su vez repercute en nuestros modelos.

Gran parte de este libro trata sobre la construcción de sistemas de ML que eviten que ocurran estas cosas, o que cuando ocurran -y ocurrirán- reconozcan la situación correctamente y la mitiguen. En concreto, este capítulo trata de cómo responder cuando a los sistemas de ML les ocurren cosas malas y urgentes. Puede que ya estés familiarizado con la forma en que los equipos gestionan los sistemas que se caen o que tienen algún otro problema: esto se conoce como gestión de incidentes, y en existen buenas prácticas para gestionar incidentes que son comunes a muchos sistemas informáticos.¹

Abarcamos estas prácticas de aplicación general, pero nos centramos en cómo gestionar las interrupciones de los sistemas de ML y, en particular, en cómo esas interrupciones y su gestión difieren de las interrupciones de otros sistemas informáticos distribuidos. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9781098199340

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Aprendizaje automático fiable

by Cathy Chen, Niall Richard Murphy, Kranti Parisa, D. Sculley, Todd Underwood

Capítulo 11. Respuesta a incidentes

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.