Book description
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Tus datos de entrenamiento tienen tanto que ver con el éxito de tu proyecto de datos como los propios algoritmos, porque la mayoría de los fallos en los sistemas de IA están relacionados con los datos de entrenamiento. Pero aunque los datos de entrenamiento son la base del éxito de la IA y el aprendizaje automático, hay pocos recursos completos que te ayuden a dominar el proceso.
En esta guía práctica, el autor Anthony Sarkis -ingeniero jefe del software de datos de entrenamiento de IA Diffgram- muestra a los profesionales técnicos, directivos y expertos en la materia cómo trabajar con datos de entrenamiento y ampliarlos, al tiempo que ilumina el lado humano de la supervisión de máquinas. Los líderes de ingeniería, los ingenieros de datos y los profesionales de la ciencia de datos adquirirán una sólida comprensión de los conceptos, herramientas y procesos que necesitan para tener éxito con los datos de entrenamiento.
Con este libro, aprenderás a:
- Trabajar eficazmente con datos de entrenamiento, incluidos esquemas, datos brutos y anotaciones
- Transformar tu trabajo, equipo u organización para centrarte más en los datos de IA/ML
- Explicar con claridad los conceptos de los datos de entrenamiento a otros miembros del personal, del equipo y a las partes interesadas
- Diseñar, desplegar y enviar datos de entrenamiento para aplicaciones de IA de nivel de producción
- Reconocer y corregir nuevos modos de fallo basados en los datos de entrenamiento, como el sesgo de los datos.
- Utilizar con confianza la automatización para crear datos de entrenamiento con mayor eficacia
- Mantener, utilizar y mejorar con éxito los sistemas de registro de datos de formación.
Table of contents
- Prefacio
- 1. Introducción a los datos de entrenamiento
- 2. Ponerse en marcha
- 3. Esquema
- 4. Ingeniería de datos
- 5. Flujo de trabajo
-
6. Teorías, conceptos y mantenimiento
- Introducción
-
Teorías
- Un sistema es tan útil como su esquema
- Quién supervisa los datos es importante
- Los datos elegidos intencionadamente son los mejores
- Trabajar con datos históricos
- Los datos de entrenamiento son como el código
- Suposiciones superficiales sobre el uso de tus datos de entrenamiento
- La supervisión humana es diferente de los conjuntos de datos clásicos
-
Conceptos generales
- Relevancia de los datos
- Necesidad de evaluaciones cualitativas y cuantitativas
- Iteraciones
- Priorización: Qué etiquetar
- Relación del aprendizaje por transferencia con los conjuntos de datos (ajuste fino)
- Juicios por muestra
- Consideraciones éticas y de privacidad
- Sesgo
- Es difícil escapar de los prejuicios
- Metadatos
- Evitar la pérdida de metadatos
- Tren/Val/Prueba es la guinda del pastel
- Creación de muestras
- Mantenimiento
- Gestión de datos de formación
- Resumen
-
7. Transformación de la IA y casos de uso
- Introducción
-
Transformación de la IA
- Ver tu trabajo diario como una anotación
- La revolución creativa de la IA centrada en los datos
- Puedes crear nuevos datos
- Puedes cambiar los datos que recopilas
- Puedes cambiar el significado de los datos
- ¡Tú puedes crear!
- Mejora de la Función Paso a Paso para Grandes Proyectos
- Construye tus datos de IA para asegurar tu presente y tu futuro de IA
- Nombrar a un Líder: El Director de Datos de IA
- Descubrimiento de casos de uso
- El nuevo "Crowd Sourcing": Tus propios expertos
-
Herramientas modernas de datos de formación
- Piensa en la curva de aprendizaje, no en la perfección
- Se necesitan nuevos conocimientos y formación
- Cómo producen y consumen datos las empresas
- Trampa a Evitar: La Optimización Prematura en los Datos de Entrenamiento
- No hay balas de plata
- Cultura de los datos de formación
- Nuevos principios de ingeniería
- Resumen
-
8. Automatización
- Introducción
- Cómo empezar
- Contrapartidas
- Etiquetado previo
-
Automatización de la anotación interactiva
- Crear el tuyo propio
- Notas de configuración técnica
- ¿Qué es un Observador? (Patrón Observador)
- Cómo utilizar un Observador
- Captura interactiva de una región de interés
- Caja de dibujo interactiva a polígono utilizando GrabCut
- Ejemplo de predicción de modelo de imagen completa
- Ejemplo: Detección de personas para distintos atributos
- Automatización del control de calidad
- Descubrimiento de datos: Qué etiquetar
- Aumento
- Simulación y datos sintéticos
- Medios específicos
- Dominio específico
- Resumen
- 9. Casos prácticos e historias
- Índice
- Sobre el autor
Product information
- Title: Datos de entrenamiento para el aprendizaje automático
- Author(s):
- Release date: October 2024
- Publisher(s): O'Reilly Media, Inc.
- ISBN: 9798341602441
You might also like
book
Ciencia de datos en la línea de comandos, 2ª edición
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com Esta guía completamente …
book
Referencia de bolsillo sobre canalizaciones de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com Las canalizaciones de …
book
Arquitectura de Plataformas de Datos y Aprendizaje Automático
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com Todos los arquitectos …
book
Desarrollo de aplicaciones con GPT-4 y ChatGPT, 2ª edición
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com Este libro proporciona …