Skip to Content
Aprendizaje automático fiable
book

Aprendizaje automático fiable

by Cathy Chen, Niall Richard Murphy, Kranti Parisa, D. Sculley, Todd Underwood
September 2024
Intermediate to advanced
410 pages
14h 46m
Spanish
O'Reilly Media, Inc.
Content preview from Aprendizaje automático fiable

Capítulo 4. Características y datos de entrenamiento

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

A estas alturas debería estar claro que los modelos proceden de los datos. Este capítulo trata de los datos: cómo se crean, procesan, anotan, almacenan y, en última instancia, se utilizan para crear el modelo. Verás que la gestión y el manejo de los datos crean retos específicos de repetibilidad, manejabilidad y fiabilidad, y haremos algunas recomendaciones concretas sobre cómo abordar esos retos. Para conocer los antecedentes, asegúrate de ver (si aún no lo has hecho) los Capítulos 2 y 3.

Este capítulo trata de la infraestructura que acepta los datos de una fuente y los prepara para ser utilizados por el sistema de entrenamiento. Hablaremos de tres subsistemas funcionales fundamentales implicados en esta tarea: un sistema de características, un sistema de anotaciones humanas y un sistema de metadatos. Ya hemos hablado un poco de los rasgos en el capítulo anterior; otra forma de pensar en ellos es que son características de los datos de entrada, especialmente características que hemos determinado que predicen algo que nos interesa. Las etiquetas son casos específicos de la salida que queremos del modelo que finalmente entrenamos. Se utilizan como ejemplos para entrenar ese modelo. Otra forma de pensar en las etiquetas es que son los valores objetivo o "correctos" para una ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Patrones de comunicación

Patrones de comunicación

Jacqui Read
Ingeniería de la observabilidad

Ingeniería de la observabilidad

Charity Majors, Liz Fong-Jones, George Miranda
Óxido efectivo

Óxido efectivo

David Drysdale

Publisher Resources

ISBN: 9781098199340