Capítulo 1. Introducción al servicio y la optimización de modelos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En la última década, los sistemas de IA han pasado de ser prototipos de investigación fuera de línea a convertirse en capacidades en tiempo real orientadas al usuario e integradas en productos cotidianos. Los flujos de trabajo modernos de IA abarcan todo el ciclo de vida —desde la recopilación de datos y el entrenamiento de modelos hasta la implementación, el monitoreo y la iteración continua— y este ciclo se ha acelerado drásticamente con el auge del Deep Learning y los LLMs. Si bien el entrenamiento de modelos cada vez más potentes ha acaparado gran parte de la atención, ofrecer esos modelos de manera confiable y eficiente en producción se ha vuelto igual de crítico.
En esencia, el servicio de modelos es un proceso que aborda el reto de hacer que los modelos de IA sean accesibles para los usuarios finales, las aplicaciones y los sistemas, trabajando a través de API, servicios web o flujos de trabajo integrados para generar predicciones e es (llamadas inferencias) sobre datos nuevos y desconocidos.
Para hacer una analogía sencilla, para todo tipo de empresas —ya sea que busquen ofrecer capacidades de IA a sus clientes o mejorar la eficiencia operativa—, el servicio de modelos es una forma de cadena de suministro. Un modelo entrenado tiene poco valor comercial a menos que se pueda entregar a los usuarios ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access