book

IA aplicada al desarrollo Java empresarial (Spanish Edition)

Name: IA aplicada al desarrollo Java empresarial (Spanish Edition)
ISBN: 0642572279844

by Alex Soto Bueno, Markus Eisele, Natale Vinto

November 2025

Intermediate to advanced

430 pages

11h 41m

Spanish

O'Reilly Media, Inc.

Read now

Unlock full access

Prefacio
Más allá de los prototipos: creación de aplicaciones resilientes con IA mediante JavaA quién va dirigido este libroCómo está organizado el libroRequisitos previos y softwareConvenciones utilizadas en este libroUso de ejemplos de códigoAprendizaje en línea de O'ReillyCómo ponerse en contacto con nosotrosAgradecimientosAlexMarkusNatale
1. El dilema de la IA empresarial
El panorama de la IA: una perspectiva técnica Todo el camino hacia GenAIAprendizaje automático: la base de la IA actualDeep Learning: una potente herramienta en el arsenal de la IAIA generativa: el futuro de la generación de contenidosModelos de código abierto y datos de entrenamientoPor qué el código abierto es un motor importante para la IA generativaEl coste oculto de los datos erróneos: comprender el comportamiento de los modelos a través de los datos de entrenamientoAñadir datos específicos de la empresa a los LLMsDecisiones de IA explicables y transparentesConsideraciones éticas y de sostenibilidadEl ciclo de vida de los LLMs y formas de influir en su comportamientoMLOps frente a DevOps (y el auge de AIOps y GenAIOps)Conclusión
2. Los nuevos tipos de aplicaciones
Comprensión de los grandes modelos lingüísticosElementos clave de un modelo de lenguaje grandeImplementación de modelosElegir el LLM adecuado para tu aplicaciónTipo de modeloTamaño y eficiencia del modeloEnfoques de implementaciónPrecisión admitida y optimización del hardwareConsideraciones éticas y sesgosComunidad y documentación de soporteCódigo cerrado frente a código abiertoCategorización de ejemplosModelos básicos o modelos expertos: ¿hacia dónde nos dirigimos?Uso de tecnologías de apoyoModelos de incrustación y bases de datos vectorialesAlmacenamiento en caché y optimización del rendimientoMarcos de agentes de IAProtocolo de contexto del modeloIntegración de APISeguridad, cumplimiento y control de acceso del modeloConclusión
3. Prompts para desarrolladores: por qué son importantes los prompts en las aplicaciones con IA
Tipos de promptsPrompts del usuario: entrada directa del usuarioPrompts del sistema: instrucciones que guían el comportamiento del modeloPrompts contextuales: entradas prellenadas o generadas dinámicamentePrincipios para escribir prompts eficacesTécnicas de promptSolicitudes sin contexto: prompts sin contextoSolicitaciones con pocos disparos: proporcionar ejemplos para guiar las respuestasPrompt de cadena de pensamiento: fomentar el razonamiento paso a pasoAutoconsistencia: mejorar la precisión generando múltiples respuestasIndicaciones de instrucción: dirigir el modelo de forma explícitaGeneración aumentada por recuperación: mejorar los prompts con datos externosEstrategias avanzadasConstrucción de prompts dinámicos: combinación de entradas estáticas y generadasUso del encadenamiento de prompt para mantener el contextoUso de barreras de protección y validaciones para obtener resultados más segurosAprovechamiento de las API para la personalización del promptOptimización del rendimiento frente al costeDepuración de prompts: resolución de problemas de respuestas deficientesUso de herramientas y llamada a funcionesLa ingeniería de contexto como nueva ingeniería de promptsDiseño de memoria y almacenamiento para el contextoAcceso rápido con cachés en memoriaMemoria caliente para contexto a corto plazoBases de datos vectoriales para la memoria semántica a largo plazoAlmacenamiento en frío para datos de archivo y repositorios grandesCombinación de niveles de almacenamiento para una entrega de contexto eficazConclusión
4. Arquitecturas de IA para aplicaciones
Más allá de las arquitecturas tradicionales: por qué los sistemas con IA requieren un nuevo enfoqueDescripción general de los pilares arquitectónicos fundamentales: una hoja de ruta para el capítuloComponentes de la aplicaciónConsultas y datos: gestión de las entradas de las aplicacionesLa puerta de enlace de IA: gestión de entradas y salidasContexto y memoriaInteracción y transporte: uso de herramientas y agentesDescubrimiento y control de accesoServicio de modelosEl proceso de preparación de datosObservabilidad y monitoreo: la pila de IA de extremo a extremoConclusión
5. Incrustación de vectores, almacenes de vectores y ejecución de modelos a nivel local
Incorporación de vectores y su función¿Por qué son necesarias las incrustaciones?Estructura de un vector de incrustaciónMedición de la similitud: similitud coseno y distanciaModelos de incrustación comunes¿Cómo se utilizan las incrustaciones en las aplicaciones de IA?Otros métodos de similitudUsos poco comunes de los vectores de incrustaciónAlmacenamiento de vectores y mecanismos de consultaCómo almacenan y recuperan las incrustaciones las bases de datos vectorialesEjemplos de almacenes de vectores comunesGeneración aumentada por recuperaciónIndexación o generación de incrustaciones vectoriales a escala¿Por qué ejecutar modelos localmente?Ollama: inferencia local con una interfaz sencillaPodman Desktop: uso de entornos contenedorizados para cargas de trabajo de IAJlama: inferencia de modelos nativos de Java para aplicaciones basadas en JVMComparación de métodos de inferencia localUso de la API REST de OpenAIDescripción general de los modelos y puntos finales de OpenAIGeneración de incrustaciones con la API de OpenAIConclusión
6. API de inferencia
¿Qué es una API de inferencia?Ventajas de una API de inferenciaEjemplos de API de inferenciaImplementación de modelos de inferencia en JavaModelos de inferencia con DJLUna mirada bajo el capóModelos de inferencia con gRPCConclusión
7. Acceso al modelo de inferencia con Java
Conexión a una API de inferencia con QuarkusLa arquitecturaLa API de inferencia de fraudeEl proyecto QuarkusLa interfaz del cliente RESTEl recurso RESTPrueba del ejemploConexión a una API de inferencia con Spring Boot WebClientAñadir la dependencia WebClientUso de WebClientConexión a la API de inferencia con el cliente gRPC de QuarkusAñadir dependencias gRPCImplementación del cliente gRPCConclusión
8. LangChain4j
¿Qué es LangChain4j?API unificadasPlantillas de promptSalidas estructuradasMemoriaAumento de datosHerramientasAPI de alto nivelLangChain4j con Java simpleExtracción de información de texto no estructuradoRealización de clasificación de textoGeneración de imágenes y descripcionesIntegración con Spring BootAñadir dependencias de Spring BootDefinición del servicio de IACreación de un controlador RESTIntegración con QuarkusDependencias de QuarkusInterfaz de usuarioEl servicio de IAWebSocketReconocimiento óptico de caracteresHerramientasDependenciasPersistencia de viajesServicio de tiempos de esperaServicio de IAPunto final RESTHerramientas dinámicasNotas finales sobre herramientasMemoriaDependenciasCambios en el códigoConclusión
9. Incrustaciones y almacenes vectoriales
Cálculo de incrustaciones vectorialesIncrustaciones vectoriales con DJLIncrustaciones vectoriales utilizando LangChain4j en procesoIncrustaciones vectoriales utilizando modelos remotos con LangChain4jClasificador de textoIncrustaciones de clasificación de texto DependenciasProporcionar ejemplos y categorizar entradasAgrupación de textosAdición de dependencias de agrupación de textoLectura de titulares de noticiasCálculo de la incrustación vectorialAgrupación de noticiasResumir titulares de noticiasBúsqueda semánticaAñadir dependencias de búsqueda semánticaImportación de películasBúsqueda de similitudesCaché semánticaRAGIngestiónRecuperaciónReclasificaciónEnrutador de consultasVentana de división de ingestiónFiltrado de resultadosConclusión

10. LangGraph4j
Comprensión de grafos en LangGraph4jNodosPerímetrosEstadoUso de LangGraph4jDefinición de un estadoDefinición de un nodoDefinición de un gráficoAñadir perímetros condicionalesAnexar valoresUso de LangChain4j con LangGraph4jAgentes de enrutamientoInteracción humana con LangGraph4jEsquema RAG avanzado con autorreflexiónExploración de funciones adicionalesSubgrafosEjecución paralelaViaje en el tiempoConclusión
11. Procesamiento de imágenes
OpenCVInicialización de la bibliotecaCarga y guardado de imágenesRealizar transformaciones básicasSuperposición de elementosProcesamiento de imágenesLectura de códigos de barras y códigos QRProcesamiento de flujosProcesamiento de vídeosProcesamiento de imágenes de la cámara webOpenCV y JavaOCRConclusión
12. Temas avanzados en el desarrollo de IA con Java
TransmisiónTransmisión con una API de bajo nivelTransmisión con servicios de IAUso de LangChain4j e integraciones de transmisiónBarreras de seguridadBarrera de entradaBarrera de salidaCasos de uso de barreras de seguridadProtocolo de contexto del modeloArquitectura MCPCliente MCP con JavaCliente MCP con QuarkusServidor MCP con QuarkusVentajas clave de MCPPróximos pasos
Índice
Acerca de los autores

Content preview from IA aplicada al desarrollo Java empresarial (Spanish Edition)

Capítulo 6. APIde inferencia

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Ya has ampliado tus conocimientos sobre la IA y los distintos tipos de modelos en. Además, has implementado estos modelos localmente (si ha sido posible) y los has probado con consultas. Pero cuando llega el momento de utilizar los modelos, es necesario exponerlos adecuadamente, seguir las buenas prácticas de tu organización y proporcionar a los desarrolladores una forma sencilla de consumir el modelo.

Una API de inferencia ayuda a resolver estos problemas, haciendo que los modelos sean accesibles para todos los desarrolladores. En este capítulo se explora cómo exponer un modelo de IA/ML utilizando una API de inferencia en Java.

¿Qué es una API de inferencia?

Una API de inferencia permite a los desarrolladores de e es enviar datos (en cualquier protocolo, como HTTP, gRPC o Kafka) a un servidor con un modelo ML implementado y recibir las predicciones o clasificaciones como resultado. En la práctica, cada vez que accedes a modelos en la nube como OpenAI o Gemini, o a modelos implementados localmente con Ollama, lo haces a través de su API de inferencia.

Aunque hoy en día es habitual utilizar grandes modelos entrenados por grandes empresas como Google, IBM o Meta, principalmente con fines de LLM, es posible que necesites utilizar pequeños modelos entrenados a medida para resolver un problema específico de tu negocio. Por lo general, estos ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572279844

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

IA aplicada al desarrollo Java empresarial (Spanish Edition)

by Alex Soto Bueno, Markus Eisele, Natale Vinto

Capítulo 6. APIde inferencia

¿Qué es una API de inferencia?

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.