book

AI applicata allo sviluppo Java aziendale (Italian Edition)

Name: AI applicata allo sviluppo Java aziendale (Italian Edition)
ISBN: 0642572279868

by Alex Soto Bueno, Markus Eisele, Natale Vinto

November 2025

Intermediate to advanced

430 pages

11h 25m

Italian

O'Reilly Media, Inc.

Read now

Unlock full access

Prefazione
Oltre i prototipi: creare app resilienti con l'AI usando JavaA chi è rivolto questo libroCome è organizzato il libroCosa ti serve e softwareConvenzioni usate in questo libroUso degli esempi di codiceO'Reilly Online LearningCome contattarciRingraziamentiAlexMarkusNatale
1. Il dilemma dell'IA aziendale
Il panorama dell'IA: una prospettiva tecnica Verso la GenAIApprendimento automatico: il fondamento dell'IA odiernaDeep Learning: uno strumento potente nell'arsenale dell'IAIA generativa: il futuro della creazione di contenutiModelli open source e dati di addestramentoPerché l'open source è un motore importante per la GenAIIl costo nascosto dei dati di scarsa qualità: comprendere il comportamento dei modelli attraverso gli input di addestramentoAggiungere dati specifici dell'azienda agli LLMsDecisioni di IA spiegabili e trasparentiConsiderazioni etiche e di sostenibilitàIl ciclo di vita degli LLMs e come influenzarne il comportamentoMLOps contro DevOps (e l'ascesa di AIOps e GenAIOps)Conclusione
2. I nuovi tipi di applicazioni
Capire i modelli linguistici di grandi dimensioniElementi chiave di un modello linguistico di grandi dimensioniImplementazione dei modelliScegliere il LLM giusto per la propria applicazioneTipo di modelloDimensioni ed efficienza del modelloApprocci di implementazionePrecisione supportata e ottimizzazione hardwareConsiderazioni etiche e pregiudiziSupporto della community e documentazioneCodice chiuso contro codice apertoEsempio di categorizzazioneModelli di base o modelli esperti: dove stiamo andando?Usare le tecnologie di supportoModelli di incorporamento e database vettorialiCaching e ottimizzazione delle prestazioniFramework per agenti AIProtocollo di contesto del modelloIntegrazione APISicurezza, conformità e controllo degli accessi del modelloConclusione
3. Suggerimenti per gli sviluppatori: perché i prompt sono importanti nelle app basate sull'intelligenza artificiale
Tipi di promptPrompt utente: input diretto dall'utentePrompt di sistema: istruzioni che guidano il comportamento del modelloPrompt contestuali: input precompilati o generati in modo dinamicoPrincipi per scrivere prompt efficaciTecniche di promptPrompt zero-shot: domande senza contestoRichieste few-shot: fornire esempi per guidare le rispostePrompting a catena di pensiero: incoraggiare il ragionamento passo dopo passoCoerenza interna: migliorare l'accuratezza generando più rispostePrompt di istruzioni: dare indicazioni chiare al modelloGenerazione potenziata dal recupero: migliorare i prompt con dati esterniStrategie avanzateCostruire prompt dinamici: combinare input statici e generatiUso del concatenamento dei prompt per mantenere il contestoUso di guardrail e convalide per output più sicuriSfruttare le API per personalizzare i promptOttimizzazione delle prestazioni rispetto ai costiDebug dei prompt: risoluzione dei problemi legati a risposte scadentiUso degli strumenti e chiamata delle funzioniL'ingegneria del contesto come nuova ingegneria dei promptProgettare la memoria e l'archiviazione per il contestoAccesso veloce con cache in memoriaMemoria calda per il contesto a breve termineDatabase vettoriali per la memoria semantica a lungo termineArchiviazione fredda per dati di archivio e repository di grandi dimensioniCombinazione di livelli di archiviazione per una distribuzione efficace del contestoConclusione
4. Architetture di IA per le app
Oltre le architetture tradizionali: perché i sistemi basati sull'intelligenza artificiale richiedono un nuovo approccioPanoramica dei pilastri fondamentali dell'architettura: una roadmap per il capitoloComponenti dell'applicazioneQuery e dati: gestire gli input delle appIl gateway AI: gestire input e outputContesto e memoriaInterazione e trasporto: usare strumenti e agentiScoperta e controllo degli accessiModello di servizioLa pipeline di preparazione dei datiOsservabilità e monitoraggio: lo stack AI end-to-endConclusione
5. Vettori di incorporamento, archivi vettoriali ed esecuzione locale dei modelli
Vettori incorporati e loro ruoloPerché servono gli embedding?Struttura di un vettore di embeddingMisurare la somiglianza: somiglianza coseno e distanzaModelli di embedding comuniCome si usano gli embedding nelle app di IA?Altri metodi di similaritàUsi non comuni dei vettori di incorporamentoArchivi vettoriali e meccanismi di queryCome i database vettoriali memorizzano e recuperano gli embeddingEsempi di archivi vettoriali comuniGenerazione potenziata dal recuperoIndicizzazione o generazione di incorporamenti vettoriali su larga scalaPerché eseguire i modelli localmente?Ollama: inferenza locale con un'interfaccia semplicePodman Desktop: utilizzo di ambienti containerizzati per carichi di lavoro di IAJlama: inferenza di modelli nativi Java per applicazioni basate su JVMConfronto tra i metodi di inferenza localeUsare l'API REST di OpenAIPanoramica dei modelli e degli endpoint di OpenAIGenerazione di embedding con l'API di OpenAIConclusione
6. API di inferenza
Cos'è un'API di inferenza?Vantaggi di un'API di inferenzaEsempi di API di inferenzaImplementazione di modelli di inferenza in JavaModelli di inferenza con DJLUno sguardo dietro le quinteModelli di inferenza con gRPCConclusione
7. Come accedere al modello di inferenza con Java
Connessione a un'API di inferenza con QuarkusL'architetturaL'API di inferenza delle frodiIl progetto QuarkusL'interfaccia client RESTLa risorsa RESTTestare l'esempioConnessione a un'API di inferenza con Spring Boot WebClientAggiunta della dipendenza WebClientUsare WebClientConnessione all'API di inferenza con il client gRPC di QuarkusAggiungere le dipendenze gRPCImplementazione del client gRPCConclusione
8. LangChain4j
Cos'è LangChain4j?API unificateModelli di promptOutput strutturatiMemoriaAumento dei datiStrumentiAPI di alto livelloLangChain4j con Java sempliceEstrazione di informazioni da testi non strutturatiClassificazione del testoCreazione di immagini e descrizioniIntegrazione con Spring BootAggiunta di dipendenze Spring BootDefinizione del servizio AICreare un controller RESTIntegrazione con QuarkusDipendenze QuarkusFrontendIl servizio AIWebSocketRiconoscimento ottico dei caratteriStrumentiDipendenzePersistenza delle corseServizio tempi di attesaServizio AIEndpoint RESTStrumenti dinamiciNote finali sugli strumentiMemoriaDipendenzeModifiche al codiceConclusione
9. Incorporamenti e archivi vettoriali
Calcolo delle incorporazioni vettorialiIncorporamenti vettoriali usando DJLIncorporamenti vettoriali usando LangChain4j in-processIncorporamenti vettoriali usando modelli remoti con LangChain4jClassificatore di testoIncorporamento delle dipendenze della classificazione del testoFornire esempi e categorizzare gli inputRaggruppamento di testiAggiunta di dipendenze di raggruppamento di testoLeggere le notizie principaliCalcolo dell'incorporamento vettorialeRaggruppamento delle notizieRiassumere i titoli delle notizieRicerca semanticaAggiungere dipendenze di ricerca semanticaImportare filmQuery di somiglianzeCache semanticaRAGAcquisizioneRecuperoRiorganizzazioneRouter di queryFinestra di suddivisione dell'acquisizioneFiltraggio dei risultatiConclusione

10. LangGraph4j
Comprendere i grafici in LangGraph4jNodiBordiStatoUsare LangGraph4jDefinizione di uno statoDefinizione di un nodoDefinizione di un graficoAggiungere bordi condizionaliAggiunta di valoriUsare LangChain4j con LangGraph4jAgenti di routingInterazione umana con LangGraph4jSchema RAG avanzato con autoriflessioneScopri altre funzioniSottografiEsecuzione parallelaViaggio nel tempoConclusione
11. Elaborazione delle immagini
OpenCVInizializzazione della libreriaCaricamento e salvataggio delle immaginiFare trasformazioni di baseSovrapposizione di elementiElaborazione delle immaginiLeggere codici a barre e codici QRElaborazione dei flussiElaborazione di videoElaborazione delle immagini della webcamOpenCV e JavaOCRConclusione
12. Argomenti avanzati nello sviluppo Java dell'IA
StreamingStreaming con un'API di basso livelloStreaming con servizi di intelligenza artificialeUso di LangChain4j e integrazioni di streamingGuardrailGuida per l'inputGuida per l'outputCasi d'uso di GuardrailProtocollo di contesto del modelloArchitettura MCPClient MCP con JavaClient MCP con QuarkusServer MCP con QuarkusVantaggi principali di MCPProssimi passi
Indice
Gli autori

Content preview from AI applicata allo sviluppo Java aziendale (Italian Edition)

Capitolo 6. APIdi inferenza

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

i già ampliato le tue conoscenze sull'IA e sui vari tipi di modelli. In più, hai implementato questi modelli a livello locale (se possibile) e li hai testati con delle query. Ma quando arriva il momento di usare i modelli, devi esporli nel modo giusto, seguire le best practice della tua organizzazione e dare agli sviluppatori un modo semplice per usare il modello.

Un'API di inferenza aiuta a risolvere questi problemi, rendendo i modelli accessibili a tutti gli sviluppatori. Questo capitolo spiega come rendere disponibile un modello di IA/ML usando un'API di inferenza in Java.

Cos'è un'API di inferenza?

Un'API di inferenza permette agli sviluppatori di un e di mandare dati (in qualsiasi protocollo, come HTTP, gRPC o Kafka) a un server con un modello ML implementato e ricevere le previsioni o le classificazioni come risultato. In pratica, ogni volta che accedi a modelli cloud come OpenAI o Gemini o a modelli implementati localmente usando Ollama, lo fai attraverso la loro API di inferenza.

Anche se oggi è normale usare modelli grandi addestrati da grandi aziende come Google, IBM o Meta, soprattutto per scopi LLM, potresti aver bisogno di usare modelli piccoli addestrati su misura per risolvere un problema specifico della tua attività. Di solito, questi modelli sono sviluppati dai data scientist della tua organizzazione ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Integrare l'intelligenza artificiale nei processi aziendali

Publisher Resources

ISBN: 0642572279868

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

AI applicata allo sviluppo Java aziendale (Italian Edition)

by Alex Soto Bueno, Markus Eisele, Natale Vinto

Capitolo 6. APIdi inferenza

Cos'è un'API di inferenza?

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.