Capitolo 11. Apprendimento delle rappresentazioni e incorporazioni
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nel capitolo precedente abbiamo imparato come interfacciare i modelli linguistici con strumenti esterni, compresi i data store. I dati esterni possono essere presenti sotto forma di file di testo, tabelle di database e grafici di conoscenza. I dati possono comprendere un'ampia varietà di tipi di contenuti, dalle basi di conoscenza proprietarie specifiche del dominio ai risultati intermedi e agli output generati dagli LLMs.
Se i dati sono strutturati, ad esempio se risiedono in un database relazionale, il modello linguistico può eseguire una query SQL per recuperare i dati di cui ha bisogno. Ma cosa succede se i dati sono presenti in forma non strutturata?
Un modo per recuperare i dati da insiemi di testo non strutturati è quello di effettuare ricerche per parole chiave o di utilizzare espressioni regolari. Per l'esempio del CFO di Apple del capitolo precedente, possiamo recuperare il testo contenente le menzioni del CFO da un corpus contenente informazioni finanziarie, sperando che contenga la data di adesione o le informazioni sulla carica. Ad esempio, puoi usare la regex:
pattern=r"(?i)\b(?:C\.?F\.?O|Chief\s+Financial\s+Officer)\b"
La ricerca per parole chiave è limitata nella sua efficacia. Esiste un numero molto elevato di modi per esprimere la data di assunzione del ...