Una guida passo passo su come Entity Enricher elabora una singola entità — dall'input, attraverso la classificazione e l'esecuzione parallela dei modelli, fino all'output strutturato.
Aprite la pagina Schema Editor e configurate il vostro arricchimento. Uno stepper del flusso di lavoro vi guida attraverso le fasi della pipeline: Sample Data, Schema, Enrichment e Results.
Incolla un JSON di esempio per generare automaticamente uno schema, poi esplora l'albero interattivo delle proprietà. Modifica le proprietà, aggiungi domini di competenza e contrassegna i campi come chiavi di ricerca o come conservati.
Configura le opzioni di enrichment (strategia, model, lingue, classification, oltre allo schema di risposta e agli interruttori per l'output strutturato rigoroso) e compila le chiavi di ricerca dell'entity (nome, sito web, paese, ecc.) per identificare l'entity.
Mostra l'avanzamento e i risultati in tempo reale per ogni modello. Quando si utilizzano più modelli, viene visualizzato un pulsante “Unisci risultati” per la fusione.
Se ha selezionato un modello di classificazione, viene prima eseguita una chiamata LLM rapida ed economica per verificare che l'entità corrisponda al tipo di schema. Ciò evita di sprecare token per l'arricchimento quando l'entità non corrisponde. Maggiori informazioni nella documentazione sulla classificazione.
Ogni modello selezionato elabora l'entità utilizzando la strategia scelta. Quando vengono selezionati più modelli, questi vengono eseguiti in parallelo tra i provider (Claude e GPT-4 vengono eseguiti simultaneamente), mentre i modelli dello stesso provider vengono eseguiti in sequenza per rispettare i limiti di frequenza.
Ogni risposta dell'LLM viene validata rispetto al vostro schema in tempo reale. Quando l'output non corrisponde ai tipi o ai vincoli previsti, il sistema invia automaticamente gli errori all'LLM per la correzione.
Fino a 5 tentativi automatici di ripetizione per ogni chiamata LLM. Ogni tentativo include l'errore di validazione specifico, così l'LLM sa esattamente cosa correggere.
Due interruttori facoltativi chiedono al provider di vincolare l'output prima che venga restituito, così che meno risposte debbano essere corrette in partenza. Entrambi si applicano solo ai modelli che li supportano; tutto ricade comunque nel ciclo di validazione e nuovo tentativo descritto sopra.
Entity Enricher utilizza gli Server-Sent Events (SSE) per trasmettere l'avanzamento in tempo reale. Non dovete attendere il completamento di tutti i modelli — i risultati appaiono progressivamente man mano che ciascun dominio di competenza o modello termina.
Ogni model ottiene il proprio pannello dei risultati che mostra l'output JSON strutturato, i badge di avanzamento per expertise, l'utilizzo dei token, il costo e il tempo di elaborazione. Quando si utilizza la strategia multi-expertise, i badge delle expertise si aggiornano in tempo reale man mano che ciascun domain viene completato.
Quando si utilizza la strategia multi-competenza, alcune competenze possono fallire mentre altre riescono. Anziché scartare tutto, Entity Enricher restituisce l'output unito delle competenze riuscite con stato “Parziale”. È quindi possibile riprovare solo le competenze fallite senza rieseguire l'intero arricchimento.
Al termine dell'arricchimento, i risultati vengono salvati nella pagina Records per future consultazioni. Se sono stati utilizzati più modelli, è possibile unire i risultati tramite Fusione multi-modello.