Incolla un qualsiasi campione di dati JSON e lascia che l'AI generi uno schema di arricchimento completamente tipizzato, con domini di competenza, chiavi di ricerca, rilevamento di campi multilingue e regole di convalida. Il processo di generazione include fino a 6 tentativi di autocorrezione, garantendo che lo schema sia valido prima ancora che tu lo veda.
Incolla JSON di esempio
Qualsiasi oggetto o array JSON che rappresenta i dati dell'entità
L'AI genera lo schema
L'LLM analizza tipi di dati, annidamenti, convenzioni di denominazione e domini di competenza
Validazione a 8 regole
Se la convalida fallisce, gli errori vengono rinviati all'LLM per l'autocorrezione (fino a 6 tentativi)
Post-elaborazione
Rilevamento nullable, retrocessione della chiave di ricerca, raccolta della competenza
Schema di arricchimento convalidato
Pronto per l'arricchimento con proprietà tipizzate, domini di competenza e chiavi di ricerca
Gli LLM generano occasionalmente schemi con problemi strutturali: una discrepanza di tipo tra lo schema e i dati di input, un $ref che punta a una definizione inesistente o troppi domini di competenza. Entity Enricher utilizza il meccanismo ModelRetry di Pydantic-AI per individuare questi problemi e restituirli all'LLM per la correzione nell'ambito della stessa esecuzione di generazione.
Questo avviene in modo trasparente. Il sistema valida l'output dell'LLM rispetto a 8 regole e, se una regola fallisce, gli errori specifici vengono rinviati al model con le istruzioni per correggerli. Questo ciclo di retry viene eseguito fino a 6 volte, ottenendo un output di schema valido quasi al 100% senza intervento manuale.
I tipi delle proprietà dello schema devono corrispondere ai tipi di dati osservati nel JSON di input.
Tutti i puntatori $ref devono fare riferimento a entità definite nella sezione $defs.
Ogni proprietà deve appartenere a un dominio di competenza valido.
Il numero totale di domini di competenza deve rientrare nei limiti configurabili.
Le chiavi di ricerca devono fare riferimento a proprietà esistenti con valori non vuoti.
I nomi delle proprietà devono seguire la convenzione snake_case.
La profondità di nidificazione deve rimanere entro i limiti (10 livelli per impostazione predefinita).
Vengono convalidati i campi obbligatori, i valori minimi/massimi e i vincoli enum.
Dopo che l'LLM ha generato e autocorretto lo schema, vengono applicate ulteriori trasformazioni basate sui dati:
Se i dati di input hanno valori null per un campo, la proprietà dello schema viene automaticamente contrassegnata come nullable. Ciò consente agli LLM di restituire null per i campi in cui i dati non sono disponibili, invece di forzare valori allucinati.
I campi contrassegnati come chiavi di ricerca ma con valori vuoti nei dati di input perdono il flag di chiave di ricerca. Questo evita che chiavi di ricerca vuote riducano il focus del prompt di enrichment.
Tutti i domini di competenza vengono raccolti dalle proprietà nidificate in un elenco di primo livello, così da poter vedere a colpo d'occhio la copertura dei domini del proprio schema.
Dopo aver generato uno schema, è possibile modificarlo utilizzando istruzioni in linguaggio naturale. Digitando qualcosa come "add a parent_company reference with name and ownership_percentage", l'AI applica la modifica strutturale, mantenendo tutte le regole di validazione e le assegnazioni dei domini di competenza.
Ogni modifica AI produce anche 5 suggerimenti di miglioramento, come l'aggiunta di campi mancanti, il perfezionamento delle descrizioni o la riorganizzazione degli expertise domain. È possibile applicare questi suggerimenti con un solo clic.
Per un controllo diretto, l'editor visivo dello schema offre l'ordinamento delle proprietà tramite trascinamento, la modifica dei campi in linea, la navigazione da tastiera e il pieno supporto per annulla/ripristina. Per i dettagli, consultate la documentazione dell'editor dello schema.
Entity Enricher non si limita a generare un documento di schema JSON: converte il vostro schema in un modello Pydantic dinamico in fase di esecuzione. Questo modello viene quindi utilizzato come tipo di output strutturato per gli agenti Pydantic-AI, il che significa che l'output dell'LLM viene validato rispetto al vostro schema a livello di tipo. Gli output non validi attivano tentativi automatici.
Questo approccio combina la flessibilità degli schema definiti dall'utente con la sicurezza dei tipi dei model compilati. Ottenete il meglio di entrambi i mondi: definite qualsiasi forma desideriate e il sistema la applica automaticamente.
Incolla un campione JSON, scegli un modello e ottieni uno schema di arricchimento convalidato in pochi secondi. Poi perfezionalo con il linguaggio naturale o con l'editor visivo.
Inizia gratis