Generazione di schema con AI - Entity Enricher

Generazione di schema con AI

Incolla un qualsiasi campione di dati JSON e lascia che l'AI generi uno schema di arricchimento completamente tipizzato, con domini di competenza, chiavi di ricerca, rilevamento di campi multilingue e regole di convalida. Il processo di generazione include fino a 6 tentativi di autocorrezione, garantendo che lo schema sia valido prima ancora che tu lo veda.

Pipeline di generazione dello schema

PASSAGGIO 1

Incolla JSON di esempio

Qualsiasi oggetto o array JSON che rappresenta i dati dell'entità

PASSAGGIO 2

L'AI genera lo schema

L'LLM analizza tipi di dati, annidamenti, convenzioni di denominazione e domini di competenza

PASSAGGIO 3

Validazione a 8 regole

1.Correttezza del tipo

2.Validità del target di $ref

3.Assegnazione della competenza

4.Limiti di conteggio delle competenze

5.Validità della chiave di ricerca

6.Denominazione proprietà

7.Profondità della struttura nidificata

8.Vincoli dei campi obbligatori

Se la convalida fallisce, gli errori vengono rinviati all'LLM per l'autocorrezione (fino a 6 tentativi)

PASSAGGIO 4

Post-elaborazione

Rilevamento nullable, retrocessione della chiave di ricerca, raccolta della competenza

OUTPUT

Schema di arricchimento convalidato

Pronto per l'arricchimento con proprietà tipizzate, domini di competenza e chiavi di ricerca

Autocorrezione tramite ModelRetry

Gli LLM generano occasionalmente schemi con problemi strutturali: una discrepanza di tipo tra lo schema e i dati di input, un $ref che punta a una definizione inesistente o troppi domini di competenza. Entity Enricher utilizza il meccanismo ModelRetry di Pydantic-AI per individuare questi problemi e restituirli all'LLM per la correzione nell'ambito della stessa esecuzione di generazione.

Questo avviene in modo trasparente. Il sistema valida l'output dell'LLM rispetto a 8 regole e, se una regola fallisce, gli errori specifici vengono rinviati al model con le istruzioni per correggerli. Questo ciclo di retry viene eseguito fino a 6 volte, ottenendo un output di schema valido quasi al 100% senza intervento manuale.

Regole di convalida applicate

Correttezza del tipo

I tipi delle proprietà dello schema devono corrispondere ai tipi di dati osservati nel JSON di input.

Integrità di $ref

Tutti i puntatori $ref devono fare riferimento a entità definite nella sezione $defs.

Assegnazione della competenza

Ogni proprietà deve appartenere a un dominio di competenza valido.

Numero di competenze

Il numero totale di domini di competenza deve rientrare nei limiti configurabili.

Validità della chiave di ricerca

Le chiavi di ricerca devono fare riferimento a proprietà esistenti con valori non vuoti.

Denominazione Proprietà

I nomi delle proprietà devono seguire la convenzione snake_case.

Profondità della struttura

La profondità di nidificazione deve rimanere entro i limiti (10 livelli per impostazione predefinita).

Vincoli del campo

Vengono convalidati i campi obbligatori, i valori minimi/massimi e i vincoli enum.

Post-elaborazione intelligente

Dopo che l'LLM ha generato e autocorretto lo schema, vengono applicate ulteriori trasformazioni basate sui dati:

Rilevamento nullable

Se i dati di input hanno valori null per un campo, la proprietà dello schema viene automaticamente contrassegnata come nullable. Ciò consente agli LLM di restituire null per i campi in cui i dati non sono disponibili, invece di forzare valori allucinati.

Declassamento della chiave di ricerca

I campi contrassegnati come chiavi di ricerca ma con valori vuoti nei dati di input perdono il flag di chiave di ricerca. Questo evita che chiavi di ricerca vuote riducano il focus del prompt di enrichment.

Raccolta delle competenze

Tutti i domini di competenza vengono raccolti dalle proprietà nidificate in un elenco di primo livello, così da poter vedere a colpo d'occhio la copertura dei domini del proprio schema.

Modifica gli schemi con il linguaggio naturale

Dopo aver generato uno schema, è possibile modificarlo utilizzando istruzioni in linguaggio naturale. Digitando qualcosa come "add a parent_company reference with name and ownership_percentage", l'AI applica la modifica strutturale, mantenendo tutte le regole di validazione e le assegnazioni dei domini di competenza.

Ogni modifica AI produce anche 5 suggerimenti di miglioramento, come l'aggiunta di campi mancanti, il perfezionamento delle descrizioni o la riorganizzazione degli expertise domain. È possibile applicare questi suggerimenti con un solo clic.

Per un controllo diretto, l'editor visivo dello schema offre l'ordinamento delle proprietà tramite trascinamento, la modifica dei campi in linea, la navigazione da tastiera e il pieno supporto per annulla/ripristina. Per i dettagli, consultate la documentazione dell'editor dello schema.

Dallo schema all'output type-safe

Entity Enricher non si limita a generare un documento di schema JSON: converte il vostro schema in un modello Pydantic dinamico in fase di esecuzione. Questo modello viene quindi utilizzato come tipo di output strutturato per gli agenti Pydantic-AI, il che significa che l'output dell'LLM viene validato rispetto al vostro schema a livello di tipo. Gli output non validi attivano tentativi automatici.

Questo approccio combina la flessibilità degli schema definiti dall'utente con la sicurezza dei tipi dei model compilati. Ottenete il meglio di entrambi i mondi: definite qualsiasi forma desideriate e il sistema la applica automaticamente.

Documentazione sulla generazione dello schema|Regole di convalida|Arricchimento multi-modello|Elaborazione batch|Tutte le funzionalità

Genera il tuo primo schema

Incolla un campione JSON, scegli un modello e ottieni uno schema di arricchimento convalidato in pochi secondi. Poi perfezionalo con il linguaggio naturale o con l'editor visivo.

Inizia gratis