AI-schemageneratie - Entity Enricher

AI-schemageneratie

Plak elk JSON-gegevensvoorbeeld en laat AI een volledig getypeerd verrijkingsschema genereren -- compleet met expertisedomeinen, zoeksleutels, detectie van meertalige velden en validatieregels. Het generatieproces omvat tot 6 zelfcorrectiepogingen, zodat het schema geldig is voordat je het ooit ziet.

Pijplijn voor schemageneratie

STAP 1

Voorbeeld-JSON plakken

Elk JSON-object of elke array die je entiteitsdata voorstelt

STAP 2

AI genereert schema

LLM analyseert datatypes, nesting, naamgevingspatronen en domeinexpertise

STAP 3

Validatie met 8 regels

1.Typecorrectheid
2.Geldigheid van $ref-doel
3.Expertisetoewijzing
4.Limieten voor expertise-aantal
5.Geldigheid van zoeksleutel
6.Benaming van eigenschappen
7.Diepte van geneste structuur
8.Beperkingen voor verplichte velden

Als de validatie mislukt, worden fouten teruggestuurd naar de LLM voor zelfcorrectie (tot 6 nieuwe pogingen)

STAP 4

Naverwerking

Nullable-detectie, degradatie van zoeksleutels, expertiseverzameling

UITVOER

Gevalideerd enrichment-schema

Klaar voor verrijking met getypeerde eigenschappen, expertisedomeinen en zoeksleutels

Zelfcorrectie via ModelRetry

LLM's genereren soms schema's met structurele problemen -- een typeverschil tussen het schema en de invoergegevens, een $ref die naar een niet-bestaande definitie verwijst, of te veel expertisedomeinen. Entity Enricher gebruikt het ModelRetry-mechanisme van Pydantic-AI om deze problemen op te sporen en terug te geven aan de LLM voor correctie binnen dezelfde generatierun.

Dit gebeurt transparant. Het systeem valideert de LLM-output aan de hand van 8 regels, en als een regel faalt, worden de specifieke fouten teruggestuurd naar het model met instructies om ze te herstellen. Deze retry-lus wordt tot 6 keer uitgevoerd en bereikt zo bijna 100% geldige schema-output zonder handmatige tussenkomst.

Toegepaste validatieregels

Typecorrectheid

Schema-eigenschaptypes moeten overeenkomen met de waargenomen gegevenstypes uit de invoer-JSON.

$ref-integriteit

Alle $ref-verwijzingen moeten verwijzen naar entiteiten die zijn gedefinieerd in de $defs-sectie.

Expertisetoewijzing

Elke eigenschap moet tot een geldig expertisedomein behoren.

Aantal expertises

Het totaal aantal expertisedomeinen moet binnen de instelbare limieten blijven.

Geldigheid van zoeksleutel

Zoeksleutels moeten verwijzen naar bestaande eigenschappen met niet-lege waarden.

Benaming van eigenschappen

Namen van eigenschappen moeten de snake_case-conventie volgen.

Structuurdiepte

De nestingsdiepte moet binnen de limieten blijven (standaard 10 niveaus).

Veldbeperkingen

Verplichte velden, min./max.-waarden en enum-beperkingen worden gevalideerd.

Intelligente nabewerking

Nadat de LLM het schema heeft gegenereerd en zelf gecorrigeerd, worden aanvullende datagestuurde transformaties toegepast:

Nullable-detectie

Als de invoerdata null-waarden heeft voor een veld, wordt de schema-property automatisch als nullable gemarkeerd. Zo kunnen LLM's null retourneren voor velden waarvoor geen data beschikbaar is, in plaats van gehallucineerde waarden af te dwingen.

Degradatie van zoeksleutel

Velden die als zoeksleutels zijn gemarkeerd maar lege waarden hebben in de invoergegevens, verliezen hun zoeksleutel-markering. Dit voorkomt dat lege zoeksleutels de focus van de verrijkingsprompt verwateren.

Expertiseverzameling

Alle expertise domains worden uit geneste eigenschappen verzameld in een lijst op hoofdniveau, zodat je in één oogopslag de domeindekking van je schema ziet.

Schema's bewerken met natuurlijke taal

Nadat je een schema hebt gegenereerd, kun je het aanpassen met instructies in natuurlijke taal. Typ bijvoorbeeld "voeg een parent_company-referentie toe met name en ownership_percentage" en de AI voert de structurele wijziging door, met behoud van alle validatieregels en expertisetoewijzingen.

Elke AI-bewerking levert ook 5 verbetersuggesties op — zaken zoals het toevoegen van ontbrekende velden, het verbeteren van beschrijvingen of het herindelen van expertise domains. Je kunt deze suggesties met één klik toepassen.

Voor directe controle biedt de visuele schema-editor drag-and-drop-ordening van eigenschappen, inline veldbewerking, toetsenbordnavigatie en volledige ondersteuning voor ongedaan maken/opnieuw doen. Zie de documentatie van de schema-editor voor meer details.

Van schema naar type-veilige output

Entity Enricher genereert niet zomaar een JSON-schemadocument -- het zet je schema tijdens runtime om in een dynamisch Pydantic-model. Dit model wordt vervolgens gebruikt als het gestructureerde uitvoertype voor Pydantic-AI-agents, wat betekent dat de LLM-uitvoer op typeniveau tegen je schema wordt gevalideerd. Ongeldige uitvoer leidt tot automatische nieuwe pogingen.

Deze aanpak combineert de flexibiliteit van door gebruikers gedefinieerde schema's met de typeveiligheid van gecompileerde models. Je krijgt het beste van twee werelden: definieer elke vorm die je wilt, en het systeem dwingt deze automatisch af.

Genereer je eerste schema

Plak een JSON-voorbeeld, kies een model en krijg binnen enkele seconden een gevalideerd verrijkingsschema. Verfijn het daarna met natuurlijke taal of de visuele editor.

Gratis aan de slag