Genereer gestructureerde JSON-schema's uit voorbeelddata met AI, inclusief automatische zelfcorrectie en intelligente nabewerking.
Schemageneratie zet ruwe entiteitgegevens om in een getypeerd, geannoteerd JSON-schema dat precies bepaalt welke informatie er tijdens de verrijking wordt geëxtraheerd. In plaats van schema's handmatig te schrijven, plak je voorbeeld-JSON en laat je AI de structuur analyseren, types afleiden, expertisedomeinen toewijzen en verbeteringen voorstellen.
{"en": "...", "fr": "..."}) worden samengevouwen tot één waarde, en het aantal eigenschappen bepaalt hoeveel expertisedomeinen zijn toegestaan.De zelfcorrectielus is wat schemageneratie betrouwbaar maakt. Nadat de AI een schema heeft geproduceerd, gaat het door een validator die 8 regels controleert op typecorrectheid, expertisetoewijzing, referentie-integriteit en datavolledigheid. Als een regel faalt, wordt de specifieke foutmelding teruggestuurd naar de AI zodat deze het probleem in de volgende poging kan oplossen.
revenue: type-mismatch — invoer is een getal maar schema zegt 'string'number. Alle 8 regels slagen. Het schema wordt geaccepteerd.Deze aanpak is veel betrouwbaarder dan de AI in de prompt vragen om “voorzichtig te zijn met types”. De validator vangt concrete fouten op en geeft de AI nauwkeurige feedback om ze te herstellen. Lees meer over elke regel in de gids Validatieregels.
Een gegenereerd schema is meer dan een eenvoudige typedefinitie. Elke eigenschap bevat metadata die het verrijkingsproces stuurt:
JSON Schema-type (string, number, integer, boolean, array, object)
Contextuele beschrijving die de AI vertelt welke informatie te vinden
Welk expertisedomein (financieel, regelgevend, enz.) deze waarde levert
Of dit veld de entiteit identificeert (zoeken) of arrays ontdubbelt (samenvoegen)
Of het veld null mag zijn, wat onnodige nieuwe pogingen voor optionele gegevens voorkomt
Of het veld in meerdere talen moet worden verrijkt
Of de oorspronkelijke waarde ongewijzigd moet blijven tijdens verrijking
Realistische voorbeeldwaarden die de AI naar het juiste formaat leiden
De AI groepeert schema-eigenschappen in expertisedomeinen op basis van hun semantische betekenis. Zo kan een schema voor een farmaceutisch bedrijf domeinen bevatten als “Financieel analist,” “Regelgevingsexpert” en “Bedrijfsinformatie.” Deze domeinen worden gebruikt door de multi-expertisestrategie om parallelle, gespecialiseerde LLM-aanroepen uit te voeren voor diepere resultaten.
Het aantal expertisedomeinen wordt automatisch beperkt op basis van het aantal eigenschappen van je gegevens om overfragmentatie te voorkomen:
Nadat de AI een geldig schema heeft gegenereerd, verfijnen drie deterministische nabewerkingsstappen het op basis van je werkelijke invoergegevens:
Velden met null-waarden in je invoer worden automatisch als nullable gemarkeerd, zodat de AI geen pogingen verspilt om ze in te vullen.
Zoeksleutelvlaggen worden verwijderd van velden met lege waarden (null, lege tekst, nul), omdat ze de entiteit niet kunnen helpen identificeren.
Alle unieke expertise domains worden uit het schema verzameld voor metrics en strategieconfiguratie.
Na de generatie kun je schema's aanpassen met instructies in natuurlijke taal. Typ een opdracht en de AI voert de wijziging door met behoud van je bestaande schemastructuur. Elke bewerking levert ook 5 suggesties voor verdere verbeteringen op.
Voeg een employee_count integer-veld toeMaak een genest adresobject met stad en landVoeg Franse beschrijvingen toe aan alle tekstveldenDefinieer een verwijzing naar een moederbedrijf met $defsMarkeer het website-veld als nullableAI-bewerkingen worden gevalideerd met een subset van de generatieregels (typecontrole, referentie-integriteit, expertiseconsistentie) zonder vergelijking met invoergegevens, omdat je mogelijk opzettelijk velden toevoegt of verwijdert.
Zowel schemageneratie als AI-bewerking leveren 5 gerichte suggesties die verschillende verbetercategorieën bestrijken:
Suggesties verschijnen als klikbare chips in de Schema-editor — klik erop om de AI-bewerkingsinvoer automatisch in te vullen en toe te passen.