Generieren Sie strukturierte JSON-Schemas aus Beispieldaten mithilfe von KI, mit automatischer Selbstkorrektur und intelligenter Nachbearbeitung.
Die Schemagenerierung wandelt rohe Entitätsdaten in ein typisiertes, annotiertes JSON-Schema um, das genau definiert, welche Informationen bei der Anreicherung extrahiert werden sollen. Anstatt Schemas manuell zu schreiben, fügen Sie Beispiel-JSON ein und lassen die KI die Struktur analysieren, Typen ableiten, Fachbereiche zuweisen und Verbesserungen vorschlagen.
{"en": "...", "fr": "..."}) werden zu einem einzelnen Wert reduziert, und die Anzahl der Eigenschaften bestimmt, wie viele Expertisebereiche zulässig sind.Die Selbstkorrektur-Schleife macht die Schema-Generierung zuverlässig. Nachdem die KI ein Schema erzeugt hat, durchläuft es einen Validator, der 8 Regeln zu Typkorrektheit, Fachbereichs-Zuordnung, Referenzintegrität und Datenvollständigkeit prüft. Schlägt eine Regel fehl, wird die spezifische Fehlermeldung an die KI zurückgesendet, damit sie das Problem im nächsten Versuch beheben kann.
revenue: Typkonflikt — Eingabe ist number, aber Schema sagt 'string'number. Alle 8 Regeln bestehen. Das Schema wird akzeptiert.Dieser Ansatz ist weitaus zuverlässiger, als die KI im Prompt zu bitten, „auf Typen zu achten“. Der Validator erkennt konkrete Fehler und gibt der KI präzises Feedback, um sie zu beheben. Erfahren Sie mehr über jede Regel im Leitfaden Validierungsregeln.
Ein generiertes Schema ist mehr als eine einfache Typdefinition. Jede Eigenschaft enthält Metadaten, die den Anreicherungsprozess steuern:
JSON-Schema-Typ (string, number, integer, boolean, array, object)
Kontextbezogene Beschreibung, die der KI mitteilt, welche Informationen zu finden sind
Welche Expertendomäne (finanziell, regulatorisch usw.) diesen Wert liefert
Ob dieses Feld die Entität identifiziert (Suche) oder Arrays dedupliziert (Zusammenführung)
Ob das Feld null sein kann, wodurch unnötige Wiederholungen bei optionalen Daten vermieden werden
Ob das Feld in mehreren Sprachen angereichert werden soll
Ob der ursprüngliche Wert während der Anreicherung unverändert beibehalten werden soll
Realistische Beispielwerte, die die KI zum richtigen Format führen
Die KI gruppiert Schema-Eigenschaften anhand ihrer semantischen Bedeutung in Expertisebereiche. Ein Schema für ein Pharmaunternehmen könnte beispielsweise Bereiche wie „Finanzanalyst“, „Regulierungsexperte“ und „Unternehmensinformationen“ enthalten. Diese Bereiche werden von der Multi-Expertise-Strategie genutzt, um parallele, spezialisierte LLM-Aufrufe für tiefergehende Ergebnisse durchzuführen.
Die Anzahl der Fachbereiche wird basierend auf der Eigenschaftsanzahl Ihrer Daten automatisch begrenzt, um eine Überfragmentierung zu verhindern:
Nachdem die KI ein gültiges Schema generiert hat, verfeinern es drei deterministische Nachbearbeitungsschritte auf Basis Ihrer tatsächlichen Eingabedaten:
Felder mit Null-Werten in Ihrer Eingabe werden automatisch als nullable markiert, damit die KI keine Wiederholungen damit verschwendet, sie zu füllen.
Suchschlüssel-Markierungen werden bei Feldern mit leeren Werten (null, leerer String, Null) entfernt, da sie nicht zur Identifizierung der Entität beitragen können.
Alle eindeutigen Fachgebiete werden aus dem Schema für Metriken und die Strategiekonfiguration erfasst.
Nach der Generierung können Sie Schemas mit Anweisungen in natürlicher Sprache ändern. Geben Sie einen Befehl ein, und die KI wendet die Änderung an, während Ihre bestehende Schemastruktur erhalten bleibt. Jede Bearbeitung erzeugt außerdem 5 Vorschläge für weitere Verbesserungen.
Fügen Sie ein Integer-Feld employee_count hinzuErstellen Sie ein verschachteltes Adressobjekt mit Stadt und LandFranzösische Beschreibungen zu allen Textfeldern hinzufügenEine Referenz auf das Mutterunternehmen mit $defs definierenMarkieren Sie das Website-Feld als nullableKI-Bearbeitungen werden mit einer Teilmenge der Generierungsregeln validiert (Typprüfung, Referenzintegrität, Expertise-Konsistenz), ohne einen Vergleich mit den Eingabedaten, da Sie Felder absichtlich hinzufügen oder entfernen können.
Sowohl die Schemagenerierung als auch die KI-Bearbeitung liefern 5 gezielte Vorschläge, die verschiedene Verbesserungskategorien abdecken:
Vorschläge erscheinen als anklickbare Chips im Schema-Editor – klicken Sie auf einen, um die KI-Bearbeitungseingabe automatisch auszufüllen und anzuwenden.