KI-Schema-Generierung - Entity Enricher

KI-Schema-Generierung

Fügen Sie ein beliebiges JSON-Datenbeispiel ein und lassen Sie die KI ein vollständig typisiertes Anreicherungs-Schema generieren – komplett mit Fachbereichen, Suchschlüsseln, mehrsprachiger Felderkennung und Validierungsregeln. Der Generierungsprozess umfasst bis zu 6 Selbstkorrekturversuche und stellt sicher, dass das Schema gültig ist, bevor Sie es überhaupt sehen.

Pipeline der Schemagenerierung

SCHRITT 1

Beispiel-JSON einfügen

Ein beliebiges JSON-Objekt oder -Array, das Ihre Entitätsdaten darstellt

SCHRITT 2

KI generiert Schema

Das LLM analysiert Datentypen, Verschachtelung, Benennungsmuster und Fachwissen der Expertisebereiche

SCHRITT 3

8-Regel-Validierung

1.Typkorrektheit
2.Gültigkeit der $ref-Ziele
3.Expertise-Zuweisung
4.Limits für die Expertise-Anzahl
5.Gültigkeit von Suchschlüsseln
6.Benennung von Eigenschaften
7.Tiefe der verschachtelten Struktur
8.Einschränkungen für Pflichtfelder

Schlägt die Validierung fehl, werden die Fehler zur Selbstkorrektur an das LLM zurückgesendet (bis zu 6 erneute Versuche)

SCHRITT 4

Nachbearbeitung

Nullable-Erkennung, Herabstufung von Suchschlüsseln, Sammlung von Expertise-Domänen

AUSGABE

Validiertes Anreicherungsschema

Bereit für die Anreicherung mit typisierten Eigenschaften, Fachbereichen und Suchschlüsseln

Selbstkorrektur via ModelRetry

LLMs erzeugen gelegentlich Schemas mit strukturellen Problemen – eine Typabweichung zwischen Schema und Eingabedaten, ein $ref, der auf eine nicht existierende Definition verweist, oder zu viele Expertisebereiche. Entity Enricher nutzt den ModelRetry-Mechanismus von Pydantic-AI, um diese Probleme zu erkennen und sie dem LLM zur Korrektur innerhalb desselben Generierungslaufs zurückzumelden.

Dies geschieht transparent. Das System validiert die LLM-Ausgabe anhand von 8 Regeln, und wenn eine Regel fehlschlägt, werden die spezifischen Fehler mit der Anweisung, sie zu beheben, an das Modell zurückgesendet. Diese Wiederholungsschleife läuft bis zu 6 Mal und erzielt eine nahezu 100 % gültige Schema-Ausgabe ohne manuellen Eingriff.

Angewendete Validierungsregeln

Typkorrektheit

Die Typen der Schemaeigenschaften müssen den beobachteten Datentypen aus dem Eingabe-JSON entsprechen.

$ref-Integrität

Alle $ref-Verweise müssen auf Entitäten verweisen, die im Abschnitt $defs definiert sind.

Expertise-Zuweisung

Jede Eigenschaft muss zu einer gültigen Expertise-Domäne gehören.

Expertise-Anzahl

Die Gesamtzahl der Fachgebiete muss innerhalb konfigurierbarer Grenzen bleiben.

Gültigkeit von Suchschlüsseln

Suchschlüssel müssen auf vorhandene Eigenschaften mit nicht-leeren Werten verweisen.

Benennung von Eigenschaften

Eigenschaftsnamen müssen der snake_case-Konvention folgen.

Strukturtiefe

Die Verschachtelungstiefe muss innerhalb der Grenzen bleiben (Standard 10 Ebenen).

Feldbeschränkungen

Pflichtfelder, Min-/Max-Werte und Enum-Einschränkungen werden validiert.

Intelligente Nachverarbeitung

Nachdem das LLM das Schema generiert und selbst korrigiert hat, werden zusätzliche datengesteuerte Transformationen angewendet:

Nullable-Erkennung

Wenn die Eingabedaten für ein Feld Null-Werte enthalten, wird die Schema-Eigenschaft automatisch als nullbar markiert. Dadurch können LLMs für Felder, in denen keine Daten verfügbar sind, null zurückgeben, anstatt halluzinierte Werte zu erzwingen.

Herabstufung von Suchschlüsseln

Bei Feldern, die als Suchschlüssel markiert sind, aber leere Werte in den Eingabedaten haben, wird die Suchschlüssel-Markierung entfernt. Das verhindert, dass leere Suchschlüssel den Fokus des Anreicherungs-Prompts verwässern.

Expertise-Sammlung

Alle Fachdomänen werden aus verschachtelten Eigenschaften in einer Liste auf oberster Ebene zusammengeführt, sodass Sie die Domänenabdeckung Ihres Schemas auf einen Blick erkennen können.

Schemas mit natürlicher Sprache bearbeiten

Nach dem Generieren eines Schemas können Sie es mit Anweisungen in natürlicher Sprache ändern. Geben Sie etwas ein wie "eine parent_company-Referenz mit name und ownership_percentage hinzufügen", und die KI wendet die strukturelle Änderung an, wobei alle Validierungsregeln und Expertise-Zuweisungen erhalten bleiben.

Jede KI-Bearbeitung erzeugt zudem 5 Verbesserungsvorschläge -- etwa das Ergänzen fehlender Felder, das Verbessern von Beschreibungen oder das Neuordnen von Fachdomänen. Sie können diese Vorschläge mit einem einzigen Klick anwenden.

Für direkte Kontrolle bietet der visuelle Schema-Editor Drag-and-Drop-Sortierung von Eigenschaften, Inline-Feldbearbeitung, Tastaturnavigation und volle Undo/Redo-Unterstützung. Details finden Sie in der Dokumentation zum Schema-Editor.

Vom Schema zur typsicheren Ausgabe

Entity Enricher erzeugt nicht nur ein JSON-Schema-Dokument -- es wandelt Ihr Schema zur Laufzeit in ein dynamisches Pydantic-Modell um. Dieses Modell dient dann als strukturierter Ausgabetyp für Pydantic-AI-Agenten, sodass die LLM-Ausgabe auf Typebene gegen Ihr Schema validiert wird. Ungültige Ausgaben lösen automatische Wiederholungsversuche aus.

Dieser Ansatz kombiniert die Flexibilität benutzerdefinierter Schemas mit der Typsicherheit kompilierter Modelle. Sie erhalten das Beste aus beiden Welten: Definieren Sie jede beliebige Form, und das System setzt sie automatisch durch.

Generieren Sie Ihr erstes Schema

Fügen Sie ein JSON-Beispiel ein, wählen Sie ein Modell und erhalten Sie in Sekunden ein validiertes Anreicherungs-Schema. Verfeinern Sie es anschließend mit natürlicher Sprache oder dem visuellen Editor.

Kostenlos starten