Eine Schritt-für-Schritt-Anleitung dazu, wie Entity Enricher eine einzelne Entität verarbeitet – von der Eingabe über die Klassifizierung und die parallele Modellausführung bis hin zur strukturierten Ausgabe.
Öffnen Sie die Seite des Schema-Editors und richten Sie Ihre Anreicherung ein. Ein Workflow-Stepper führt Sie durch die Pipeline-Phasen: Beispieldaten, Schema, Anreicherung und Ergebnisse.
Fügen Sie ein Beispiel-JSON ein, um automatisch ein Schema zu generieren, und erkunden Sie anschließend den interaktiven Eigenschaftsbaum. Bearbeiten Sie Eigenschaften, fügen Sie Fachbereiche hinzu und markieren Sie Felder als Suchschlüssel oder als beizubehalten.
Anreicherungsoptionen konfigurieren (Strategie, Modelle, Sprachen, Klassifizierung sowie das Antwortschema und die Umschalter für strikte strukturierte Ausgabe) und Entitäts-Suchschlüssel ausfüllen (Name, Website, Land usw.), um die Entität zu identifizieren.
Zeigt Echtzeit-Fortschritt und Ergebnisse für jedes Modell. Bei Verwendung mehrerer Modelle erscheint für die Fusion eine Schaltfläche „Ergebnisse zusammenführen“.
Wenn Sie ein Klassifizierungsmodell ausgewählt haben, wird zunächst ein schneller, kostengünstiger LLM-Aufruf ausgeführt, um zu prüfen, ob die Entität dem Schema-Typ entspricht. Dadurch wird vermieden, dass Tokens für die Anreicherung verschwendet werden, wenn die Entität nicht passt. Mehr dazu in der Klassifizierungs-Dokumentation.
Jedes ausgewählte Modell verarbeitet die Entity mit Ihrer gewählten Strategie. Wenn mehrere Modelle ausgewählt sind, laufen sie parallel über die Provider hinweg (Claude und GPT-4 laufen gleichzeitig), während Modelle desselben Providers nacheinander ausgeführt werden, um Rate-Limits einzuhalten.
Jede LLM-Antwort wird in Echtzeit gegen Ihr Schema validiert. Wenn die Ausgabe nicht mit den erwarteten Typen oder Einschränkungen übereinstimmt, sendet das System die Fehler automatisch zur Korrektur an das LLM zurück.
Bis zu 5 automatische Wiederholungsversuche pro LLM-Aufruf. Jeder Wiederholungsversuch enthält den konkreten Validierungsfehler, damit das LLM genau weiß, was zu beheben ist.
Zwei optionale Schalter bitten den Anbieter, die Ausgabe zu beschränken, bevor sie zurückkommt, sodass von vornherein weniger Antworten korrigiert werden müssen. Beide gelten nur für Modelle, die sie unterstützen; alles greift weiterhin auf die oben beschriebene Validierungs- und Wiederholungsschleife zurück.
Entity Enricher nutzt Server-Sent Events (SSE), um den Fortschritt in Echtzeit zu streamen. Sie müssen nicht warten, bis alle Modelle fertig sind – Ergebnisse erscheinen nach und nach, sobald jeder Expertisebereich oder jedes Modell abgeschlossen ist.
Jedes Modell erhält ein eigenes Ergebnisfeld, das die strukturierte JSON-Ausgabe, Fortschrittsabzeichen pro Expertise-Domäne, Token-Verbrauch, Kosten und Verarbeitungszeit anzeigt. Bei Verwendung der Mehrfach-Expertise-Strategie werden die Expertise-Abzeichen in Echtzeit aktualisiert, sobald eine Domäne abgeschlossen ist.
Bei Verwendung der Multi-Expertise-Strategie können einige Expertisen fehlschlagen, während andere erfolgreich sind. Anstatt alles zu verwerfen, gibt Entity Enricher die zusammengeführte Ausgabe der erfolgreichen Expertisen mit dem Status „Teilweise“ zurück. Sie können dann nur die fehlgeschlagenen Expertisen erneut ausführen, ohne das gesamte Enrichment neu durchzuführen.
Nach Abschluss der Anreicherung werden Ihre Ergebnisse zur späteren Verwendung auf der Seite „Datensätze“ gespeichert. Wenn Sie mehrere Modelle verwendet haben, können Sie die Ergebnisse mit Multi-Model Fusion zusammenführen.