Anreicherungsstrategien - Entity Enricher-Dokumentation

Anreicherungsstrategien

Entity Enricher bietet zwei Anreicherungsstrategien, die steuern, wie LLM-Aufrufe orchestriert werden. Die Wahl der richtigen Strategie wirkt sich auf Genauigkeit, Geschwindigkeit und Kosten aus.

Pipeline-Diagramme

Von der einfachsten bis zur leistungsstärksten Konfiguration. Jede baut auf der vorherigen auf.

Einfach

Einzeldurchlauf — 1 Modell

Ein Modell, ein Aufruf. Das gesamte Schema wird in einem einzigen Prompt gesendet. Schnell und günstig – ideal für einfache Schemas oder schnelles Iterieren.

Entität

Aspirin

Beliebige Entität: Unternehmen, Medikament, Rechtsfall, Forschungsarbeit …

Anthropic

Nutzen Sie jeden LLM-Provider mit Ihrem eigenen API-Schlüssel.

AnthropicVollständiges Schema

Vollständiges Schema in einem Aufruf – automatische Wiederholung bei Validierungsfehler.

Angereichertes Ergebnis

Aspirin

Multi-Modell

Einzeldurchlauf — 3 Modelle

Dieselbe Strategie, aber parallel über mehrere Modelle ausgeführt. Die Ergebnisse werden Feld für Feld verglichen und arbitriert, um eine einzige Ausgabe mit hoher Konfidenz zu erzeugen.

Entität

Aspirin

Beliebige Entität: Unternehmen, Medikament, Rechtsfall, Forschungsarbeit …

Pre-flight-Klassifizierung

Abgleich — Pharmaceutical Compound

Erkennt Typkonflikte, bevor LLM-Credits verschwendet werden.

Anthropic
OpenAI
Google Gemini

Bringen Sie Ihre eigenen API-Schlüssel mit — funktioniert mit jedem LLM-Provider.

AnthropicVollständiges Schema
OpenAIVollständiges Schema
GeminiVollständiges Schema

Vollständiges Schema in einem Aufruf – automatische Wiederholung bei Validierungsfehler.

Endgültiges angereichertes Ergebnis

Aspirin

Arbitriert

Eine begründete Konfliktlösung auf Feldebene erzeugt das endgültige, vertrauenswürdige Ergebnis.

Erweitert

Multi-Expertise – 3 Modelle

Das Schema wird nach Fachbereich aufgeteilt. Jedes Modell erhält fokussierte Sub-Prompts für jeden Bereich. Die Ergebnisse werden pro Modell tief zusammengeführt (deep-merged) und anschließend über die Modelle hinweg arbitriert. Maximale Genauigkeit für komplexe Schemas mit mehreren Fachbereichen.

Entität

Aspirin

Beliebige Entität: Unternehmen, Medikament, Rechtsfall, Forschungsarbeit …

Pre-flight-Klassifizierung

Abgleich — Pharmaceutical Compound

Erkennt Typkonflikte, bevor LLM-Credits verschwendet werden.

Anthropic
OpenAI
Google Gemini

Bringen Sie Ihre eigenen API-Schlüssel mit — funktioniert mit jedem LLM-Provider.

Anthropic
PharmakologieLLM-Prompt
RegulatorischLLM-Prompt
OpenAI
PharmakologieLLM-Prompt
RegulatorischLLM-Prompt
Gemini
PharmakologieLLM-Prompt
RegulatorischLLM-Prompt

Schema nach Fachbereich aufgeteilt – selbstkorrigierende Prompts wiederholen bei Validierungsfehler.

Anthropic Ergebnis
OpenAI Ergebnis
Gemini Ergebnis

Deep Merge der Fachgebiet-Antworten pro Modell.

Endgültiges angereichertes Ergebnis

Aspirin

Arbitriert

Eine begründete Konfliktlösung auf Feldebene erzeugt das endgültige, vertrauenswürdige Ergebnis.

Detaillierter Vergleich

AspektEinzeldurchlaufMulti-Expertise
LLM-Aufrufe1 pro ModellN pro Modell (1 pro Fachbereich)
Schema gesendetVollständiges Schema in einem PromptTeilmenge pro Fachgebiet
AusführungSequenziell (ein Aufruf)Parallel (alle Expertisen laufen gleichzeitig)
GenauigkeitGut für einfache SchemasHöher – fokussierte Prompts liefern bessere Ergebnisse
GeschwindigkeitSchneller bei kleinen SchemasParallele Ausführung kann bei großen Schemas schneller sein
KostenGeringer (Overhead eines einzelnen Aufrufs)Höher (mehrere Aufrufe mit Overhead pro Aufruf)
StreamingAlles-oder-nichts-ErgebnisProgressiv – Ergebnisse werden übertragen, sobald jeder Fachbereich abgeschlossen ist
Teilweiser ErfolgNein – der gesamte Aufruf gelingt oder schlägt fehlJa – erfolgreiche Expertisen bleiben erhalten, fehlgeschlagene können wiederholt werden

Wann welche Strategie zu verwenden ist

Einzeldurchlauf verwenden, wenn:

  • Ihr Schema hat weniger als 15–20 Eigenschaften
  • Alle Eigenschaften gehören zu einem einzigen Bereich (z. B. alle Finanzdaten)
  • Sie möchten das schnellste und günstigste Ergebnis, und Genauigkeit ist weniger wichtig
  • Sie testen ein neues Schema und iterieren schnell

Multi-Expertise verwenden, wenn:

  • Ihr Schema umfasst mehrere Fachbereiche (pharmazeutisch, finanziell, geografisch usw.)
  • Sie haben ein komplexes Schema mit über 20 Eigenschaften
  • Genauigkeit ist entscheidend, und Sie möchten fokussierte, spezialisierte Prompts
  • Sie möchten Echtzeit-Fortschritt, während jede Domain abgeschlossen wird
  • Sie benötigen die Handhabung von Teilerfolgen – nur Fehlgeschlagenes wird erneut versucht

Wie Multi-Expertise im Detail funktioniert

Die Multi-Fachbereich-Strategie folgt für jedes Modell einem vierstufigen Prozess:

1
Eigenschaften nach Fachgebiet gruppieren

Das Schema wird rekursiv durchlaufen. Jede Property mit einem Fachbereichs-Tag wird mit anderen desselben Bereichs gruppiert. Zum Beispiel gehen revenue und market_cap in die Gruppe „financial“, während gmp_status in „regulatory“ geht.

2
Fokussierte Unterschemas erstellen

Jede Expertise-Gruppe wird zu einem minimalen Sub-Schema, das nur ihre Eigenschaften enthält. Das bedeutet, dass das LLM einen kleineren, fokussierteren Prompt erhält und nur die Felder ausfüllen muss, auf die es spezialisiert ist.

3
Parallel ausführen

Alle Expertise-Aufrufe laufen gleichzeitig. Ein Schema mit 5 Expertise-Domänen startet 5 LLM-Aufrufe zur selben Zeit. Sobald einer abgeschlossen ist, werden seine Ergebnisse tief in die akkumulierte Ausgabe eingefügt und in Echtzeit an die UI gestreamt.

4
Teilweise Fehler behandeln

Wenn einige Expertisen fehlschlagen, gibt das System die zusammengeführte Ausgabe der erfolgreichen mit dem Status „Teilweise“ zurück. Sie können nur die fehlgeschlagenen Expertisen erneut ausführen, und die neuen Ergebnisse werden in die bestehende Ausgabe eingefügt, ohne die bereits erfolgreiche Arbeit zu wiederholen.

Kombination mit Multi-Modell-Anreicherung

Beide Strategien lassen sich mit der Multi-Modell-Anreicherung kombinieren. Wenn Sie mehrere Modelle auswählen, führt jedes Modell die gewählte Strategie unabhängig aus. Die Ergebnisse können anschließend über die Multi-Modell-Fusion zusammengeführt werden, um eine einzelne Ausgabe mit hoher Zuverlässigkeit zu erzeugen.

Beispiel: Die Verwendung von Multi-Expertise mit 3 Modellen und einem Schema mit 4 Expertisebereichen startet insgesamt 12 LLM-Aufrufe (3 Modelle x 4 Expertisebereiche). Modelle von verschiedenen Providern laufen parallel, während Modelle desselben Providers in eine Warteschlange gestellt werden, um Ratenlimits einzuhalten.