Anreicherungsstrategien - Entity Enricher-Dokumentation

Anreicherungsstrategien

Entity Enricher bietet zwei Anreicherungsstrategien, die steuern, wie LLM-Aufrufe orchestriert werden. Die Wahl der richtigen Strategie wirkt sich auf Genauigkeit, Geschwindigkeit und Kosten aus.

Pipeline-Diagramme

Von der einfachsten bis zur leistungsstärksten Konfiguration. Jede baut auf der vorherigen auf.

Einfach

Einzeldurchlauf — 1 Modell

Ein Modell, ein Aufruf. Das gesamte Schema wird in einem einzigen Prompt gesendet. Schnell und günstig – ideal für einfache Schemas oder schnelles Iterieren.

Entität

Aspirin

Beliebige Entität: Unternehmen, Medikament, Rechtsfall, Forschungsarbeit …

Anthropic

Nutzen Sie jeden LLM-Provider mit Ihrem eigenen API-Schlüssel.

AnthropicVollständiges Schema

Vollständiges Schema in einem Aufruf – automatische Wiederholung bei Validierungsfehler.

Angereichertes Ergebnis

Aspirin

Multi-Modell

Einzeldurchlauf — 3 Modelle

Dieselbe Strategie, aber parallel über mehrere Modelle ausgeführt. Die Ergebnisse werden Feld für Feld verglichen und arbitriert, um eine einzige Ausgabe mit hoher Konfidenz zu erzeugen.

Entität

Aspirin

Beliebige Entität: Unternehmen, Medikament, Rechtsfall, Forschungsarbeit …

Pre-flight-Klassifizierung

Abgleich — Pharmaceutical Compound

Erkennt Typkonflikte, bevor LLM-Credits verschwendet werden.

Anthropic

OpenAI

Google Gemini

Bringen Sie Ihre eigenen API-Schlüssel mit — funktioniert mit jedem LLM-Provider.

AnthropicVollständiges Schema

OpenAIVollständiges Schema

GeminiVollständiges Schema

Vollständiges Schema in einem Aufruf – automatische Wiederholung bei Validierungsfehler.

Endgültiges angereichertes Ergebnis

Aspirin

Arbitriert

Eine begründete Konfliktlösung auf Feldebene erzeugt das endgültige, vertrauenswürdige Ergebnis.

Erweitert

Multi-Expertise – 3 Modelle

Das Schema wird nach Fachbereich aufgeteilt. Jedes Modell erhält fokussierte Sub-Prompts für jeden Bereich. Die Ergebnisse werden pro Modell tief zusammengeführt (deep-merged) und anschließend über die Modelle hinweg arbitriert. Maximale Genauigkeit für komplexe Schemas mit mehreren Fachbereichen.

Entität

Aspirin

Beliebige Entität: Unternehmen, Medikament, Rechtsfall, Forschungsarbeit …

Pre-flight-Klassifizierung

Abgleich — Pharmaceutical Compound

Erkennt Typkonflikte, bevor LLM-Credits verschwendet werden.

Anthropic

OpenAI

Google Gemini

Bringen Sie Ihre eigenen API-Schlüssel mit — funktioniert mit jedem LLM-Provider.

Anthropic

PharmakologieLLM-Prompt

RegulatorischLLM-Prompt

OpenAI

PharmakologieLLM-Prompt

RegulatorischLLM-Prompt

Gemini

PharmakologieLLM-Prompt

RegulatorischLLM-Prompt

Schema nach Fachbereich aufgeteilt – selbstkorrigierende Prompts wiederholen bei Validierungsfehler.

Anthropic Ergebnis

OpenAI Ergebnis

Gemini Ergebnis

Deep Merge der Fachgebiet-Antworten pro Modell.

Endgültiges angereichertes Ergebnis

Aspirin

Arbitriert

Eine begründete Konfliktlösung auf Feldebene erzeugt das endgültige, vertrauenswürdige Ergebnis.

Detaillierter Vergleich

Aspekt	Einzeldurchlauf	Multi-Expertise
LLM-Aufrufe	1 pro Modell	N pro Modell (1 pro Fachbereich)
Schema gesendet	Vollständiges Schema in einem Prompt	Teilmenge pro Fachgebiet
Ausführung	Sequenziell (ein Aufruf)	Parallel (alle Expertisen laufen gleichzeitig)
Genauigkeit	Gut für einfache Schemas	Höher – fokussierte Prompts liefern bessere Ergebnisse
Geschwindigkeit	Schneller bei kleinen Schemas	Parallele Ausführung kann bei großen Schemas schneller sein
Kosten	Geringer (Overhead eines einzelnen Aufrufs)	Höher (mehrere Aufrufe mit Overhead pro Aufruf)
Streaming	Alles-oder-nichts-Ergebnis	Progressiv – Ergebnisse werden übertragen, sobald jeder Fachbereich abgeschlossen ist
Teilweiser Erfolg	Nein – der gesamte Aufruf gelingt oder schlägt fehl	Ja – erfolgreiche Expertisen bleiben erhalten, fehlgeschlagene können wiederholt werden

Wann welche Strategie zu verwenden ist

Einzeldurchlauf verwenden, wenn:

•Ihr Schema hat weniger als 15–20 Eigenschaften
•Alle Eigenschaften gehören zu einem einzigen Bereich (z. B. alle Finanzdaten)
•Sie möchten das schnellste und günstigste Ergebnis, und Genauigkeit ist weniger wichtig
•Sie testen ein neues Schema und iterieren schnell

Multi-Expertise verwenden, wenn:

•Ihr Schema umfasst mehrere Fachbereiche (pharmazeutisch, finanziell, geografisch usw.)
•Sie haben ein komplexes Schema mit über 20 Eigenschaften
•Genauigkeit ist entscheidend, und Sie möchten fokussierte, spezialisierte Prompts
•Sie möchten Echtzeit-Fortschritt, während jede Domain abgeschlossen wird
•Sie benötigen die Handhabung von Teilerfolgen – nur Fehlgeschlagenes wird erneut versucht

Wie Multi-Expertise im Detail funktioniert

Die Multi-Fachbereich-Strategie folgt für jedes Modell einem vierstufigen Prozess:

Eigenschaften nach Fachgebiet gruppieren

Das Schema wird rekursiv durchlaufen. Jede Property mit einem Fachbereichs-Tag wird mit anderen desselben Bereichs gruppiert. Zum Beispiel gehen revenue und market_cap in die Gruppe „financial“, während gmp_status in „regulatory“ geht.

Fokussierte Unterschemas erstellen

Jede Expertise-Gruppe wird zu einem minimalen Sub-Schema, das nur ihre Eigenschaften enthält. Das bedeutet, dass das LLM einen kleineren, fokussierteren Prompt erhält und nur die Felder ausfüllen muss, auf die es spezialisiert ist.

Parallel ausführen

Alle Expertise-Aufrufe laufen gleichzeitig. Ein Schema mit 5 Expertise-Domänen startet 5 LLM-Aufrufe zur selben Zeit. Sobald einer abgeschlossen ist, werden seine Ergebnisse tief in die akkumulierte Ausgabe eingefügt und in Echtzeit an die UI gestreamt.

Teilweise Fehler behandeln

Wenn einige Expertisen fehlschlagen, gibt das System die zusammengeführte Ausgabe der erfolgreichen mit dem Status „Teilweise“ zurück. Sie können nur die fehlgeschlagenen Expertisen erneut ausführen, und die neuen Ergebnisse werden in die bestehende Ausgabe eingefügt, ohne die bereits erfolgreiche Arbeit zu wiederholen.

Kombination mit Multi-Modell-Anreicherung

Beide Strategien lassen sich mit der Multi-Modell-Anreicherung kombinieren. Wenn Sie mehrere Modelle auswählen, führt jedes Modell die gewählte Strategie unabhängig aus. Die Ergebnisse können anschließend über die Multi-Modell-Fusion zusammengeführt werden, um eine einzelne Ausgabe mit hoher Zuverlässigkeit zu erzeugen.

Beispiel: Die Verwendung von Multi-Expertise mit 3 Modellen und einem Schema mit 4 Expertisebereichen startet insgesamt 12 LLM-Aufrufe (3 Modelle x 4 Expertisebereiche). Modelle von verschiedenen Providern laufen parallel, während Modelle desselben Providers in eine Warteschlange gestellt werden, um Ratenlimits einzuhalten.

Anreicherungsablauf

Vollständiger Pipeline-Durchgang

Klassifizierung

Pre-flight-Überprüfung des Entity-Typs

Multi-Modell-Fusion

Ergebnisse aus mehreren Modellen zusammenführen

Anreicherungsstrategien

Pipeline-Diagramme

Einzeldurchlauf — 1 Modell

Einzeldurchlauf — 3 Modelle

Multi-Expertise – 3 Modelle

Detaillierter Vergleich

Wann welche Strategie zu verwenden ist

Einzeldurchlauf verwenden, wenn:

Multi-Expertise verwenden, wenn:

Wie Multi-Expertise im Detail funktioniert

Kombination mit Multi-Modell-Anreicherung

Zugehörige Dokumentation