Batch-Verarbeitung - Entity Enricher

Batch-Verarbeitung

Reichern Sie bis zu 100 Entitäten parallel an – mit Echtzeit-Fortschrittsverfolgung, Rate-Limiting pro Anbieter, automatischer Multi-Modell-Fusion und Export nach JSON oder Excel. Batch-Verarbeitung macht Entity Enricher vom Einzel-Entitäts-Tool zur produktionsreifen Datenpipeline.

Batch-Verarbeitungspipeline

EINGABE A

JSON-Array einfügen

EINGABE B

Von URL abrufen

EINGABE C

Datei per Drag & Drop

VALIDIEREN & AUSWÄHLEN

Entitätsliste

Entitäten auswählen, gegen Schema validieren, Inline-Bearbeitung

PARALLELE AUSFÜHRUNG

Alle Entitäten gleichzeitig anreichern

Ratenbegrenzung pro Anbieter, SSE-Fortschritt pro Entität, Unterstützung für Abbrechen/Wiederholen

AUTO-FUSION (bei 2+ Modellen)

Ergebnisse pro Entität zusammenführen

Konflikterkennung und -auflösung laufen nach Abschluss jeder Entität automatisch

JSON-EXPORT

Strukturiertes Ergebnis-Array

EXCEL-EXPORT

Arbeitsmappe mit 3 Blättern inkl. Konflikten

Flexible Eingabemethoden

JSON einfügen

Fügen Sie ein JSON-Array von Entitätsobjekten direkt in den Editor ein. Das System erkennt die Array-Struktur automatisch und extrahiert einzelne Entitäten. Der JSON-Editor bietet Syntaxhervorhebung, Validierungsmarkierungen und Zeilennummern.

Von URL abrufen

Geben Sie eine REST-API-URL ein, um Entitäten aus der Ferne abzurufen. Unterstützt Bearer-Token, API-Schlüssel und Basic-Authentifizierung. Das System extrahiert Arrays automatisch aus verschachtelten Antwort-Wrappern (z. B. { results: [...] }).

Drag & Drop

Ziehen Sie eine JSON-Datei direkt auf die Seite. Das Einfüge-Overlay erkennt JSON-Inhalte aus der Zwischenablage oder abgelegten Dateien und lädt Entitäten automatisch.

Fortschrittsverfolgung in Echtzeit

Jeder Batch-Job streamt Fortschrittsereignisse über Server-Sent Events (SSE). Die Oberfläche zeigt:

Jede Entitäts-Ergebniskarte ist einklappbar und zeigt Tabs pro Modell mit der Rohausgabe sowie einen Tab mit dem zusammengeführten Ergebnis, wenn Fusion aktiviert ist. Fehlgeschlagene Entitäten können einzeln wiederholt werden, ohne den gesamten Batch neu auszuführen.

Ratenbegrenzung pro Anbieter

Die Batch-Verarbeitung verwendet nebenläufige Semaphore pro Anbieter, um innerhalb der API-Ratenlimits zu bleiben. Wenn Sie 50 Entitäten mit 3 Modellen anreichern, feuert das System nicht 150 API-Aufrufe auf einmal ab. Stattdessen respektiert es das konfigurierte Ratenlimit jedes Anbieters -- zum Beispiel 5 gleichzeitige Aufrufe an Anthropic, 10 an OpenAI und 3 an eine selbst gehostete Ollama-Instanz.

Ratenlimits sind pro Anbieter in den Einstellungen zur Modellverwaltung konfigurierbar. Das System maximiert den Durchsatz innerhalb Ihrer Limits und verhindert gleichzeitig 429-Fehler.

Exportformate

JSON-Export

Ein strukturiertes JSON-Array mit einem Objekt pro Entität. Enthält die vollständige angereicherte Ausgabe, Metadaten und Fusionsergebnisse. Ideal für die programmatische Nutzung und nachgelagerte Datenpipelines.

[
  {
    "entity": { "name": "..." },
    "enriched": { ... },
    "metadata": {
      "models": [...],
      "cost_usd": 0.012
    }
  }
]

Excel-Export

Eine Arbeitsmappe mit drei Blättern für Analysten und Stakeholder:

  • Ergebnisblatt: Eine Zeile pro Entität mit abgeflachten Anreicherungsfeldern als Spalten.
  • Übersichtsblatt: Batch-Metadaten, Modellkonfiguration, Gesamtkosten und Verarbeitungszeit.
  • Konflikte-Tabellenblatt: Konfliktdetails auf Feldebene mit Arbitrierungsbegründung und Konfidenzwerten.

Abbrechen & Wiederholen

Laufende Batch-Jobs können jederzeit abgebrochen werden. Der Abbruch erfolgt kontrolliert – laufende LLM-Aufrufe werden abgeschlossen (Sie erhalten weiterhin deren Ergebnisse), aber es werden keine neuen Aufrufe gestartet. Bereits abgeschlossene Entitäten behalten ihre Ergebnisse.

Vor dem Start eines Batches liefert das System eine Kostenschätzung auf Basis der ausgewählten Modelle, der Anzahl der Entitäten und der Schema-Komplexität. So können Sie die erwarteten Kosten prüfen, bevor Sie den Lauf starten.

Batch-Anreicherung starten

Laden Sie Ihre Entitätsliste hoch, wählen Sie Modelle aus und reichern Sie bis zu 100 Entitäten parallel an. Exportieren Sie die Ergebnisse als JSON oder Excel mit vollständigen Konfliktberichten.

Kostenlos starten