LLM-Datenextraktion & KI-Datenanreicherung – Funktionen | Entity Enricher

Funktionen

Alles, was Sie für KI-gestützte Entitätsanreicherung brauchen — von der Schema-Generierung bis zum Batch-Export.

Schema-Intelligenz

KI-Schema-Generierung

Fügen Sie ein beliebiges JSON ein. Die KI generiert ein typisiertes Schema mit Fachbereichen, Suchschlüsseln und mehrsprachigen Feldern – mit bis zu 6 Selbstkorrekturversuchen.

Bearbeitung in natürlicher Sprache

Ändern Sie Ihr Schema, indem Sie „add a parent_company reference“ eingeben – die KI wendet die Änderung an und schlägt 5 Verbesserungen vor.

Visueller Schema-Editor

Eigenschaftsbaum mit Drag & Drop, Gruppierung nach Fachdomänen, Inline-Bearbeitung, Tastaturnavigation, Rückgängig/Wiederholen und automatischem Speichern.

8-Regel-Validierung

Typkorrektheit, $ref-Integrität, Zuweisung der Fachdomäne – alles wird automatisch durchgesetzt, sodass sich das LLM selbst korrigiert, bevor Sie Ergebnisse sehen.

Anreicherungs-Engine

Multi-Expertise-Strategie

Das Schema wird nach Fachbereich aufgeteilt (Finanzen, Regulatorik, Allgemeines). Jeder Fachbereich läuft als paralleler LLM-Aufruf für tiefere, spezialisierte Ergebnisse.

Pre-flight-Klassifizierung

Ein günstiges LLM klassifiziert den Entitätstyp vor der Anreicherung und verhindert so Halluzinationen, wenn Entitäten nicht zum Schema passen.

Selbstkorrigierende Ausgabe

Die Modellvalidierung fängt LLM-Eigenheiten zur Laufzeit ab – indizierte Dictionaries werden zu Arrays, String-Nullwerte zu echten Nullwerten, erforderliche Felder lösen Wiederholungen aus.

Mehrsprachige Anreicherung

Anreicherung in 40 Sprachen gleichzeitig. Mehrsprachige Felder werden als Sprach-Dictionaries mit Werten pro Sprache abgebildet.

Mehr erfahren →

Semantic IDs

Stabile, organisationsbezogene IDs, die aus den Schlüsselfeldern eines Objekts vergeben werden, sodass dieselbe Entität über Anreicherungen, Sprachen und Zeit hinweg dedupliziert wird – Entitätsauflösung inklusive.

Mehr erfahren →
Multi-Modell-Fusion

Vergleich nebeneinander

Führen Sie 2+ LLM-Modelle parallel aus. Vergleichen Sie die Ergebnisse Feld für Feld vor dem Zusammenführen.

Konflikterkennung

Typbewusster Vergleich: exakte Übereinstimmung bei Skalaren, pro Sprache bei Mehrsprachigkeit, Mengenvergleich bei Arrays, rekursiv bei Objekten.

Intelligente Auflösung

Regelbasierte Zusammenführung (Mehrheitsentscheid, Median, Vereinigung) oder LLM-Arbitrierung mit Begründung, Konfidenzstufen und vollständigem Audit-Trail.

Batch & Skalierung

Parallele Batch-Verarbeitung

Reichern Sie bis zu 100 Entitäten gleichzeitig an – mit Rate-Limiting pro Anbieter und SSE-Fortschritt in Echtzeit.

URL-Abruf mit Authentifizierung

Rufen Sie Entitäten aus jeder REST-API ab — mit Bearer-, API-Key- oder Basic-Authentifizierung. Extrahiert automatisch Arrays aus Antwort-Wrappern.

Excel-Export

Arbeitsmappe mit drei Blättern: Ergebnisse (eine Zeile pro Entität), Zusammenfassung (Metadaten und Kosten), Konflikte (Details zur Auflösung).

Wiederholen & Abbrechen

Abbrechen mit sauberem Abschluss laufender Vorgänge. Nur fehlgeschlagene Entitäten wiederholen. Kostenschätzung vor dem Start.

Entwicklung & Betrieb

REST API

Programmatischer Zugriff mit OpenAPI-Dokumentation. Organisationsschlüssel mit rollenbasierten Berechtigungen für die Service-zu-Service-Integration.

Kostenanalysen

Zeitreihen-Diagramme, Aufschlüsselung nach Anbieter, Leistungsstatistiken pro Modell. Verfolgen Sie die Ausgaben über alle Vorgänge hinweg.

Mandantenfähigkeit

Isolation der Organisation mit vier Rollen (Admin, Owner, Editor, Operator). Provider-Schlüssel je Org mit Nutzungsverfolgung.