Elaborazione batch - Entity Enricher

Elaborazione batch

Arricchisca fino a 100 entità in parallelo con monitoraggio dell'avanzamento in tempo reale, limitazione della frequenza per provider, fusione multi-modello automatica ed esportazione in JSON o Excel. L'elaborazione in batch trasforma Entity Enricher da strumento per singola entità a pipeline di dati di livello produttivo.

Pipeline di elaborazione batch

INPUT A

Incolla array JSON

INPUT B

Recupera da URL

INPUT C

Trascina e rilascia il file

CONVALIDA E SELEZIONA

Elenco delle entità

Seleziona le entità, convalida rispetto allo schema, modifica in linea

ESECUZIONE PARALLELA

Arricchisci tutte le entità simultaneamente

Limitazione della frequenza per provider, avanzamento SSE per entità, supporto per annullamento/ripetizione

FUSIONE AUTOMATICA (se 2+ modelli)

Unisci i risultati per entità

Il rilevamento e la risoluzione dei conflitti vengono eseguiti automaticamente al completamento di ogni entity

ESPORTAZIONE JSON

Array di risultati strutturato

ESPORTAZIONE EXCEL

Cartella di lavoro a 3 fogli con conflitti

Metodi di inserimento flessibili

Incolla JSON

Incolla un array JSON di oggetti entità direttamente nell'editor. Il sistema rileva automaticamente la struttura dell'array ed estrae le singole entità. L'editor JSON offre evidenziazione della sintassi, indicatori di convalida e numeri di riga.

Recupera da URL

Inserire un URL di un'API REST per recuperare le entità da remoto. Supporta l'autenticazione con bearer token, chiave API e basic. Il sistema estrae automaticamente gli array dai wrapper di risposta annidati (ad es. { results: [...] }).

Trascina e rilascia

Trascinare un file JSON direttamente sulla pagina. L'overlay di incollaggio rileva il contenuto JSON dagli appunti o dai file rilasciati e carica automaticamente le entità.

Monitoraggio dell'avanzamento in tempo reale

Ogni processo batch trasmette gli eventi di avanzamento tramite Server-Sent Events (SSE). L'interfaccia mostra:

Ogni scheda dei risultati delle entity è comprimibile e mostra schede per modello con l'output grezzo e una scheda con il risultato unito quando la fusion è abilitata. Le entity non riuscite possono essere ritentate singolarmente senza rieseguire l'intero batch.

Limitazione della frequenza per provider

L'elaborazione batch utilizza semafori concorrenti per ciascun provider per rimanere entro i limiti di frequenza delle API. Se state arricchendo 50 entità con 3 modelli, il sistema non invia 150 chiamate API contemporaneamente. Rispetta invece il limite di frequenza configurato per ciascun provider -- ad esempio, 5 chiamate concorrenti ad Anthropic, 10 a OpenAI e 3 a un'istanza Ollama self-hosted.

I limiti di frequenza sono configurabili per ogni provider nelle impostazioni di gestione dei modelli. Il sistema massimizza il throughput entro i limiti impostati, prevenendo gli errori 429.

Formati di esportazione

Esportazione JSON

Un array JSON strutturato con un oggetto per entità. Include l'output arricchito completo, i metadati e i risultati della fusione. Ideale per il consumo programmatico e le pipeline di dati a valle.

[
  {
    "entity": { "name": "..." },
    "enriched": { ... },
    "metadata": {
      "models": [...],
      "cost_usd": 0.012
    }
  }
]

Esportazione Excel

Una cartella di lavoro a tre fogli progettata per analisti e stakeholder:

  • Foglio dei risultati: Una riga per ogni entity con i campi di enrichment appiattiti come colonne.
  • Foglio di riepilogo: Metadati del batch, configurazione del modello, costo totale e tempo di elaborazione.
  • Foglio dei conflitti: dettagli dei conflitti a livello di campo con motivazione dell'arbitraggio e punteggi di confidenza.

Annulla e riprova

I batch job in esecuzione possono essere annullati in qualsiasi momento. L'annullamento è graduale: le chiamate LLM in corso vengono completate (ne ottieni comunque i risultati), ma non ne vengono avviate di nuove. Le entità già completate mantengono i loro risultati.

Prima di avviare un batch, il sistema fornisce una stima dei costi basata sui modelli selezionati, sul numero di entità e sulla complessità dello schema. Questo vi consente di convalidare il costo previsto prima di impegnarvi nell'esecuzione.

Avvia arricchimento batch

Caricate il vostro elenco di entità, selezionate i modelli ed effettuate l'enrichment di un massimo di 100 entità in parallelo. Esportate i risultati come JSON o Excel con report completi sui conflitti.

Inizia gratis