Strategie di arricchimento - Documentazione di Entity Enricher

Strategie di arricchimento

Entity Enricher offre due strategie di arricchimento che controllano il modo in cui vengono orchestrate le chiamate all'LLM. La scelta della strategia giusta incide su accuratezza, velocità e costo.

Diagrammi di pipeline

Dalla configurazione più semplice a quella più potente. Ciascuna si basa sulla precedente.

Semplice

Passaggio singolo — 1 modello

Un modello, una chiamata. L'intero schema viene inviato in un unico prompt. Veloce ed economico — ideale per schemi semplici o iterazioni rapide.

Entità

Aspirin

Qualsiasi entità: azienda, farmaco, caso legale, articolo di ricerca...

Anthropic

Utilizzate qualsiasi provider LLM con la vostra API key.

AnthropicSchema completo

Schema completo in una sola chiamata — nuovi tentativi automatici in caso di errore di validazione.

Risultato arricchito

Aspirin

Multi-modello

Passaggio singolo — 3 modelli

Stessa strategia, ma eseguita su più modelli in parallelo. I risultati vengono confrontati e arbitrati campo per campo per produrre un unico output ad alta affidabilità.

Entità

Aspirin

Qualsiasi entità: azienda, farmaco, caso legale, articolo di ricerca...

Classification preliminare

Corrispondenza — Pharmaceutical Compound

Intercetta le incongruenze di tipo prima di sprecare crediti LLM.

Anthropic
OpenAI
Google Gemini

Utilizzate le vostre chiavi API — funziona con qualsiasi provider LLM.

AnthropicSchema completo
OpenAISchema completo
GeminiSchema completo

Schema completo in una sola chiamata — nuovi tentativi automatici in caso di errore di validazione.

Risultato arricchito finale

Aspirin

Arbitrato

La risoluzione ragionata dei conflitti a livello di campo produce il risultato finale attendibile.

Avanzate

Multi-competenza — 3 modelli

Lo schema è suddiviso per dominio di competenza. Ogni modello riceve sotto-prompt mirati per ciascun dominio. I risultati vengono uniti in profondità per modello, quindi arbitrati tra i modelli. Massima accuratezza per schemi complessi e multi-dominio.

Entità

Aspirin

Qualsiasi entità: azienda, farmaco, caso legale, articolo di ricerca...

Classification preliminare

Corrispondenza — Pharmaceutical Compound

Intercetta le incongruenze di tipo prima di sprecare crediti LLM.

Anthropic
OpenAI
Google Gemini

Utilizzate le vostre chiavi API — funziona con qualsiasi provider LLM.

Anthropic
FarmacologiaPrompt LLM
NormativoPrompt LLM
OpenAI
FarmacologiaPrompt LLM
NormativoPrompt LLM
Gemini
FarmacologiaPrompt LLM
NormativoPrompt LLM

Schema suddiviso per dominio — i prompt autocorrettivi riprovano in caso di errore di validazione.

Anthropic risultato
OpenAI risultato
Gemini risultato

Unione profonda delle risposte del dominio di competenza per modello.

Risultato arricchito finale

Aspirin

Arbitrato

La risoluzione ragionata dei conflitti a livello di campo produce il risultato finale attendibile.

Confronto dettagliato

AspettoPassaggio singoloMulti-competenza
Chiamate LLM1 per modelloN per modello (1 per dominio di competenza)
Schema inviatoSchema completo in un solo promptSottoinsieme per expertise domain
EsecuzioneSequenziale (una chiamata)Parallelo (tutti i domini di competenza vengono eseguiti simultaneamente)
AccuratezzaIdeale per schemi sempliciSuperiore — i prompt mirati producono risultati migliori
VelocitàPiù veloce per schema di piccole dimensioniL'esecuzione parallela può essere più veloce per schemi di grandi dimensioni
CostoInferiore (overhead di una singola chiamata)Superiore (più chiamate con overhead per chiamata)
StreamingRisultato tutto o nienteProgressivo — i risultati vengono trasmessi man mano che ogni competenza viene completata
Successo parzialeNo — l'intera chiamata riesce o fallisceSì — le expertise riuscite vengono conservate, quelle fallite possono essere riprovate

Quando usare ciascuna strategia

Usate il passaggio singolo quando:

  • Il suo schema ha meno di 15-20 proprietà
  • Tutte le proprietà appartengono a un unico dominio (ad es. tutti i dati finanziari)
  • Desidera il risultato più veloce ed economico e l'accuratezza è meno importante
  • Stai testando un nuovo schema e iterando rapidamente

Usate la multi-expertise domain quando:

  • Il suo schema abbraccia più expertise domain (farmaceutico, finanziario, geografico, ecc.)
  • Disponi di uno schema complesso con oltre 20 proprietà
  • L'accuratezza è fondamentale e desiderate prompt mirati e specializzati
  • Desidera vedere l'avanzamento in tempo reale al completamento di ciascun dominio
  • Ha bisogno di gestione dei successi parziali — riprovare solo ciò che è fallito

Come funziona la multi-competenza nel dettaglio

La strategia multi-competenza segue un processo in quattro fasi per ciascun modello:

1
Raggruppa le proprietà per dominio di competenza

Lo schema viene attraversato ricorsivamente. Ogni proprietà con un tag di dominio di competenza viene raggruppata con le altre che condividono lo stesso dominio. Ad esempio, revenue e market_cap vanno nel gruppo “financial”, mentre gmp_status va in “regulatory”.

2
Crea sotto-schemi mirati

Ogni gruppo di expertise diventa un sotto-schema minimale contenente solo le sue proprietà. Ciò significa che l'LLM riceve un prompt più piccolo e mirato e deve compilare solo i campi in cui è specializzato.

3
Esegui in parallelo

Tutte le chiamate di competenza vengono eseguite in parallelo. Uno schema con 5 domini di competenza avvia 5 chiamate LLM contemporaneamente. Al completamento di ciascuna, i relativi risultati vengono uniti in profondità nell'output accumulato e trasmessi all'interfaccia in tempo reale.

4
Gestire i fallimenti parziali

Se alcuni domini di competenza falliscono, il sistema restituisce l'output unito di quelli riusciti con stato “Parziale”. Può riprovare solo i domini di competenza falliti e i nuovi risultati verranno uniti all'output esistente senza ripetere il lavoro già completato con successo.

Combinazione con l'arricchimento multi-modello

Entrambe le strategie possono essere combinate con l'arricchimento multi-modello. Quando selezionate più modelli, ogni modello esegue la strategia scelta in modo indipendente. I risultati possono poi essere uniti tramite la fusione multi-modello per produrre un unico output ad alta affidabilità.

Esempio: l'uso della multi-competenza con 3 modelli e uno schema che ha 4 domini di competenza avvierà in totale 12 chiamate LLM (3 modelli x 4 competenze). I modelli di provider diversi vengono eseguiti in parallelo, mentre i modelli dello stesso provider vengono messi in coda per rispettare i limiti di frequenza.