Strategie di arricchimento - Documentazione di Entity Enricher

Strategie di arricchimento

Entity Enricher offre due strategie di arricchimento che controllano il modo in cui vengono orchestrate le chiamate all'LLM. La scelta della strategia giusta incide su accuratezza, velocità e costo.

Diagrammi di pipeline

Dalla configurazione più semplice a quella più potente. Ciascuna si basa sulla precedente.

Semplice

Passaggio singolo — 1 modello

Un modello, una chiamata. L'intero schema viene inviato in un unico prompt. Veloce ed economico — ideale per schemi semplici o iterazioni rapide.

Entità

Aspirin

Qualsiasi entità: azienda, farmaco, caso legale, articolo di ricerca...

Anthropic

Utilizzate qualsiasi provider LLM con la vostra API key.

AnthropicSchema completo

Schema completo in una sola chiamata — nuovi tentativi automatici in caso di errore di validazione.

Risultato arricchito

Aspirin

Multi-modello

Passaggio singolo — 3 modelli

Stessa strategia, ma eseguita su più modelli in parallelo. I risultati vengono confrontati e arbitrati campo per campo per produrre un unico output ad alta affidabilità.

Entità

Aspirin

Qualsiasi entità: azienda, farmaco, caso legale, articolo di ricerca...

Classification preliminare

Corrispondenza — Pharmaceutical Compound

Intercetta le incongruenze di tipo prima di sprecare crediti LLM.

Anthropic

OpenAI

Google Gemini

Utilizzate le vostre chiavi API — funziona con qualsiasi provider LLM.

AnthropicSchema completo

OpenAISchema completo

GeminiSchema completo

Schema completo in una sola chiamata — nuovi tentativi automatici in caso di errore di validazione.

Risultato arricchito finale

Aspirin

Arbitrato

La risoluzione ragionata dei conflitti a livello di campo produce il risultato finale attendibile.

Avanzate

Multi-competenza — 3 modelli

Lo schema è suddiviso per dominio di competenza. Ogni modello riceve sotto-prompt mirati per ciascun dominio. I risultati vengono uniti in profondità per modello, quindi arbitrati tra i modelli. Massima accuratezza per schemi complessi e multi-dominio.

Entità

Aspirin

Qualsiasi entità: azienda, farmaco, caso legale, articolo di ricerca...

Classification preliminare

Corrispondenza — Pharmaceutical Compound

Intercetta le incongruenze di tipo prima di sprecare crediti LLM.

Anthropic

OpenAI

Google Gemini

Utilizzate le vostre chiavi API — funziona con qualsiasi provider LLM.

Anthropic

FarmacologiaPrompt LLM

NormativoPrompt LLM

OpenAI

FarmacologiaPrompt LLM

NormativoPrompt LLM

Gemini

FarmacologiaPrompt LLM

NormativoPrompt LLM

Schema suddiviso per dominio — i prompt autocorrettivi riprovano in caso di errore di validazione.

Anthropic risultato

OpenAI risultato

Gemini risultato

Unione profonda delle risposte del dominio di competenza per modello.

Risultato arricchito finale

Aspirin

Arbitrato

La risoluzione ragionata dei conflitti a livello di campo produce il risultato finale attendibile.

Confronto dettagliato

Aspetto	Passaggio singolo	Multi-competenza
Chiamate LLM	1 per modello	N per modello (1 per dominio di competenza)
Schema inviato	Schema completo in un solo prompt	Sottoinsieme per expertise domain
Esecuzione	Sequenziale (una chiamata)	Parallelo (tutti i domini di competenza vengono eseguiti simultaneamente)
Accuratezza	Ideale per schemi semplici	Superiore — i prompt mirati producono risultati migliori
Velocità	Più veloce per schema di piccole dimensioni	L'esecuzione parallela può essere più veloce per schemi di grandi dimensioni
Costo	Inferiore (overhead di una singola chiamata)	Superiore (più chiamate con overhead per chiamata)
Streaming	Risultato tutto o niente	Progressivo — i risultati vengono trasmessi man mano che ogni competenza viene completata
Successo parziale	No — l'intera chiamata riesce o fallisce	Sì — le expertise riuscite vengono conservate, quelle fallite possono essere riprovate

Quando usare ciascuna strategia

Usate il passaggio singolo quando:

•Il suo schema ha meno di 15-20 proprietà
•Tutte le proprietà appartengono a un unico dominio (ad es. tutti i dati finanziari)
•Desidera il risultato più veloce ed economico e l'accuratezza è meno importante
•Stai testando un nuovo schema e iterando rapidamente

Usate la multi-expertise domain quando:

•Il suo schema abbraccia più expertise domain (farmaceutico, finanziario, geografico, ecc.)
•Disponi di uno schema complesso con oltre 20 proprietà
•L'accuratezza è fondamentale e desiderate prompt mirati e specializzati
•Desidera vedere l'avanzamento in tempo reale al completamento di ciascun dominio
•Ha bisogno di gestione dei successi parziali — riprovare solo ciò che è fallito

Come funziona la multi-competenza nel dettaglio

La strategia multi-competenza segue un processo in quattro fasi per ciascun modello:

Raggruppa le proprietà per dominio di competenza

Lo schema viene attraversato ricorsivamente. Ogni proprietà con un tag di dominio di competenza viene raggruppata con le altre che condividono lo stesso dominio. Ad esempio, revenue e market_cap vanno nel gruppo “financial”, mentre gmp_status va in “regulatory”.

Crea sotto-schemi mirati

Ogni gruppo di expertise diventa un sotto-schema minimale contenente solo le sue proprietà. Ciò significa che l'LLM riceve un prompt più piccolo e mirato e deve compilare solo i campi in cui è specializzato.

Esegui in parallelo

Tutte le chiamate di competenza vengono eseguite in parallelo. Uno schema con 5 domini di competenza avvia 5 chiamate LLM contemporaneamente. Al completamento di ciascuna, i relativi risultati vengono uniti in profondità nell'output accumulato e trasmessi all'interfaccia in tempo reale.

Gestire i fallimenti parziali

Se alcuni domini di competenza falliscono, il sistema restituisce l'output unito di quelli riusciti con stato “Parziale”. Può riprovare solo i domini di competenza falliti e i nuovi risultati verranno uniti all'output esistente senza ripetere il lavoro già completato con successo.

Combinazione con l'arricchimento multi-modello

Entrambe le strategie possono essere combinate con l'arricchimento multi-modello. Quando selezionate più modelli, ogni modello esegue la strategia scelta in modo indipendente. I risultati possono poi essere uniti tramite la fusione multi-modello per produrre un unico output ad alta affidabilità.

Esempio: l'uso della multi-competenza con 3 modelli e uno schema che ha 4 domini di competenza avvierà in totale 12 chiamate LLM (3 modelli x 4 competenze). I modelli di provider diversi vengono eseguiti in parallelo, mentre i modelli dello stesso provider vengono messi in coda per rispettare i limiti di frequenza.

Flusso di arricchimento

Panoramica completa della pipeline

Classification

Verifica preliminare del tipo di entity

Fusione multi-modello

Unisci i risultati di più modelli

Strategie di arricchimento

Diagrammi di pipeline

Passaggio singolo — 1 modello

Passaggio singolo — 3 modelli

Multi-competenza — 3 modelli

Confronto dettagliato

Quando usare ciascuna strategia

Usate il passaggio singolo quando:

Usate la multi-expertise domain quando:

Come funziona la multi-competenza nel dettaglio

Combinazione con l'arricchimento multi-modello

Documentazione correlata