LlamaExtract (di LlamaIndex) estrae dati strutturati dai documenti che fornisci, in base a uno schema personalizzato, sfruttando un parser di prim'ordine. Entity Enricher funziona nel modo opposto: arricchisce un'entità attingendo ai migliori LLM al mondo — oltre alla ricerca web in tempo reale e ai tuoi documenti — e poi verifica ogni campo confrontando i modelli e risolvendo i conflitti. I due strumenti hanno in comune il principio «schema in ingresso, JSON strutturato in uscita», ma affrontano metà problemi diversi.
Risponde a ciò che i tuoi dati non contengono, utilizzando la conoscenza dell'LLM, il web e i tuoi documenti come fonti.
Estrae ciò che è già scritto nel documento caricato. Nessuna conoscenza esterna o ricerca sul web.
Esegue più LLM in parallelo e arbitra le discordanze a livello di campo, registrando il ragionamento.
Un solo passaggio di estrazione per documento. Nessuna convalida tra modelli né arbitraggio.
Gli ID semantici assegnano a ogni entità una chiave di join stabile che deduplica tra esecuzioni, modelli e lingue.
L'output è limitato al documento da cui è stata effettuata l'estrazione; l'identità tra documenti è a vostro carico.
Entity Enricher acquisisce già nativamente PDF, file Office e immagini, e può accettare come input l'output di un parser.
Un ottimo parser a monte. Usalo per preparare i documenti complessi, poi arricchisci il risultato in Entity Enricher.
| Funzionalità | Entity Enricher | LlamaExtract |
|---|---|---|
| Schema di output personalizzato | ||
| Estrazione strutturata dai documenti | ||
| Arricchisci dalla conoscenza del mondo dell'LLM | ||
| Ricerca web in tempo reale come fonte | ||
| Fan-out multi-modello (2+ LLM in parallelo) | ||
| Fusion a livello di campo e risoluzione dei conflitti | ||
| Traccia di controllo dell'arbitraggio | ||
| ID semantici (identità / deduplicazione) | ||
| Classification preliminare degli entity | ||
| Output multilingua (40 lingue) | ||
| Elaborazione batch e avanzamento in streaming | ||
| Usa le tue chiavi / modelli self-hosted | Parziale | |
| Interfacce REST API + MCP + n8n / Make | API + SDK | |
| Analisi dei documenti al top della categoria | Integrato | |
| Modello di prezzo | Pagamento a token (BYOK) | Per pagina / crediti |
Pagamento a token
Porta le tue chiavi API LLM e paga il tuo provider direttamente per i token consumati. L'acquisizione dei documenti è integrata, quindi per la maggior parte dei file non c'è una fattura di parsing separata.
Per pagina / crediti
Conteggiato in base alle pagine analizzate ed estratte, secondo i piani a crediti di LlamaCloud (con un piano gratuito iniziale). I costi aumentano in base al volume di documenti e al numero di pagine anziché al numero di entità.
I prezzi riflettono le fasce pubblicate ufficialmente e possono variare — verifica le tariffe correnti presso ciascun fornitore.
Analizza documenti e arricchisci dalla conoscenza del modello e dal web — con arbitraggio multi-modello, un audit trail e identità basata su ID semantico, tutto in un'unica pipeline.
Inizia gratis