O LlamaExtract (do LlamaIndex) extrai dados estruturados dos documentos que você fornece, com base num esquema personalizado, usando um analisador de topo. O Entity Enricher funciona ao contrário: enriquece uma entidade a partir dos melhores LLMs do mundo — além de pesquisa web em tempo real e dos seus documentos — e depois verifica cada campo em vários modelos e resolve conflitos. Sobrepõem-se em “esquema à entrada, JSON estruturado à saída”, mas resolvem metades diferentes do problema.
Responde ao que os seus dados não contêm, utilizando o conhecimento do LLM, a web e os seus documentos como fontes.
Extrai o que já está escrito no documento que carrega. Sem conhecimento externo nem pesquisas na web.
Executa 2 ou mais LLMs em paralelo e arbitra as discordâncias ao nível dos campos, registando o raciocínio.
Uma única passagem de extração por documento. Sem validação entre modelos nem arbitragem.
Os IDs semânticos dão a cada entidade uma chave de junção estável que desduplica ao longo de execuções, modelos e idiomas.
A saída está delimitada ao documento a partir do qual extraiu; a identidade entre documentos é da sua responsabilidade.
O Entity Enricher já processa PDFs, ficheiros Office e imagens de forma nativa — e pode receber o resultado de um parser como entrada.
Um excelente analisador a montante. Utilize-o para preparar documentos difíceis e depois enriqueça o resultado no Entity Enricher.
| Funcionalidade | Entity Enricher | LlamaExtract |
|---|---|---|
| Schema de saída personalizado | ||
| Extração estruturada a partir de documentos | ||
| Enriquecer a partir do conhecimento do mundo do LLM | ||
| Pesquisa web em tempo real como fonte | ||
| Distribuição multi-modelo (2+ LLMs em paralelo) | ||
| Fusão e resolução de conflitos ao nível do campo | ||
| Registo de auditoria de arbitragem | ||
| IDs semânticos (identidade / desduplicação) | ||
| Classificação prévia de entidades | ||
| Saída multilingue (40 idiomas) | ||
| Processamento em lote e progresso por streaming | ||
| Use as suas próprias chaves / modelos self-hosted | Parcial | |
| Interfaces REST API + MCP + n8n / Make | API + SDK | |
| Análise de documentos de topo de gama | Integrado | |
| Modelo de preços | Pagamento por token (BYOK) | Por página / créditos |
Pagamento por token
Use as suas próprias chaves de API de LLM e pague diretamente ao seu fornecedor pelos tokens consumidos. A ingestão de documentos está integrada, pelo que não há uma fatura de análise separada para a maioria dos ficheiros.
Por página / créditos
Medido pelas páginas analisadas e extraídas, nos escalões de créditos do LlamaCloud (com um escalão gratuito para começar). Os custos aumentam com o volume de documentos e o número de páginas, e não com o número de entidades.
Os preços refletem os escalões publicados publicamente e podem mudar — consulte cada fornecedor para saber as tarifas atuais.
Analise documentos e enriqueça a partir do conhecimento do modelo e da web — com arbitragem multimodelo, um registo de auditoria e identidade por ID semântico, tudo num único pipeline.
Começar gratuitamente