Estratégias de Enriquecimento - Documentação do Entity Enricher

Estratégias de Enriquecimento

O Entity Enricher oferece duas estratégias de enriquecimento que controlam como as chamadas ao LLM são orquestradas. Escolher a estratégia certa afeta a precisão, a velocidade e o custo.

Diagramas de Pipeline

Da configuração mais simples à mais poderosa. Cada uma assenta na anterior.

Simples

Passagem única — 1 modelo

Um modelo, uma chamada. Todo o esquema é enviado num único prompt. Rápido e económico — ideal para esquemas simples ou iteração rápida.

Entity

Aspirin

Qualquer entidade: empresa, medicamento, processo jurídico, artigo científico...

Anthropic

Utilize qualquer provider de LLM com a sua própria chave de API.

AnthropicEsquema completo

Esquema completo numa única chamada — repete automaticamente em caso de falha de validação.

Resultado enriquecido

Aspirin

Multi-modelo

Passagem única — 3 modelos

A mesma estratégia, mas executada em vários modelos em paralelo. Os resultados são comparados e arbitrados campo a campo para produzir um único resultado de elevada confiança.

Entity

Aspirin

Qualquer entidade: empresa, medicamento, processo jurídico, artigo científico...

Classificação prévia

Correspondência — Pharmaceutical Compound

Deteta incompatibilidades de tipo antes de desperdiçar créditos LLM.

Anthropic

OpenAI

Google Gemini

Use as suas próprias chaves de API — funciona com qualquer fornecedor de LLM.

AnthropicEsquema completo

OpenAIEsquema completo

GeminiEsquema completo

Esquema completo numa única chamada — repete automaticamente em caso de falha de validação.

Resultado final enriquecido

Aspirin

Arbitrado

A resolução ponderada de conflitos ao nível do campo produz o resultado final fiável.

Avançado

Multi-especialização — 3 modelos

O esquema é dividido por domínio de especialização. Cada modelo recebe subprompts focados para cada domínio. Os resultados são combinados em profundidade por modelo e, em seguida, arbitrados entre modelos. Precisão máxima para esquemas complexos e multidomínio.

Entity

Aspirin

Qualquer entidade: empresa, medicamento, processo jurídico, artigo científico...

Classificação prévia

Correspondência — Pharmaceutical Compound

Deteta incompatibilidades de tipo antes de desperdiçar créditos LLM.

Anthropic

OpenAI

Google Gemini

Use as suas próprias chaves de API — funciona com qualquer fornecedor de LLM.

Anthropic

FarmacologiaPrompt do LLM

RegulamentarPrompt do LLM

OpenAI

FarmacologiaPrompt do LLM

RegulamentarPrompt do LLM

Gemini

FarmacologiaPrompt do LLM

RegulamentarPrompt do LLM

Esquema dividido por domínio — prompts de autocorreção repetem em caso de falha de validação.

Anthropic Resultado

OpenAI Resultado

Gemini Resultado

Fusão profunda das respostas de especialização por modelo.

Resultado final enriquecido

Aspirin

Arbitrado

A resolução ponderada de conflitos ao nível do campo produz o resultado final fiável.

Comparação Detalhada

Aspeto	Passagem única	Multi-especialização
Chamadas ao LLM	1 por modelo	N por modelo (1 por domínio de especialização)
Esquema Enviado	Esquema completo num único prompt	Subconjunto por domínio de especialização
Execução	Sequencial (uma chamada)	Paralelo (todas as especializações são executadas em simultâneo)
Precisão	Adequado para esquemas simples	Maior — prompts focados produzem melhores resultados
Velocidade	Mais rápido para esquemas pequenos	A execução em paralelo pode ser mais rápida para esquemas grandes
Custo	Menor (sobrecarga de uma única chamada)	Maior (várias chamadas com sobrecarga por chamada)
Streaming	Resultado de tudo ou nada	Progressivo — os resultados são transmitidos à medida que cada especialização é concluída
Sucesso parcial	Não — a chamada inteira tem sucesso ou falha	Sim — as expertises bem-sucedidas são preservadas, as que falharam podem ser repetidas

Quando Utilizar Cada Estratégia

Utilize uma passagem única quando:

•O seu esquema tem menos de 15 a 20 propriedades
•Todas as propriedades pertencem a um único domínio (por exemplo, todos os dados financeiros)
•Quer o resultado mais rápido e mais barato, sendo a precisão menos crítica
•Você está a testar um novo schema e a iterar rapidamente

Utilize várias expertise domains quando:

•O seu esquema abrange vários domínios de especialidade (farmacêutico, financeiro, geográfico, etc.)
•Você tem um schema complexo com mais de 20 propriedades
•A precisão é crítica e pretende prompts focados e especializados
•Quer progresso em tempo real à medida que cada domínio é concluído
•Precisa de tratamento de sucesso parcial — repetir apenas o que falhou

Como Funciona a Multi-Expertise em Detalhe

A estratégia multi-especialização segue um processo de quatro passos para cada modelo:

Agrupar propriedades por especialização

O esquema é percorrido recursivamente. Cada propriedade com uma etiqueta de domínio de especialização é agrupada com outras que partilham o mesmo domínio. Por exemplo, revenue e market_cap vão para o grupo “financeiro”, enquanto gmp_status vai para “regulamentar”.

Crie sub-schemas focados

Cada grupo de especialização torna-se um sub-schema mínimo, contendo apenas as suas propriedades. Isto significa que o LLM recebe um prompt mais pequeno e focado, e só precisa de preencher os campos em que é especializado.

Executar em paralelo

Todas as chamadas de especialização são executadas em simultâneo. Um schema com 5 domínios de especialização lança 5 chamadas de LLM ao mesmo tempo. À medida que cada uma termina, os seus resultados são combinados em profundidade no resultado acumulado e transmitidos para a interface em tempo real.

Lidar com falhas parciais

Se algumas expertise domains falharem, o sistema devolve o output combinado das que tiveram sucesso, com o estado “Parcial”. Pode repetir apenas as expertise domains que falharam, e os novos resultados serão combinados com o output existente sem repetir o trabalho já concluído com sucesso.

Combinar com enriquecimento multimodelo

Ambas as estratégias podem ser combinadas com o enriquecimento multi-modelo. Quando seleciona vários modelos, cada modelo executa a estratégia escolhida de forma independente. Os resultados podem depois ser fundidos através da fusão multi-modelo para produzir uma única saída de alta confiança.

Exemplo: Utilizar multi-especialização com 3 modelos e um esquema que tem 4 domínios de especialização irá lançar 12 chamadas LLM no total (3 modelos x 4 especializações). Os modelos de fornecedores diferentes são executados em paralelo, enquanto os modelos do mesmo fornecedor são colocados em fila para respeitar os limites de taxa.

Fluxo de enriquecimento

Apresentação completa do pipeline

Classificação

Verificação prévia do tipo de entidade

Fusão Multi-Modelo

Combinar resultados de vários modelos

Estratégias de Enriquecimento

Diagramas de Pipeline

Passagem única — 1 modelo

Passagem única — 3 modelos

Multi-especialização — 3 modelos

Comparação Detalhada

Quando Utilizar Cada Estratégia

Utilize uma passagem única quando:

Utilize várias expertise domains quando:

Como Funciona a Multi-Expertise em Detalhe

Combinar com enriquecimento multimodelo

Documentação relacionada