Estratégias de Enriquecimento - Documentação do Entity Enricher

Estratégias de Enriquecimento

O Entity Enricher oferece duas estratégias de enriquecimento que controlam como as chamadas ao LLM são orquestradas. Escolher a estratégia certa afeta a precisão, a velocidade e o custo.

Diagramas de Pipeline

Da configuração mais simples à mais poderosa. Cada uma assenta na anterior.

Simples

Passagem única — 1 modelo

Um modelo, uma chamada. Todo o esquema é enviado num único prompt. Rápido e económico — ideal para esquemas simples ou iteração rápida.

Entity

Aspirin

Qualquer entidade: empresa, medicamento, processo jurídico, artigo científico...

Anthropic

Utilize qualquer provider de LLM com a sua própria chave de API.

AnthropicEsquema completo

Esquema completo numa única chamada — repete automaticamente em caso de falha de validação.

Resultado enriquecido

Aspirin

Multi-modelo

Passagem única — 3 modelos

A mesma estratégia, mas executada em vários modelos em paralelo. Os resultados são comparados e arbitrados campo a campo para produzir um único resultado de elevada confiança.

Entity

Aspirin

Qualquer entidade: empresa, medicamento, processo jurídico, artigo científico...

Classificação prévia

Correspondência — Pharmaceutical Compound

Deteta incompatibilidades de tipo antes de desperdiçar créditos LLM.

Anthropic
OpenAI
Google Gemini

Use as suas próprias chaves de API — funciona com qualquer fornecedor de LLM.

AnthropicEsquema completo
OpenAIEsquema completo
GeminiEsquema completo

Esquema completo numa única chamada — repete automaticamente em caso de falha de validação.

Resultado final enriquecido

Aspirin

Arbitrado

A resolução ponderada de conflitos ao nível do campo produz o resultado final fiável.

Avançado

Multi-especialização — 3 modelos

O esquema é dividido por domínio de especialização. Cada modelo recebe subprompts focados para cada domínio. Os resultados são combinados em profundidade por modelo e, em seguida, arbitrados entre modelos. Precisão máxima para esquemas complexos e multidomínio.

Entity

Aspirin

Qualquer entidade: empresa, medicamento, processo jurídico, artigo científico...

Classificação prévia

Correspondência — Pharmaceutical Compound

Deteta incompatibilidades de tipo antes de desperdiçar créditos LLM.

Anthropic
OpenAI
Google Gemini

Use as suas próprias chaves de API — funciona com qualquer fornecedor de LLM.

Anthropic
FarmacologiaPrompt do LLM
RegulamentarPrompt do LLM
OpenAI
FarmacologiaPrompt do LLM
RegulamentarPrompt do LLM
Gemini
FarmacologiaPrompt do LLM
RegulamentarPrompt do LLM

Esquema dividido por domínio — prompts de autocorreção repetem em caso de falha de validação.

Anthropic Resultado
OpenAI Resultado
Gemini Resultado

Fusão profunda das respostas de especialização por modelo.

Resultado final enriquecido

Aspirin

Arbitrado

A resolução ponderada de conflitos ao nível do campo produz o resultado final fiável.

Comparação Detalhada

AspetoPassagem únicaMulti-especialização
Chamadas ao LLM1 por modeloN por modelo (1 por domínio de especialização)
Esquema EnviadoEsquema completo num único promptSubconjunto por domínio de especialização
ExecuçãoSequencial (uma chamada)Paralelo (todas as especializações são executadas em simultâneo)
PrecisãoAdequado para esquemas simplesMaior — prompts focados produzem melhores resultados
VelocidadeMais rápido para esquemas pequenosA execução em paralelo pode ser mais rápida para esquemas grandes
CustoMenor (sobrecarga de uma única chamada)Maior (várias chamadas com sobrecarga por chamada)
StreamingResultado de tudo ou nadaProgressivo — os resultados são transmitidos à medida que cada especialização é concluída
Sucesso parcialNão — a chamada inteira tem sucesso ou falhaSim — as expertises bem-sucedidas são preservadas, as que falharam podem ser repetidas

Quando Utilizar Cada Estratégia

Utilize uma passagem única quando:

  • O seu esquema tem menos de 15 a 20 propriedades
  • Todas as propriedades pertencem a um único domínio (por exemplo, todos os dados financeiros)
  • Quer o resultado mais rápido e mais barato, sendo a precisão menos crítica
  • Você está a testar um novo schema e a iterar rapidamente

Utilize várias expertise domains quando:

  • O seu esquema abrange vários domínios de especialidade (farmacêutico, financeiro, geográfico, etc.)
  • Você tem um schema complexo com mais de 20 propriedades
  • A precisão é crítica e pretende prompts focados e especializados
  • Quer progresso em tempo real à medida que cada domínio é concluído
  • Precisa de tratamento de sucesso parcial — repetir apenas o que falhou

Como Funciona a Multi-Expertise em Detalhe

A estratégia multi-especialização segue um processo de quatro passos para cada modelo:

1
Agrupar propriedades por especialização

O esquema é percorrido recursivamente. Cada propriedade com uma etiqueta de domínio de especialização é agrupada com outras que partilham o mesmo domínio. Por exemplo, revenue e market_cap vão para o grupo “financeiro”, enquanto gmp_status vai para “regulamentar”.

2
Crie sub-schemas focados

Cada grupo de especialização torna-se um sub-schema mínimo, contendo apenas as suas propriedades. Isto significa que o LLM recebe um prompt mais pequeno e focado, e só precisa de preencher os campos em que é especializado.

3
Executar em paralelo

Todas as chamadas de especialização são executadas em simultâneo. Um schema com 5 domínios de especialização lança 5 chamadas de LLM ao mesmo tempo. À medida que cada uma termina, os seus resultados são combinados em profundidade no resultado acumulado e transmitidos para a interface em tempo real.

4
Lidar com falhas parciais

Se algumas expertise domains falharem, o sistema devolve o output combinado das que tiveram sucesso, com o estado “Parcial”. Pode repetir apenas as expertise domains que falharam, e os novos resultados serão combinados com o output existente sem repetir o trabalho já concluído com sucesso.

Combinar com enriquecimento multimodelo

Ambas as estratégias podem ser combinadas com o enriquecimento multi-modelo. Quando seleciona vários modelos, cada modelo executa a estratégia escolhida de forma independente. Os resultados podem depois ser fundidos através da fusão multi-modelo para produzir uma única saída de alta confiança.

Exemplo: Utilizar multi-especialização com 3 modelos e um esquema que tem 4 domínios de especialização irá lançar 12 chamadas LLM no total (3 modelos x 4 especializações). Os modelos de fornecedores diferentes são executados em paralelo, enquanto os modelos do mesmo fornecedor são colocados em fila para respeitar os limites de taxa.