Enriquecimento e fusão multi-modelo - Entity Enricher

Enriquecimento e fusão multi-modelo

Execute vários modelos de IA em paralelo sobre a mesma entidade, detete conflitos ao nível dos campos entre os respetivos resultados e funda-os num único registo de elevada confiança. Este é o principal diferenciador do Entity Enricher: em vez de confiar num único LLM, valida de forma cruzada entre fornecedores para máxima exatidão dos dados.

Como Funciona o Enrichment Multimodelo

ENTRADA

Dados da Entity + Schema

Claude

Enriquece de forma independente

GPT-4

Enriquece de forma independente

Gemini

Enriquece de forma independente

DETEÇÃO DE CONFLITOS

Comparação campo a campo em todos os resultados dos modelos

OPÇÃO A

Combinação baseada em regras

Voto maioritário, mediana, união

OPÇÃO B

Arbitragem por LLM

A IA resolve com raciocínio

SAÍDA FUNDIDA

Um único registo de elevada confiança com trilho de auditoria

Execução de modelos em paralelo

Quando seleciona vários modelos para um trabalho de enrichment, o Entity Enricher envia os mesmos dados da entity e o mesmo schema para cada modelo em simultâneo. Cada modelo é executado de forma independente, sem conhecimento dos resultados dos outros modelos, garantindo pontos de dados verdadeiramente independentes.

O sistema suporta qualquer combinação de fornecedores -- Anthropic Claude, OpenAI GPT-4, Google Gemini, Mistral ou modelos auto-hospedados através de Ollama. A limitação de taxa por fornecedor garante que se mantém dentro dos limites da API de cada fornecedor, maximizando ao mesmo tempo o débito.

O streaming SSE em tempo real mostra o progresso à medida que cada model termina, incluindo o progresso por expertise ao usar a estratégia de multi-expertise. Pode ver resultados parciais antes de todos os modelos terminarem.

Deteção de conflitos sensível ao tipo

Depois de todos os modelos concluírem, o motor de deteção de conflitos compara os respetivos resultados campo a campo. A comparação tem em conta o tipo -- diferentes tipos de campo usam regras de comparação diferentes:

Tipo de campoMétodo de comparaçãoRegra de concordância
String / EscalarCorrespondência exata (normalizada)Todos os valores têm de ser iguais após normalização de maiúsculas/espaços
NúmeroCorrespondência numérica exataTodos os valores devem ser números idênticos
BooleanoCorrespondência exataTodos os modelos têm de concordar em verdadeiro/falso
MultilingueComparação por idiomaCada chave de idioma comparada de forma independente
ArrayComparação de conjuntos (ordem ignorada)Os mesmos itens independentemente da ordem
ObjetoRecursivo por propriedadeTodos os campos aninhados têm de corresponder
Valores nullnull == ausenteNull e ausente são tratados como equivalentes

Métodos de resolução de conflitos

Combinação baseada em regras

Resolução determinística com regras de votação. Rápida, previsível e sem necessidade de uma chamada LLM adicional.

  • Strings: Voto maioritário. Empates resolvidos pelo valor mais longo (mais detalhe é melhor).
  • Números: Valor mediano. Robusto a valores atípicos de qualquer modelo individual.
  • Booleanos: Voto maioritário. True vence em caso de empate (conservador).
  • Arrays: União de todos os itens. Preserva toda a informação.
  • Objetos: Aplicação recursiva, campo a campo, das regras acima.
  • Null: Preferem-se valores não nulos. Dados em falta são piores do que qualquer valor.

Arbitragem por LLM

Um modelo de arbitragem analisa cada conflito com o contexto da entidade e as descrições dos campos e, em seguida, toma uma decisão estruturada.

  • Raciocínio: Cada decisão inclui uma explicação em linguagem natural do motivo pelo qual um valor foi escolhido.
  • Confiança: Pontuação de confiança alta, média ou baixa por decisão.
  • Valor escolhido: O arbitrador seleciona a partir dos resultados disponíveis dos modelos ou sintetiza uma resposta melhor.
  • Alternativa: Se a arbitragem falhar, o sistema recorre automaticamente à fusão baseada em regras.

Registo de auditoria completo

Cada registo fundido inclui metadados de arbitragem com proveniência completa:

Estes metadados são armazenados juntamente com o registo fundido e exportados na folha de conflitos do Excel, tornando-os adequados para fluxos de trabalho de conformidade em que a proveniência das decisões é importante.

Quando o Enrichment Multimodelo Mais Importa

Dados críticos

Due diligence financeira, perfis de segurança farmacêutica e verificação de conformidade em que os erros têm consequências materiais.

Factos contestados

Entities com informação conflituosa entre fontes -- montantes de financiamento, datas de fundação ou estatutos regulatórios que diferentes fontes reportam de forma distinta.

Lacunas de cobertura

Quando nenhum modelo isolado tem conhecimento completo. Diferentes LLMs são treinados com dados diferentes, pelo que executar vários modelos preenche lacunas.

Requisitos de confiança

Quando os consumidores a jusante precisam de pontuações de confiança e proveniência para cada ponto de dados, e não apenas dos valores finais.

Experimente o Enriquecimento Multimodelo

Selecione 2+ modelos, execute-os em paralelo e veja como a fusão resolve os conflitos. Sem compromisso mensal -- traga as suas próprias chaves de API e pague por token.

Começar gratuitamente