Enriquecimiento y fusión multimodelo - Entity Enricher

Enriquecimiento y fusión multimodelo

Ejecute varios modelos de IA en paralelo sobre la misma entidad, detecte conflictos a nivel de campo entre sus resultados y fusione los resultados en un único registro de alta confianza. Este es el diferenciador principal de Entity Enricher: en lugar de confiar en un solo LLM, realiza una validación cruzada entre proveedores para lograr la máxima precisión de los datos.

Cómo funciona el enriquecimiento multimodelo

ENTRADA

Datos de la entidad + esquema

Claude

Enriquece de forma independiente

GPT-4

Enriquece de forma independiente

Gemini

Enriquece de forma independiente

DETECCIÓN DE CONFLICTOS

Comparación campo por campo entre todas las salidas de los modelos

OPCIÓN A

Combinación basada en reglas

Voto mayoritario, mediana, unión

OPCIÓN B

Arbitraje por LLM

La IA resuelve con razonamiento

SALIDA FUSIONADA

Un único registro de alta confianza con traza de auditoría

Ejecución de modelos en paralelo

Cuando selecciona varios models para un trabajo de enrichment, Entity Enricher envía los mismos datos de la entity y el schema a cada model simultáneamente. Cada model se ejecuta de forma independiente sin conocimiento de las salidas de los demás models, lo que garantiza datos verdaderamente independientes.

El sistema admite cualquier combinación de proveedores: Anthropic Claude, OpenAI GPT-4, Google Gemini, Mistral o modelos autoalojados mediante Ollama. La limitación de tasa por proveedor garantiza que se mantenga dentro de los límites de API de cada proveedor a la vez que maximiza el rendimiento.

El streaming SSE en tiempo real muestra el progreso a medida que cada modelo se completa, incluido el progreso por dominio de experiencia cuando se usa la estrategia multiexperiencia. Puede ver resultados parciales antes de que todos los modelos terminen.

Detección de conflictos según el tipo

Una vez que todos los modelos finalizan, el motor de detección de conflictos compara sus salidas campo por campo. La comparación tiene en cuenta el tipo: los distintos tipos de campo usan reglas de comparación diferentes:

Tipo de campoMétodo de comparaciónRegla de concordancia
Cadena / EscalarCoincidencia exacta (normalizada)Todos los valores deben ser iguales tras la normalización de mayúsculas/espacios en blanco
NúmeroCoincidencia numérica exactaTodos los valores deben ser números idénticos
BooleanoCoincidencia exactaTodos los modelos deben coincidir en verdadero/falso
MultilingüeComparación por idiomaCada clave de idioma se compara de forma independiente
ArrayComparación de conjuntos (se ignora el orden)Los mismos elementos independientemente del orden
ObjetoRecursivo por propiedadTodos los campos anidados deben coincidir
Valores nullnull == ausenteNull y ausente se tratan como equivalentes

Métodos de resolución de conflictos

Combinación basada en reglas

Resolución determinista mediante reglas de votación. Rápida, predecible y sin necesidad de una llamada adicional al LLM.

  • Cadenas: Voto mayoritario. Los empates se resuelven por el valor más largo (más detalle es mejor).
  • Números: Valor mediano. Resistente a los valores atípicos de cualquier modelo individual.
  • Booleanos: Voto por mayoría. True gana en los empates (conservador).
  • Arrays: Unión de todos los elementos. Conserva toda la información.
  • Objetos: Aplicación recursiva de las reglas anteriores campo por campo.
  • Null: Se prefieren los valores no nulos. La falta de datos es peor que cualquier valor.

Arbitraje por LLM

Un modelo de arbitraje revisa cada conflicto con el contexto de la entidad y las descripciones de los campos, y luego toma una decisión estructurada.

  • Razonamiento: Cada decisión incluye una explicación en lenguaje natural de por qué se eligió un valor.
  • Confianza: Puntuación de confianza alta, media o baja por decisión.
  • Valor elegido: El arbitrador selecciona entre las salidas de modelo disponibles o sintetiza una respuesta mejor.
  • Respaldo: Si el arbitraje falla, el sistema recurre automáticamente a la combinación basada en reglas.

Registro de auditoría completo

Cada registro fusionado incluye metadatos de arbitraje con procedencia completa:

Estos metadatos se almacenan junto al registro fusionado y se exportan en la hoja de conflictos de Excel, lo que los hace adecuados para flujos de trabajo de cumplimiento en los que importa la procedencia de las decisiones.

Cuándo importa más el enrichment con múltiples models

Datos críticos

Diligencia debida financiera, perfiles de seguridad farmacéutica y controles de cumplimiento donde los errores tienen consecuencias materiales.

Hechos en disputa

Entidades con información contradictoria entre fuentes -- importes de financiación, fechas de fundación o estados regulatorios que las distintas fuentes informan de forma diferente.

Lagunas de cobertura

Cuando ningún model tiene conocimiento completo. Los distintos LLM se entrenan con datos diferentes, por lo que ejecutar varios models cubre las lagunas.

Requisitos de confianza

Cuando los consumidores posteriores necesitan puntuaciones de confianza y procedencia para cada dato, no solo los valores finales.

Pruebe el enriquecimiento multimodelo

Seleccione 2 o más modelos, ejecútelos en paralelo y observe cómo la fusión resuelve los conflictos. Sin compromiso mensual: use sus propias claves de API y pague por token.

Empiece gratis