Estrategias de enriquecimiento - Documentación de Entity Enricher

Estrategias de enriquecimiento

Entity Enricher ofrece dos estrategias de enriquecimiento que controlan cómo se orquestan las llamadas al LLM. Elegir la estrategia adecuada afecta a la precisión, la velocidad y el coste.

Diagramas de pipeline

Desde la configuración más simple hasta la más potente. Cada una se basa en la anterior.

Simple

Pasada única — 1 modelo

Un modelo, una llamada. Todo el esquema se envía en un único prompt. Rápido y económico: ideal para esquemas sencillos o iteración rápida.

Entidad

Aspirin

Cualquier entidad: empresa, fármaco, caso legal, artículo de investigación...

Anthropic

Utilice cualquier proveedor LLM con su propia API key.

AnthropicEsquema completo

Esquema completo en una sola llamada: reintenta automáticamente si falla la validación.

Resultado enriquecido

Aspirin

Multimodelo

Pasada única — 3 modelos

La misma estrategia, pero ejecutada en varios modelos en paralelo. Los resultados se comparan y arbitran campo por campo para producir una única salida de alta confianza.

Entidad

Aspirin

Cualquier entidad: empresa, fármaco, caso legal, artículo de investigación...

Clasificación previa

Coincidencia — Pharmaceutical Compound

Detecta incompatibilidades de tipos antes de desperdiciar créditos de LLM.

Anthropic
OpenAI
Google Gemini

Use sus propias claves de API: funciona con cualquier proveedor de LLM.

AnthropicEsquema completo
OpenAIEsquema completo
GeminiEsquema completo

Esquema completo en una sola llamada: reintenta automáticamente si falla la validación.

Resultado final del enrichment

Aspirin

Arbitrado

La resolución razonada de conflictos a nivel de campo produce el resultado final de confianza.

Avanzado

Multiespecialización — 3 modelos

El esquema se divide por dominio de especialización. Cada modelo recibe subprompts enfocados para cada dominio. Los resultados se combinan en profundidad por modelo y luego se arbitran entre modelos. Máxima precisión para esquemas complejos y multidominio.

Entidad

Aspirin

Cualquier entidad: empresa, fármaco, caso legal, artículo de investigación...

Clasificación previa

Coincidencia — Pharmaceutical Compound

Detecta incompatibilidades de tipos antes de desperdiciar créditos de LLM.

Anthropic
OpenAI
Google Gemini

Use sus propias claves de API: funciona con cualquier proveedor de LLM.

Anthropic
FarmacologíaPrompt del LLM
RegulatorioPrompt del LLM
OpenAI
FarmacologíaPrompt del LLM
RegulatorioPrompt del LLM
Gemini
FarmacologíaPrompt del LLM
RegulatorioPrompt del LLM

Esquema dividido por dominio: los prompts con autocorrección se reintentan cuando falla la validación.

Anthropic resultado
OpenAI resultado
Gemini resultado

Fusión profunda de las respuestas del dominio de especialización por modelo.

Resultado final del enrichment

Aspirin

Arbitrado

La resolución razonada de conflictos a nivel de campo produce el resultado final de confianza.

Comparación detallada

AspectoPasada únicaMultiespecialización
Llamadas al LLM1 por modeloN por modelo (1 por dominio de especialización)
Esquema enviadoEsquema completo en un solo promptSubconjunto por dominio de especialización
EjecuciónSecuencial (una llamada)Paralelo (todos los dominios de experiencia se ejecutan simultáneamente)
PrecisiónAdecuado para schemas simplesMayor: los prompts enfocados producen mejores resultados
VelocidadMás rápido para esquemas pequeñosLa ejecución en paralelo puede ser más rápida para esquemas grandes
CostoMenor (sobrecarga de una sola llamada)Mayor (múltiples llamadas con sobrecarga por llamada)
StreamingResultado de todo o nadaProgresivo — los resultados se transmiten a medida que se completa cada experiencia
Éxito parcialNo: la llamada completa se realiza correctamente o fallaSí: las expertises exitosas se conservan y las fallidas se pueden reintentar

Cuándo usar cada estrategia

Utilice Pasada Única cuando:

  • Su esquema tiene menos de 15–20 propiedades
  • Todas las propiedades pertenecen a un único dominio (p. ej., todos los datos financieros)
  • Desea el resultado más rápido y económico y la precisión es menos crítica
  • Está probando un nuevo esquema e iterando rápidamente

Utilice Multiespecialización cuando:

  • Su esquema abarca varios dominios de especialización (farmacéutico, financiero, geográfico, etc.)
  • Tiene un esquema complejo con más de 20 propiedades
  • La precisión es crítica y desea prompts específicos y especializados
  • Desea progreso en tiempo real a medida que se completa cada dominio
  • Necesita gestión de éxito parcial: reintentar solo lo que falló

Cómo funciona la multiespecialización en detalle

La estrategia multiexperiencia sigue un proceso de cuatro pasos para cada modelo:

1
Agrupar propiedades por expertise domain

El esquema se recorre de forma recursiva. Cada propiedad con una etiqueta de dominio de especialización se agrupa con otras que comparten el mismo dominio. Por ejemplo, revenue y market_cap van al grupo «financiero», mientras que gmp_status va a «regulatorio».

2
Cree subesquemas específicos

Cada grupo de especialización se convierte en un subesquema mínimo que contiene solo sus propiedades. Esto significa que el LLM recibe un prompt más pequeño y enfocado, y solo necesita rellenar los campos en los que se especializa.

3
Ejecutar en paralelo

Todas las llamadas de especialización se ejecutan de forma simultánea. Un esquema con 5 dominios de especialización lanzará 5 llamadas al LLM al mismo tiempo. A medida que cada una finaliza, sus resultados se combinan en profundidad con la salida acumulada y se transmiten a la interfaz en tiempo real.

4
Gestionar fallos parciales

Si algunas especializaciones fallan, el sistema devuelve la salida combinada de las exitosas con un estado «Parcial». Puede reintentar solo las especializaciones fallidas, y los nuevos resultados se combinarán con la salida existente sin repetir el trabajo que ya tuvo éxito.

Combinación con el enriquecimiento multimodelo

Ambas estrategias pueden combinarse con el enriquecimiento multimodelo. Cuando selecciona varios modelos, cada modelo ejecuta la estrategia elegida de forma independiente. Los resultados pueden luego fusionarse mediante la fusión multimodelo para producir una única salida de alta confianza.

Ejemplo: Usar multiespecialización con 3 modelos y un esquema que tiene 4 dominios de especialización lanzará 12 llamadas LLM en total (3 modelos x 4 especializaciones). Los modelos de distintos proveedores se ejecutan en paralelo, mientras que los modelos del mismo proveedor se ponen en cola para respetar los límites de tasa.