Estrategias de enriquecimiento - Documentación de Entity Enricher

Estrategias de enriquecimiento

Entity Enricher ofrece dos estrategias de enriquecimiento que controlan cómo se orquestan las llamadas al LLM. Elegir la estrategia adecuada afecta a la precisión, la velocidad y el coste.

Diagramas de pipeline

Desde la configuración más simple hasta la más potente. Cada una se basa en la anterior.

Simple

Pasada única — 1 modelo

Un modelo, una llamada. Todo el esquema se envía en un único prompt. Rápido y económico: ideal para esquemas sencillos o iteración rápida.

Entidad

Aspirin

Cualquier entidad: empresa, fármaco, caso legal, artículo de investigación...

Anthropic

Utilice cualquier proveedor LLM con su propia API key.

AnthropicEsquema completo

Esquema completo en una sola llamada: reintenta automáticamente si falla la validación.

Resultado enriquecido

Aspirin

Multimodelo

Pasada única — 3 modelos

La misma estrategia, pero ejecutada en varios modelos en paralelo. Los resultados se comparan y arbitran campo por campo para producir una única salida de alta confianza.

Entidad

Aspirin

Cualquier entidad: empresa, fármaco, caso legal, artículo de investigación...

Clasificación previa

Coincidencia — Pharmaceutical Compound

Detecta incompatibilidades de tipos antes de desperdiciar créditos de LLM.

Anthropic

OpenAI

Google Gemini

Use sus propias claves de API: funciona con cualquier proveedor de LLM.

AnthropicEsquema completo

OpenAIEsquema completo

GeminiEsquema completo

Esquema completo en una sola llamada: reintenta automáticamente si falla la validación.

Resultado final del enrichment

Aspirin

Arbitrado

La resolución razonada de conflictos a nivel de campo produce el resultado final de confianza.

Avanzado

Multiespecialización — 3 modelos

El esquema se divide por dominio de especialización. Cada modelo recibe subprompts enfocados para cada dominio. Los resultados se combinan en profundidad por modelo y luego se arbitran entre modelos. Máxima precisión para esquemas complejos y multidominio.

Entidad

Aspirin

Cualquier entidad: empresa, fármaco, caso legal, artículo de investigación...

Clasificación previa

Coincidencia — Pharmaceutical Compound

Detecta incompatibilidades de tipos antes de desperdiciar créditos de LLM.

Anthropic

OpenAI

Google Gemini

Use sus propias claves de API: funciona con cualquier proveedor de LLM.

Anthropic

FarmacologíaPrompt del LLM

RegulatorioPrompt del LLM

OpenAI

FarmacologíaPrompt del LLM

RegulatorioPrompt del LLM

Gemini

FarmacologíaPrompt del LLM

RegulatorioPrompt del LLM

Esquema dividido por dominio: los prompts con autocorrección se reintentan cuando falla la validación.

Anthropic resultado

OpenAI resultado

Gemini resultado

Fusión profunda de las respuestas del dominio de especialización por modelo.

Resultado final del enrichment

Aspirin

Arbitrado

La resolución razonada de conflictos a nivel de campo produce el resultado final de confianza.

Comparación detallada

Aspecto	Pasada única	Multiespecialización
Llamadas al LLM	1 por modelo	N por modelo (1 por dominio de especialización)
Esquema enviado	Esquema completo en un solo prompt	Subconjunto por dominio de especialización
Ejecución	Secuencial (una llamada)	Paralelo (todos los dominios de experiencia se ejecutan simultáneamente)
Precisión	Adecuado para schemas simples	Mayor: los prompts enfocados producen mejores resultados
Velocidad	Más rápido para esquemas pequeños	La ejecución en paralelo puede ser más rápida para esquemas grandes
Costo	Menor (sobrecarga de una sola llamada)	Mayor (múltiples llamadas con sobrecarga por llamada)
Streaming	Resultado de todo o nada	Progresivo — los resultados se transmiten a medida que se completa cada experiencia
Éxito parcial	No: la llamada completa se realiza correctamente o falla	Sí: las expertises exitosas se conservan y las fallidas se pueden reintentar

Cuándo usar cada estrategia

Utilice Pasada Única cuando:

•Su esquema tiene menos de 15–20 propiedades
•Todas las propiedades pertenecen a un único dominio (p. ej., todos los datos financieros)
•Desea el resultado más rápido y económico y la precisión es menos crítica
•Está probando un nuevo esquema e iterando rápidamente

Utilice Multiespecialización cuando:

•Su esquema abarca varios dominios de especialización (farmacéutico, financiero, geográfico, etc.)
•Tiene un esquema complejo con más de 20 propiedades
•La precisión es crítica y desea prompts específicos y especializados
•Desea progreso en tiempo real a medida que se completa cada dominio
•Necesita gestión de éxito parcial: reintentar solo lo que falló

Cómo funciona la multiespecialización en detalle

La estrategia multiexperiencia sigue un proceso de cuatro pasos para cada modelo:

Agrupar propiedades por expertise domain

El esquema se recorre de forma recursiva. Cada propiedad con una etiqueta de dominio de especialización se agrupa con otras que comparten el mismo dominio. Por ejemplo, revenue y market_cap van al grupo «financiero», mientras que gmp_status va a «regulatorio».

Cree subesquemas específicos

Cada grupo de especialización se convierte en un subesquema mínimo que contiene solo sus propiedades. Esto significa que el LLM recibe un prompt más pequeño y enfocado, y solo necesita rellenar los campos en los que se especializa.

Ejecutar en paralelo

Todas las llamadas de especialización se ejecutan de forma simultánea. Un esquema con 5 dominios de especialización lanzará 5 llamadas al LLM al mismo tiempo. A medida que cada una finaliza, sus resultados se combinan en profundidad con la salida acumulada y se transmiten a la interfaz en tiempo real.

Gestionar fallos parciales

Si algunas especializaciones fallan, el sistema devuelve la salida combinada de las exitosas con un estado «Parcial». Puede reintentar solo las especializaciones fallidas, y los nuevos resultados se combinarán con la salida existente sin repetir el trabajo que ya tuvo éxito.

Combinación con el enriquecimiento multimodelo

Ambas estrategias pueden combinarse con el enriquecimiento multimodelo. Cuando selecciona varios modelos, cada modelo ejecuta la estrategia elegida de forma independiente. Los resultados pueden luego fusionarse mediante la fusión multimodelo para producir una única salida de alta confianza.

Ejemplo: Usar multiespecialización con 3 modelos y un esquema que tiene 4 dominios de especialización lanzará 12 llamadas LLM en total (3 modelos x 4 especializaciones). Los modelos de distintos proveedores se ejecutan en paralelo, mientras que los modelos del mismo proveedor se ponen en cola para respetar los límites de tasa.

Flujo de enriquecimiento

Recorrido completo del pipeline

Clasificación

Verificación previa del tipo de entidad

Fusión multimodelo

Fusionar resultados de varios modelos

Estrategias de enriquecimiento

Diagramas de pipeline

Pasada única — 1 modelo

Pasada única — 3 modelos

Multiespecialización — 3 modelos

Comparación detallada

Cuándo usar cada estrategia

Utilice Pasada Única cuando:

Utilice Multiespecialización cuando:

Cómo funciona la multiespecialización en detalle

Combinación con el enriquecimiento multimodelo

Documentación relacionada