La clasificación previa verifica que una entidad coincide con el tipo de esquema esperado antes de que comience el enriquecimiento. Este paso opcional evita alucinaciones y el desperdicio de tokens cuando las entidades no coinciden con su esquema.
Los LLM están deseosos de ayudar. Cuando se les pide enriquecer una entidad según un esquema, generan una salida estructurada incluso si la entidad no coincide en absoluto con el tipo del esquema. Esto da lugar a datos alucinados que parecen plausibles pero son totalmente erróneos.
Esquema: «Planeta» — Entidad: «Titán»
El LLM trata a Titán como un planeta e inventa datos: periodo orbital, composición atmosférica, número de lunas, todos verosímiles pero incorrectos. En realidad, Titán es una luna de Saturno.
La clasificación detecta: «discrepancia — Titán es una luna, no un planeta»
Los modelos de enriquecimiento reciben este contexto, establecen en null los campos irrelevantes y solo rellenan las propiedades que realmente aplican a la entidad.
La clasificación se ejecuta como una única llamada rápida al LLM antes de que se inicie cualquier modelo de enriquecimiento. Utiliza un modelo económico y rápido (como Claude Haiku o GPT-4o Mini) para minimizar el coste.
La entidad coincide con el tipo del esquema. El enriquecimiento continúa con alta confianza.
La entidad es de un tipo distinto al que espera el esquema. La clasificación explica qué es realmente la entidad.
La entidad no se puede identificar con certeza. El LLM no dispone de suficiente información para clasificarla.
Existen varias interpretaciones válidas. La classification enumera las alternativas.
La clasificación es meramente orientativa. Si la llamada de clasificación falla por cualquier motivo (error del modelo, tiempo de espera agotado, límite de tasa), el enriquecimiento continúa con normalidad sin contexto de clasificación. Esto garantiza que el paso opcional de clasificación nunca impida que el enriquecimiento se complete.
La clasificación está diseñada para ejecutarse en modelos rápidos y económicos. Envía una carga mínima (nombre del esquema, descripción y datos de la entidad truncados) y espera una pequeña respuesta estructurada. El coste típico es una fracción del propio enriquecimiento, muy rentable frente a la mejora de la precisión.
La interfaz muestra el progreso de la clasificación en tiempo real mediante Server-Sent Events. Un evento classification_started se dispara cuando comienza la comprobación, seguido de classification_completed con el estado, la confianza y la descripción de la entidad. El resultado aparece como un banner sobre los resultados del modelo.
Si cancela el enriquecimiento durante la fase de clasificación, el trabajo se detiene de inmediato sin iniciar ningún modelo de enriquecimiento. No se gastan tokens innecesarios.
En el Editor de esquemas o en la barra lateral de Enriquecimiento por lotes, busque el menú desplegable «Clasificación». Seleccione un modelo rápido y económico (Claude Haiku, GPT-4o Mini o similar). La clasificación se ejecutará automáticamente antes de iniciar el enriquecimiento de cada entidad.
Cuando se utiliza la REST API, incluya el campo classification_model en su solicitud de enrichment con la clave compuesta del model (por ejemplo, anthropic::claude-haiku-4-5).