A classificação prévia verifica se uma entidade corresponde ao tipo de schema esperado antes de o enriquecimento começar. Este passo opcional evita alucinações e desperdício de tokens quando as entidades não correspondem ao seu schema.
Os LLMs estão ansiosos por ajudar. Quando lhes é pedido que enriqueçam uma entidade com base num esquema, produzem uma saída estruturada mesmo que a entidade não corresponda de todo ao tipo do esquema. Isto leva a dados alucinados que parecem plausíveis, mas estão completamente errados.
Esquema: “Planeta” — Entidade: “Titan”
O LLM trata Titan como um planeta e inventa dados: período orbital, composição da atmosfera, número de luas — todos com aparência plausível, mas errados. Titan é, na verdade, uma lua de Saturno.
A classificação deteta: “incompatibilidade — Titã é uma lua, não um planeta”
Os modelos de enriquecimento recebem este contexto, definem os campos irrelevantes como null e preenchem apenas as propriedades que realmente se aplicam à entidade.
A classificação é executada como uma única chamada rápida ao LLM antes de qualquer modelo de enrichment começar. Utiliza um modelo económico e rápido (como o Claude Haiku ou o GPT-4o Mini) para minimizar o custo.
A entidade corresponde ao tipo do schema. O enriquecimento prossegue com elevada confiança.
A entidade é de um tipo diferente do que o schema espera. A classificação explica o que a entidade realmente é.
A entidade não pode ser identificada com certeza. O LLM não tem informação suficiente para a classificar.
Existem várias interpretações válidas. A classificação lista as alternativas.
A classificação é meramente consultiva. Se a chamada de classificação falhar por qualquer motivo (erro do modelo, timeout, limite de taxa), o enrichment prossegue normalmente sem contexto de classificação. Isto garante que a etapa opcional de classificação nunca impede a conclusão do enrichment.
A classificação foi concebida para ser executada em modelos rápidos e económicos. Envia um payload mínimo (nome do schema, descrição e dados da entity truncados) e espera uma pequena resposta estruturada. O custo típico é uma fração do próprio enrichment — bem vale a melhoria de precisão.
A interface mostra o progresso da classificação em tempo real através de Server-Sent Events. Um evento classification_started dispara quando a verificação começa, seguido de classification_completed com o estado, a confiança e a descrição da entidade. O resultado aparece como um banner acima dos resultados dos modelos.
Se você cancelar o enrichment durante a fase de classification, o trabalho é interrompido de imediato sem iniciar quaisquer models de enrichment. Não se gastam tokens desnecessários.
No Editor de schemas ou na barra lateral de Enrichment em batch, procure o menu pendente “Classification”. Selecione um model rápido e económico (Claude Haiku, GPT-4o Mini ou semelhante). A classification será executada automaticamente antes de começar o enrichment de cada entity.
Ao utilizar a API REST, inclua o campo classification_model no seu pedido de enrichment com a chave composta do modelo (por exemplo, anthropic::claude-haiku-4-5).