Geração de Esquemas com IA - Documentação do Entity Enricher

Geração de Esquemas com IA

Gere schemas JSON estruturados a partir de dados de exemplo com IA, com autocorreção automática e pós-processamento inteligente.

Como Funciona

A geração de esquemas transforma dados brutos de entidades num esquema JSON tipado e anotado que define exatamente que informação extrair durante o enriquecimento. Em vez de escrever esquemas manualmente, você cola JSON de exemplo e deixa a IA analisar a estrutura, inferir tipos, atribuir domínios de especialização e sugerir melhorias.

O Pipeline de Geração

  1. Pré-processamento da entrada — O seu JSON de exemplo é analisado. Os objetos localizados (como {"en": "...", "fr": "..."}) são reduzidos a um único valor, e o número de propriedades determina quantos domínios de especialização são permitidos.
  2. Construção do prompt — É criado um prompt de sistema adaptativo com base na complexidade dos seus dados: se contém objetos aninhados, quantas propriedades tem e se foram detetados campos multilingues.
  3. Geração por LLM com autocorreção — A IA gera o esquema. Se alguma das 8 regras de validação falhar, os erros são reenviados para a IA para correção — até um total de 6 tentativas.
  4. Pós-processamento — Regras determinísticas refinam o esquema: marcando campos anuláveis, limpando chaves de pesquisa vazias e recolhendo metadados de especialização.
  5. Gravação automática — O schema gerado é gravado automaticamente e desduplicado através de hashing de conteúdo, por isso schemas idênticos não são duplicados.

Ciclo de autocorreção

O ciclo de autocorreção é o que torna a geração de esquemas fiável. Depois de a IA produzir um esquema, este passa por um validador que verifica 8 regras que abrangem a correção de tipos, a atribuição de especialização, a integridade das referências e a integridade dos dados. Se alguma regra falhar, a mensagem de erro específica é enviada de volta para a IA para que esta possa corrigir o problema na tentativa seguinte.

Exemplo de autocorreção

Tentativa 1A IA gera o esquema. O validador deteta: revenue: incompatibilidade de tipo — a entrada é um número, mas o esquema indica 'string'
RepetirO erro é reenviado à IA com contexto sobre o que correu mal.
Tentativa 2A IA corrige o tipo para number. Todas as 8 regras passam. O esquema é aceite.

Esta abordagem é muito mais fiável do que pedir à IA para “ter cuidado com os tipos” no prompt. O validador deteta erros concretos e dá à IA feedback preciso para os corrigir. Saiba mais sobre cada regra no guia Regras de Validação.

O Que o Schema Contém

Um esquema gerado é mais do que uma simples definição de tipos. Cada propriedade inclui metadados que orientam o processo de enriquecimento:

Tipo

Tipo de schema JSON (string, number, integer, boolean, array, object)

Descrição

Descrição contextual que indica à IA que informação encontrar

Especialização

Qual o domínio de especialização (financeiro, regulatório, etc.) que fornece este valor

Chave de Pesquisa

Se este campo identifica a entidade (pesquisa) ou desduplica arrays (fusão)

Anulável

Se o campo pode ser null, evitando novas tentativas desnecessárias para dados opcionais

Multilingue

Se o campo deve ser enriquecido em vários idiomas

Preservar

Se deve manter o valor original inalterado durante o enriquecimento

Exemplos

Valores de exemplo realistas que orientam a IA para o formato correto

Deteção do domínio de especialização

A IA agrupa as propriedades do schema em domínios de especialização com base no seu significado semântico. Por exemplo, o schema de uma empresa farmacêutica pode ter domínios como “Analista Financeiro”, “Especialista Regulatório” e “Informação Corporativa”. Estes domínios são usados pela estratégia multi-especialização para executar chamadas de LLM paralelas e especializadas para resultados mais aprofundados.

Limites de contagem de domínios

O número de domínios de especialização é limitado automaticamente com base no número de propriedades dos seus dados para evitar a fragmentação excessiva:

5 propriedades
1 domínio
12 propriedades
2 domínios
30 propriedades
5 domínios
60 propriedades
10 domínios

Pós-processamento

Depois de a IA gerar um esquema válido, três passos deterministas de pós-processamento refinam-no com base nos seus dados de entrada reais:

Deteção de anuláveis

Os campos com valores nulos na sua entrada são automaticamente marcados como anuláveis, para que a IA não desperdice tentativas a tentar preenchê-los.

Limpeza de chave de pesquisa vazia

As marcações de chave de pesquisa são removidas dos campos com valores vazios (null, string vazia, zero), uma vez que não ajudam a identificar a entidade.

Coleção de especialização

Todos os domínios de especialização únicos são recolhidos do schema para métricas e configuração de estratégia.

Edição de Esquemas com IA

Após a geração, pode modificar esquemas com instruções em linguagem natural. Escreva um comando e a IA aplica a alteração, preservando a estrutura existente do seu esquema. Cada edição também produz 5 sugestões para melhorias adicionais.

Exemplos de comandos de edição

Adicionar um campo inteiro employee_count
Crie um objeto de morada aninhado com cidade e país
Adicionar descrições em francês a todos os campos de texto
Defina uma referência de empresa-mãe usando $defs
Marcar o campo do website como anulável

As edições por IA são validadas usando um subconjunto das regras de geração (verificação de tipos, integridade de referências, consistência de especialização) sem comparar com os dados de entrada, uma vez que pode adicionar ou remover campos intencionalmente.

Sugestões da IA

Tanto a geração de schema como a edição por IA produzem 5 sugestões específicas que abrangem diferentes categorias de melhoria:

Completude dos dadosCampos em falta que poderiam enriquecer a sua entity
Qualidade dos dadosPadrões de validação, restrições de formato
RelaçõesEstruturas aninhadas, referências de entity via $defs
InternacionalizaçãoTraduções multilingues, suporte de localizações
Contexto de negócioCampos específicos de domínio e agrupamentos por expertise domain

As sugestões aparecem como fichas clicáveis no Editor de Esquemas — clique numa delas para preencher automaticamente o campo de edição por IA e aplicá-la.

Próximos Passos