Geração de Esquemas com IA - Entity Enricher

Geração de Esquemas com IA

Cole qualquer amostra de dados JSON e deixe a IA gerar um esquema de enriquecimento totalmente tipado — completo com domínios de especialização, chaves de pesquisa, deteção de campos multilingues e regras de validação. O processo de geração inclui até 6 tentativas de autocorreção, garantindo que o esquema é válido antes de o ver.

Pipeline de Geração de Esquemas

PASSO 1

Colar JSON de amostra

Qualquer objeto ou array JSON que represente os dados da sua entidade

PASSO 2

A IA Gera o Esquema

O LLM analisa tipos de dados, aninhamento, padrões de nomenclatura e domínio de especialização

PASSO 3

Validação com 8 Regras

1.Correção de tipos

2.Validade do alvo de $ref

3.Atribuição de especialização

4.Limites de contagem de especialização

5.Validade da chave de pesquisa

6.Nomenclatura de propriedades

7.Profundidade da estrutura aninhada

8.Restrições de campos obrigatórios

Se a validação falhar, os erros são reenviados ao LLM para autocorreção (até 6 tentativas)

PASSO 4

Pós-processamento

Deteção de anuláveis, despromoção de chave de pesquisa, recolha de expertise

SAÍDA

Esquema de enriquecimento validado

Pronto para enrichment com propriedades tipadas, expertise domains e chaves de pesquisa

Autocorreção via ModelRetry

Ocasionalmente, os LLMs geram esquemas com problemas estruturais — uma incompatibilidade de tipo entre o esquema e os dados de entrada, um $ref a apontar para uma definição inexistente ou demasiados domínios de especialização. O Entity Enricher usa o mecanismo ModelRetry do Pydantic-AI para detetar estes problemas e reencaminhá-los para o LLM, de modo a serem corrigidos na mesma execução de geração.

Isto acontece de forma transparente. O sistema valida a saída do LLM face a 8 regras e, se alguma regra falhar, os erros específicos são reenviados ao modelo com instruções para os corrigir. Este ciclo de repetição é executado até 6 vezes, alcançando uma saída de esquema válida em quase 100% sem intervenção manual.

Regras de validação aplicadas

Correção de tipos

Os tipos das propriedades do esquema têm de corresponder aos tipos de dados observados no JSON de entrada.

Integridade de $ref

Todos os ponteiros $ref têm de referenciar entidades definidas na secção $defs.

Atribuição de Especialização

Cada propriedade tem de pertencer a um domínio de especialização válido.

Número de Especializações

O total de domínios de especialização deve manter-se dentro dos limites configuráveis.

Validade da Chave de Pesquisa

As chaves de pesquisa têm de referenciar propriedades existentes com valores não vazios.

Nomenclatura de Propriedades

Os nomes das propriedades devem seguir a convenção snake_case.

Profundidade da estrutura

A profundidade de aninhamento tem de respeitar os limites (por predefinição, 10 níveis).

Restrições de campo

Os campos obrigatórios, os valores mínimos/máximos e as restrições de enum são validados.

Pós-processamento inteligente

Após o LLM gerar e autocorrigir o esquema, são aplicadas transformações adicionais baseadas nos dados:

Deteção de Anuláveis

Se os dados de input tiverem valores nulos para um campo, a propriedade do schema é automaticamente marcada como anulável. Isto permite que os LLMs devolvam null para campos onde os dados não estão disponíveis, em vez de forçar valores alucinados.

Despromoção de Chave de Pesquisa

Os campos marcados como chaves de pesquisa mas com valores vazios nos dados de entrada têm a respetiva marcação de chave de pesquisa removida. Isto evita que chaves de pesquisa vazias diluam o foco do prompt de enriquecimento.

Coleção de Especialização

Todos os domínios de especialização são recolhidos das propriedades aninhadas para uma lista de nível superior, facilitando a visualização da cobertura de domínios do seu schema num relance.

Editar schemas com linguagem natural

Depois de gerar um esquema, pode modificá-lo com instruções em linguagem natural. Escreva algo como "add a parent_company reference with name and ownership_percentage" e a IA aplica a alteração estrutural, mantendo todas as regras de validação e atribuições de especialização.

Cada edição de IA também produz 5 sugestões de melhoria — coisas como adicionar campos em falta, melhorar descrições ou reorganizar domínios de especialização. Pode aplicar estas sugestões com um único clique.

Para um controlo direto, o editor visual de esquemas oferece ordenação de propriedades por arrastar e largar, edição de campos inline, navegação por teclado e suporte completo de desfazer/refazer. Consulte a documentação do editor de esquemas para mais detalhes.

Do esquema a resultados com segurança de tipos

O Entity Enricher não se limita a gerar um documento de esquema JSON — converte o seu esquema num modelo Pydantic dinâmico em runtime. Este modelo é depois usado como tipo de saída estruturada para os agentes Pydantic-AI, o que significa que a saída do LLM é validada face ao seu esquema ao nível do tipo. Saídas inválidas despoletam tentativas automáticas.

Esta abordagem combina a flexibilidade dos esquemas definidos pelo utilizador com a segurança de tipos dos modelos compilados. Tem o melhor dos dois mundos: defina qualquer forma que pretenda e o sistema impõe-na automaticamente.

Documentação de Geração de Esquemas|Regras de validação|Enriquecimento multi-modelo|Processamento em Lote|Todas as funcionalidades

Gere o seu primeiro schema

Cole uma amostra JSON, escolha um modelo e obtenha um esquema de enriquecimento validado em segundos. Depois, refine-o com linguagem natural ou com o editor visual.

Começar gratuitamente