Generación de esquemas con IA - Entity Enricher

Generación de esquemas con IA

Pegue cualquier muestra de datos JSON y deje que la IA genere un esquema de enriquecimiento totalmente tipado, con dominios de especialización, claves de búsqueda, detección de campos multilingües y reglas de validación. El proceso de generación incluye hasta 6 intentos de autocorrección, garantizando que el esquema sea válido antes de que usted lo vea.

Pipeline de generación de esquemas

PASO 1

Pegar JSON de muestra

Cualquier objeto o array JSON que represente los datos de su entidad

PASO 2

La IA genera el esquema

El LLM analiza los tipos de datos, el anidamiento, los patrones de nomenclatura y la experiencia de dominio

PASO 3

Validación de 8 reglas

1.Corrección de tipo

2.Validez del destino de $ref

3.Asignación de especialización

4.Límites de recuento de expertise

5.Validez de clave de búsqueda

6.Nomenclatura de propiedades

7.Profundidad de la estructura anidada

8.Restricciones de campos obligatorios

Si la validación falla, los errores se devuelven al LLM para su autocorrección (hasta 6 reintentos)

PASO 4

Posprocesamiento

Detección de nullable, degradación de clave de búsqueda, recopilación de especialización

SALIDA

Esquema de enriquecimiento validado

Lista para el enriquecimiento con propiedades tipadas, dominios de experiencia y claves de búsqueda

Autocorrección mediante ModelRetry

En ocasiones, los LLM generan esquemas con problemas estructurales: una discrepancia de tipos entre el esquema y los datos de entrada, un $ref que apunta a una definición inexistente o demasiados dominios de experiencia. Entity Enricher utiliza el mecanismo ModelRetry de Pydantic-AI para detectar estos problemas y devolverlos al LLM para su corrección dentro de la misma ejecución de generación.

Esto ocurre de forma transparente. El sistema valida la salida del LLM frente a 8 reglas y, si alguna falla, los errores específicos se devuelven al modelo con instrucciones para corregirlos. Este bucle de reintento se ejecuta hasta 6 veces, logrando una salida de esquema válida en casi el 100 % sin intervención manual.

Reglas de validación aplicadas

Corrección de tipo

Los tipos de propiedad del esquema deben coincidir con los tipos de datos observados en el JSON de entrada.

Integridad de $ref

Todos los punteros $ref deben referenciar entidades definidas en la sección $defs.

Asignación de especialización

Cada propiedad debe pertenecer a un dominio de especialización válido.

Número de especializaciones

El total de dominios de especialización debe mantenerse dentro de los límites configurables.

Validez de clave de búsqueda

Las claves de búsqueda deben referenciar propiedades existentes con valores no vacíos.

Nomenclatura de propiedades

Los nombres de las propiedades deben seguir la convención snake_case.

Profundidad de la estructura

La profundidad de anidación debe permanecer dentro de los límites (10 niveles de forma predeterminada).

Restricciones de campo

Se validan los campos obligatorios, los valores mín./máx. y las restricciones de enum.

Posprocesamiento inteligente

Después de que el LLM genera y autocorrige el esquema, se aplican transformaciones adicionales basadas en los datos:

Detección de nullable

Si los datos de entrada tienen valores nulos para un campo, la propiedad del esquema se marca automáticamente como anulable. Esto permite que los LLM devuelvan null para campos donde los datos no están disponibles, en lugar de forzar valores alucinados.

Degradación de clave de búsqueda

Los campos marcados como claves de búsqueda pero con valores vacíos en los datos de entrada pierden su marca de clave de búsqueda. Esto evita que las claves de búsqueda vacías diluyan el enfoque del prompt de enriquecimiento.

Colección de especialización

Todos los dominios de especialización se recopilan desde las propiedades anidadas en una lista de nivel superior, lo que facilita ver de un vistazo la cobertura de dominios de su esquema.

Edite schemas con lenguaje natural

Tras generar un esquema, puede modificarlo mediante instrucciones en lenguaje natural. Escriba algo como «añade una referencia parent_company con name y ownership_percentage» y la IA aplica el cambio estructural, manteniendo todas las reglas de validación y las asignaciones de especialización.

Cada edición con IA también genera 5 sugerencias de mejora, como añadir campos que faltan, mejorar descripciones o reorganizar los dominios de especialización. Puede aplicar estas sugerencias con un solo clic.

Para un control directo, el editor visual de esquemas ofrece ordenación de propiedades mediante arrastrar y soltar, edición de campos en línea, navegación con teclado y soporte completo de deshacer/rehacer. Consulte la documentación del editor de esquemas para más detalles.

Del esquema a una salida con seguridad de tipos

Entity Enricher no se limita a generar un documento de esquema JSON: convierte su esquema en un modelo Pydantic dinámico en tiempo de ejecución. Este modelo se usa después como el tipo de salida estructurada para los agentes de Pydantic-AI, lo que significa que la salida del LLM se valida frente a su esquema a nivel de tipo. Las salidas no válidas activan reintentos automáticos.

Este enfoque combina la flexibilidad de los esquemas definidos por el usuario con la seguridad de tipos de los modelos compilados. Obtiene lo mejor de ambos mundos: defina la forma que desee y el sistema la aplica automáticamente.

Documentación de generación de esquemas|Reglas de validación|Enriquecimiento multimodelo|Procesamiento por lotes|Todas las funciones

Genere su primer esquema

Pegue una muestra JSON, elija un modelo y obtenga un esquema de enriquecimiento validado en segundos. Luego perfecciónelo con lenguaje natural o con el editor visual.

Empiece gratis