Pegue cualquier muestra de datos JSON y deje que la IA genere un esquema de enriquecimiento totalmente tipado, con dominios de especialización, claves de búsqueda, detección de campos multilingües y reglas de validación. El proceso de generación incluye hasta 6 intentos de autocorrección, garantizando que el esquema sea válido antes de que usted lo vea.
Pegar JSON de muestra
Cualquier objeto o array JSON que represente los datos de su entidad
La IA genera el esquema
El LLM analiza los tipos de datos, el anidamiento, los patrones de nomenclatura y la experiencia de dominio
Validación de 8 reglas
Si la validación falla, los errores se devuelven al LLM para su autocorrección (hasta 6 reintentos)
Posprocesamiento
Detección de nullable, degradación de clave de búsqueda, recopilación de especialización
Esquema de enriquecimiento validado
Lista para el enriquecimiento con propiedades tipadas, dominios de experiencia y claves de búsqueda
En ocasiones, los LLM generan esquemas con problemas estructurales: una discrepancia de tipos entre el esquema y los datos de entrada, un $ref que apunta a una definición inexistente o demasiados dominios de experiencia. Entity Enricher utiliza el mecanismo ModelRetry de Pydantic-AI para detectar estos problemas y devolverlos al LLM para su corrección dentro de la misma ejecución de generación.
Esto ocurre de forma transparente. El sistema valida la salida del LLM frente a 8 reglas y, si alguna falla, los errores específicos se devuelven al modelo con instrucciones para corregirlos. Este bucle de reintento se ejecuta hasta 6 veces, logrando una salida de esquema válida en casi el 100 % sin intervención manual.
Los tipos de propiedad del esquema deben coincidir con los tipos de datos observados en el JSON de entrada.
Todos los punteros $ref deben referenciar entidades definidas en la sección $defs.
Cada propiedad debe pertenecer a un dominio de especialización válido.
El total de dominios de especialización debe mantenerse dentro de los límites configurables.
Las claves de búsqueda deben referenciar propiedades existentes con valores no vacíos.
Los nombres de las propiedades deben seguir la convención snake_case.
La profundidad de anidación debe permanecer dentro de los límites (10 niveles de forma predeterminada).
Se validan los campos obligatorios, los valores mín./máx. y las restricciones de enum.
Después de que el LLM genera y autocorrige el esquema, se aplican transformaciones adicionales basadas en los datos:
Si los datos de entrada tienen valores nulos para un campo, la propiedad del esquema se marca automáticamente como anulable. Esto permite que los LLM devuelvan null para campos donde los datos no están disponibles, en lugar de forzar valores alucinados.
Los campos marcados como claves de búsqueda pero con valores vacíos en los datos de entrada pierden su marca de clave de búsqueda. Esto evita que las claves de búsqueda vacías diluyan el enfoque del prompt de enriquecimiento.
Todos los dominios de especialización se recopilan desde las propiedades anidadas en una lista de nivel superior, lo que facilita ver de un vistazo la cobertura de dominios de su esquema.
Tras generar un esquema, puede modificarlo mediante instrucciones en lenguaje natural. Escriba algo como «añade una referencia parent_company con name y ownership_percentage» y la IA aplica el cambio estructural, manteniendo todas las reglas de validación y las asignaciones de especialización.
Cada edición con IA también genera 5 sugerencias de mejora, como añadir campos que faltan, mejorar descripciones o reorganizar los dominios de especialización. Puede aplicar estas sugerencias con un solo clic.
Para un control directo, el editor visual de esquemas ofrece ordenación de propiedades mediante arrastrar y soltar, edición de campos en línea, navegación con teclado y soporte completo de deshacer/rehacer. Consulte la documentación del editor de esquemas para más detalles.
Entity Enricher no se limita a generar un documento de esquema JSON: convierte su esquema en un modelo Pydantic dinámico en tiempo de ejecución. Este modelo se usa después como el tipo de salida estructurada para los agentes de Pydantic-AI, lo que significa que la salida del LLM se valida frente a su esquema a nivel de tipo. Las salidas no válidas activan reintentos automáticos.
Este enfoque combina la flexibilidad de los esquemas definidos por el usuario con la seguridad de tipos de los modelos compilados. Obtiene lo mejor de ambos mundos: defina la forma que desee y el sistema la aplica automáticamente.
Pegue una muestra JSON, elija un modelo y obtenga un esquema de enriquecimiento validado en segundos. Luego perfecciónelo con lenguaje natural o con el editor visual.
Empiece gratis