Вставьте любой образец данных JSON, и AI сгенерирует полностью типизированную схему обогащения — с областями экспертизы, ключами поиска, определением многоязычных полей и правилами валидации. Процесс генерации включает до 6 попыток самокоррекции, гарантируя, что схема будет валидной ещё до того, как вы её увидите.
Вставить образец JSON
Любой объект или массив JSON, представляющий данные вашей сущности
ИИ генерирует схему
LLM анализирует типы данных, вложенность, шаблоны именования и области экспертизы
Валидация по 8 правилам
Если проверка не пройдена, ошибки отправляются обратно в LLM для самокоррекции (до 6 повторных попыток)
Постобработка
Определение допустимости null, понижение приоритета ключа поиска, сбор экспертной области
Проверенная схема обогащения
Готово к обогащению с типизированными свойствами, областями экспертизы и ключами поиска
LLM иногда генерируют схемы со структурными проблемами — несоответствие типов между схемой и входными данными, $ref, указывающий на несуществующее определение, или слишком много областей экспертизы. Entity Enricher использует механизм ModelRetry из Pydantic-AI, чтобы выявлять эти проблемы и передавать их обратно в LLM для исправления в рамках того же запуска генерации.
Это происходит прозрачно. Система проверяет вывод LLM по 8 правилам, и если какое-либо правило нарушается, конкретные ошибки отправляются обратно модели с инструкциями по их исправлению. Этот цикл повторных попыток выполняется до 6 раз, обеспечивая почти 100% корректный вывод по схеме без ручного вмешательства.
Типы свойств схемы должны соответствовать типам данных, наблюдаемым во входном JSON.
Все указатели $ref должны ссылаться на сущности, определённые в разделе $defs.
Каждое свойство должно принадлежать допустимой области экспертизы.
Общее число областей экспертизы должно оставаться в пределах настраиваемых лимитов.
Ключи поиска должны ссылаться на существующие свойства с непустыми значениями.
Имена свойств должны соответствовать соглашению snake_case.
Глубина вложенности должна оставаться в пределах лимита (по умолчанию 10 уровней).
Обязательные поля, минимальные/максимальные значения и ограничения enum проверяются.
После того как LLM генерирует и самостоятельно исправляет схему, применяются дополнительные преобразования на основе данных:
Если во входных данных есть null-значения для поля, свойство схемы автоматически помечается как допускающее null. Это позволяет LLM возвращать null для полей, где данные недоступны, вместо того чтобы навязывать выдуманные значения.
У полей, отмеченных как ключи поиска, но с пустыми значениями во входных данных, флаг ключа поиска снимается. Это не даёт пустым ключам поиска размывать фокус промпта обогащения.
Все области экспертизы собираются из вложенных свойств в список верхнего уровня, что позволяет с первого взгляда оценить охват областей в вашей схеме.
После генерации схемы вы можете изменить её с помощью инструкций на естественном языке. Введите что-то вроде «add a parent_company reference with name and ownership_percentage», и ИИ применит структурное изменение, сохраняя все правила валидации и назначения областей экспертизы.
Каждое AI-редактирование также порождает 5 предложений по улучшению — например, добавление недостающих полей, улучшение описаний или реорганизация expertise domain. Вы можете применить эти предложения одним щелчком.
Для прямого контроля визуальный редактор схемы предоставляет упорядочивание свойств перетаскиванием, редактирование полей на месте, навигацию с клавиатуры и полную поддержку отмены/повтора действий. Подробнее см. документацию редактора схемы.
Entity Enricher не просто генерирует документ JSON-схемы — он преобразует вашу схему в динамическую модель Pydantic во время выполнения. Затем эта модель используется как тип структурированного вывода для агентов Pydantic-AI, а значит, вывод LLM проверяется на соответствие вашей схеме на уровне типов. Некорректный вывод вызывает автоматические повторные попытки.
Этот подход сочетает гибкость пользовательских схем с типобезопасностью скомпилированных моделей. Вы получаете лучшее из обоих миров: определяете любую нужную структуру, а система автоматически её обеспечивает.
Вставьте образец JSON, выберите модель и получите проверенную схему обогащения за секунды. Затем доработайте её с помощью естественного языка или визуального редактора.
Начать бесплатно