Пошаговое описание того, как Entity Enricher обрабатывает одну сущность — от входных данных через классификацию и параллельное выполнение моделей до структурированного вывода.
Откройте страницу редактора схем и настройте обогащение. Пошаговый мастер проведёт вас по этапам конвейера: «Образцы данных», «Схема», «Обогащение» и «Результаты».
Вставьте образец JSON для автоматической генерации схемы, затем изучите интерактивное дерево свойств. Редактируйте свойства, добавляйте области экспертизы и отмечайте поля как ключи поиска или сохраняемые.
Настройте параметры обогащения (стратегию, модели, языки, классификацию, а также схему ответа и переключатели строгого структурированного вывода) и заполните ключи поиска сущности (название, веб-сайт, страна и т. д.) для её идентификации.
Показывает прогресс и результаты в реальном времени для каждой модели. При использовании нескольких моделей появляется кнопка «Объединить результаты» для слияния.
Если вы выбрали модель классификации, сначала выполняется быстрый и недорогой вызов LLM, чтобы проверить соответствие сущности типу схемы. Это позволяет не тратить токены на обогащение, когда сущность не соответствует. Подробнее в документации по классификации.
Каждая выбранная модель обрабатывает сущность с помощью выбранной вами стратегии. Когда выбрано несколько моделей, они выполняются параллельно по провайдерам (Claude и GPT-4 работают одновременно), тогда как модели одного провайдера выполняются последовательно, чтобы соблюдать ограничения по частоте запросов.
Каждый ответ LLM проверяется по вашей schema в реальном времени. Когда вывод не соответствует ожидаемым типам или ограничениям, система автоматически отправляет ошибки обратно в LLM для исправления.
До 5 автоматических повторных попыток на каждый вызов LLM. Каждая повторная попытка включает конкретную ошибку валидации, чтобы LLM точно понимала, что нужно исправить.
Два необязательных переключателя просят провайдера ограничить вывод до того, как он вернётся, чтобы изначально приходилось исправлять меньше ответов. Оба применяются только к моделям, которые их поддерживают; всё остальное по-прежнему опирается на приведённый выше цикл проверки и повторов.
Entity Enricher использует Server-Sent Events (SSE) для потоковой передачи прогресса в реальном времени. Вам не нужно ждать завершения всех моделей — результаты появляются постепенно, по мере того как завершается каждая область экспертизы или модель.
Каждая model получает собственную панель результатов, показывающую структурированный вывод JSON, значки прогресса по каждой expertise, использование токенов, стоимость и время обработки. При использовании стратегии multi-expertise значки expertise обновляются в реальном времени по мере завершения каждого домена.
При использовании стратегии множественной экспертизы одни экспертизы могут завершиться неудачно, а другие успешно. Вместо того чтобы отбросить всё, Entity Enricher возвращает объединённый результат от успешных экспертиз со статусом «Частично». Затем вы можете повторить только неудавшиеся экспертизы, не запуская всё обогащение заново.
После завершения обогащения ваши результаты сохраняются на странице записей для дальнейшего использования. Если вы использовали несколько моделей, вы можете объединить результаты с помощью слияния нескольких моделей.