Entity Enricher가 단일 엔터티를 처리하는 방식을 단계별로 안내합니다 — 입력에서 분류, 병렬 모델 실행을 거쳐 구조화된 출력까지.
Schema Editor 페이지를 열고 보강을 설정합니다. 워크플로 스테퍼가 Sample Data, Schema, Enrichment, Results 등 파이프라인 단계를 안내합니다.
샘플 JSON을 붙여넣어 스키마를 자동 생성한 다음, 대화형 속성 트리를 살펴보세요. 속성을 편집하고 전문 분야를 추가하며 필드를 검색 키나 보존 대상으로 지정하세요.
강화 옵션(전략, 모델, 언어, 분류, 응답 스키마 및 엄격한 구조화 출력 토글)을 구성하고 엔티티 검색 키(이름, 웹사이트, 국가 등)를 입력하여 엔티티를 식별하세요.
각 모델의 실시간 진행 상황과 결과를 표시합니다. 여러 모델을 사용할 경우 융합을 위한 “결과 병합” 버튼이 나타납니다.
분류 모델을 선택한 경우, 엔터티가 스키마 유형과 일치하는지 확인하기 위해 빠르고 저렴한 LLM 호출이 먼저 실행됩니다. 이는 엔터티가 일치하지 않을 때 강화에 토큰을 낭비하는 것을 방지합니다. 자세한 내용은 분류 문서에서 확인하세요.
선택한 각 모델은 선택하신 전략을 사용하여 엔터티를 처리합니다. 여러 모델을 선택하면 프로바이더 전반에 걸쳐 병렬로 실행되며(Claude와 GPT-4가 동시에 실행), 동일한 프로바이더의 모델은 속도 제한을 준수하기 위해 순차적으로 실행됩니다.
각 LLM 응답은 schema에 대해 실시간으로 검증됩니다. 출력이 예상되는 타입이나 제약 조건과 일치하지 않으면 시스템이 자동으로 오류를 LLM에 다시 보내 수정하도록 합니다.
LLM 호출당 최대 5회까지 자동으로 재시도합니다. 각 재시도에는 구체적인 검증 오류가 포함되어 LLM이 무엇을 수정해야 하는지 정확히 알 수 있습니다.
선택적 토글 두 개는 provider가 출력을 반환하기 전에 제약하도록 요청하므로, 애초에 수정이 필요한 응답이 줄어듭니다. 둘 다 이를 지원하는 model에만 적용되며, 나머지는 모두 위의 검증 및 재시도 루프로 처리됩니다.
Entity Enricher는 Server-Sent Events(SSE)를 사용하여 진행 상황을 실시간으로 스트리밍합니다. 모든 모델이 완료될 때까지 기다릴 필요가 없습니다 — 각 전문 분야 또는 모델이 완료될 때마다 결과가 점진적으로 나타납니다.
각 model은 구조화된 JSON 출력, expertise별 진행 배지, 토큰 사용량, 비용, 처리 시간을 표시하는 자체 결과 패널을 갖습니다. 다중 expertise 전략을 사용할 때는 각 도메인이 완료됨에 따라 expertise 배지가 실시간으로 업데이트됩니다.
다중 전문 분야 전략을 사용하면 일부 전문 분야는 실패하고 다른 전문 분야는 성공할 수 있습니다. Entity Enricher는 전체를 폐기하는 대신 성공한 전문 분야의 병합된 출력을 “부분” 상태로 반환합니다. 그런 다음 전체 강화를 다시 실행하지 않고 실패한 전문 분야만 재시도할 수 있습니다.
보강이 완료되면 결과가 나중에 참조할 수 있도록 레코드 페이지에 저장됩니다. 여러 모델을 사용한 경우 Multi-Model Fusion을 사용하여 결과를 병합할 수 있습니다.