강화 전략 - Entity Enricher 문서

강화 전략

Entity Enricher는 LLM 호출이 조율되는 방식을 제어하는 두 가지 강화 전략을 제공합니다. 올바른 전략을 선택하면 정확도, 속도, 비용에 영향을 미칩니다.

파이프라인 다이어그램

가장 단순한 구성부터 가장 강력한 구성까지. 각 구성은 이전 구성을 기반으로 합니다.

단순

단일 패스 — 모델 1개

모델 하나, 호출 한 번. 전체 스키마가 하나의 프롬프트로 전송됩니다. 빠르고 저렴하여 간단한 스키마나 빠른 반복 작업에 이상적입니다.

엔터티

Aspirin

회사, 약물, 법률 사건, 연구 논문 등 모든 엔터티...

Anthropic

직접 준비한 API 키로 어떤 LLM 공급자든 사용하세요.

Anthropic전체 스키마

한 번의 호출로 전체 스키마 — 검증 실패 시 자동으로 재시도합니다.

보강 결과

Aspirin

다중 모델

단일 패스 — 모델 3개

동일한 전략이지만 여러 모델에서 병렬로 실행합니다. 결과는 필드별로 비교 및 중재되어 단일 고신뢰도 출력을 생성합니다.

엔터티

Aspirin

회사, 약물, 법률 사건, 연구 논문 등 모든 엔터티...

사전 분류

일치 — Pharmaceutical Compound

LLM 크레딧을 낭비하기 전에 유형 불일치를 잡아냅니다.

Anthropic
OpenAI
Google Gemini

자체 API 키 사용 — 모든 LLM 공급자와 함께 작동합니다.

Anthropic전체 스키마
OpenAI전체 스키마
Gemini전체 스키마

한 번의 호출로 전체 스키마 — 검증 실패 시 자동으로 재시도합니다.

최종 enrichment 결과

Aspirin

중재됨

논리적인 필드 수준 충돌 해결로 신뢰할 수 있는 최종 결과를 생성합니다.

고급

다중 전문 분야 — 3개 모델

스키마는 전문 도메인별로 분할됩니다. 각 모델은 도메인마다 집중된 하위 프롬프트를 받습니다. 결과는 모델별로 딥 병합된 후 모델 간에 중재됩니다. 복잡한 다중 도메인 스키마에 대해 최대의 정확도를 제공합니다.

엔터티

Aspirin

회사, 약물, 법률 사건, 연구 논문 등 모든 엔터티...

사전 분류

일치 — Pharmaceutical Compound

LLM 크레딧을 낭비하기 전에 유형 불일치를 잡아냅니다.

Anthropic
OpenAI
Google Gemini

자체 API 키 사용 — 모든 LLM 공급자와 함께 작동합니다.

Anthropic
약리학LLM 프롬프트
규제LLM 프롬프트
OpenAI
약리학LLM 프롬프트
규제LLM 프롬프트
Gemini
약리학LLM 프롬프트
규제LLM 프롬프트

스키마가 영역별로 분할되며, 자가 수정 프롬프트가 검증 실패 시 재시도합니다.

결과 Anthropic개
결과 OpenAI개
결과 Gemini개

모델별 전문 영역 응답의 딥 병합입니다.

최종 enrichment 결과

Aspirin

중재됨

논리적인 필드 수준 충돌 해결로 신뢰할 수 있는 최종 결과를 생성합니다.

상세 비교

측면단일 패스다중 전문 분야
LLM 호출model당 1개모델당 N개 (전문 분야당 1개)
스키마 전송됨하나의 프롬프트로 전체 스키마전문 분야별 하위 집합
실행순차 (호출 1회)병렬 (모든 expertise domain이 동시에 실행됩니다)
정확도간단한 schema에 적합합니다높음 — 집중된 prompt가 더 나은 결과를 냅니다
속도작은 스키마에 더 빠름병렬 실행은 대규모 schema에서 더 빠를 수 있습니다
비용더 낮음 (단일 호출 오버헤드)높음(호출당 오버헤드가 있는 다중 호출)
스트리밍전부 아니면 전무 결과점진적 — 각 전문 영역이 완료되는 대로 결과가 스트리밍됩니다
부분 성공아니요 — 전체 호출이 성공하거나 실패합니다예 — 성공한 전문 분야는 보존되며, 실패한 것은 재시도할 수 있습니다

각 전략을 사용하는 경우

단일 패스를 사용하는 경우:

  • 스키마의 속성이 15~20개 미만인 경우
  • 모든 속성이 단일 영역에 속합니다 (예: 모든 금융 데이터)
  • 가장 빠르고 저렴한 결과를 원하며 정확도는 덜 중요합니다
  • 새 스키마를 테스트하며 빠르게 반복하고 있습니다

다중 전문 분야를 사용하는 경우:

  • 스키마가 여러 전문 분야(제약, 금융, 지리 등)에 걸쳐 있는 경우
  • 20개 이상의 속성을 가진 복잡한 스키마를 사용하고 있습니다
  • 정확도가 중요하고 집중적이고 전문화된 프롬프트를 원하는 경우
  • 각 도메인이 완료됨에 따라 실시간 진행 상황을 원합니다
  • 부분 성공 처리가 필요합니다 — 실패한 것만 재시도

다중 전문 분야 작동 방식 상세

다중 전문 분야 전략은 각 모델에 대해 4단계 프로세스를 따릅니다:

1
expertise domain별 속성 그룹화

스키마는 재귀적으로 순회됩니다. 전문 도메인 태그가 있는 각 속성은 동일한 도메인을 공유하는 다른 속성과 그룹화됩니다. 예를 들어 revenuemarket_cap은 “financial” 그룹으로, gmp_status는 “regulatory”로 이동합니다.

2
집중된 하위 schema 생성

각 expertise 그룹은 자신의 속성만 포함하는 최소 하위 schema가 됩니다. 이는 LLM이 더 작고 집중된 prompt를 받으며 자신이 전문으로 하는 필드만 채우면 된다는 것을 의미합니다.

3
병렬로 실행

모든 전문 영역 호출은 동시에 실행됩니다. 전문 영역이 5개인 스키마는 5개의 LLM 호출을 동시에 시작합니다. 각 호출이 완료되면 그 결과가 누적된 출력에 깊게 병합되어 실시간으로 UI에 스트리밍됩니다.

4
부분 실패 처리

일부 전문 영역이 실패하면 시스템은 성공한 전문 영역의 병합된 출력을 “부분” 상태와 함께 반환합니다. 실패한 전문 영역만 재시도할 수 있으며, 이미 성공한 작업을 반복하지 않고 새 결과가 기존 출력에 병합됩니다.

다중 모델 보강과 결합하기

두 전략 모두 멀티 모델 보강과 결합할 수 있습니다. 여러 모델을 선택하면 각 모델이 선택한 전략을 독립적으로 실행합니다. 그런 다음 멀티 모델 융합을 사용해 결과를 병합하여 하나의 높은 신뢰도 출력을 생성할 수 있습니다.

예시: 3개의 모델과 4개의 전문 분야를 가진 스키마로 다중 전문 분야를 사용하면 총 12번의 LLM 호출이 시작됩니다(모델 3개 x 전문 분야 4개). 서로 다른 제공자의 모델은 병렬로 실행되고, 동일한 제공자의 모델은 속도 제한을 준수하기 위해 대기열에 배치됩니다.