AI 스키마 생성 - Entity Enricher

AI 스키마 생성

JSON 데이터 샘플을 붙여넣으면 AI가 전문 분야, 검색 키, 다국어 필드 감지, 검증 규칙까지 완비된 완전한 타입 지정 보강 스키마를 생성합니다. 생성 과정에는 최대 6회의 자체 수정 시도가 포함되어, 스키마를 보기 전에 유효성이 보장됩니다.

스키마 생성 파이프라인

1단계

샘플 JSON 붙여넣기

엔터티 데이터를 나타내는 모든 JSON 객체 또는 배열

2단계

AI가 스키마를 생성합니다

LLM이 데이터 유형, 중첩, 명명 패턴, 도메인 전문성을 분석합니다

3단계

8개 규칙 검증

1.유형 정확성
2.$ref 대상 유효성
3.expertise 할당
4.전문 영역 개수 제한
5.검색 키 유효성
6.속성 이름 지정
7.중첩 구조 깊이
8.필수 필드 제약 조건

검증에 실패하면 오류가 자체 수정을 위해 LLM으로 다시 전송됩니다(최대 6회 재시도).

4단계

후처리

Nullable 감지, search key 강등, expertise domain 수집

출력

검증된 enrichment schema

타입이 지정된 속성, 전문 분야, 검색 키를 갖추어 보강할 준비가 되었습니다

ModelRetry를 통한 자체 수정

LLM은 때때로 구조적 문제가 있는 스키마를 생성합니다. 스키마와 입력 데이터 간의 유형 불일치, 존재하지 않는 정의를 가리키는 $ref, 또는 너무 많은 전문 분야 등이 그 예입니다. Entity Enricher는 Pydantic-AI의 ModelRetry 메커니즘을 사용해 이러한 문제를 잡아내고, 동일한 생성 실행 내에서 수정하도록 LLM에 다시 전달합니다.

이는 투명하게 이루어집니다. 시스템은 LLM 출력을 8가지 규칙에 따라 검증하며, 규칙 중 하나라도 실패하면 해당 오류를 수정 지침과 함께 모델로 다시 전송합니다. 이 재시도 루프는 최대 6회 실행되어, 수동 개입 없이 거의 100% 유효한 스키마 출력을 달성합니다.

적용된 검증 규칙

유형 정확성

스키마 속성 타입은 입력 JSON에서 관찰된 데이터 타입과 일치해야 합니다.

$ref 무결성

모든 $ref 포인터는 $defs 섹션에 정의된 엔티티를 참조해야 합니다.

Expertise 할당

모든 속성은 유효한 전문 영역에 속해야 합니다.

Expertise 수

전체 전문 영역 수는 설정 가능한 한도 내에 있어야 합니다.

검색 키 유효성

검색 키는 비어 있지 않은 값을 가진 기존 속성을 참조해야 합니다.

속성 이름 지정

속성 이름은 snake_case 규칙을 따라야 합니다.

구조 깊이

중첩 깊이는 제한(기본 10단계) 이내로 유지해야 합니다.

필드 제약 조건

필수 필드, 최소/최대 값, 열거형 제약 조건이 검증됩니다.

지능형 후처리

LLM이 스키마를 생성하고 자체 수정한 후, 추가적인 데이터 기반 변환이 적용됩니다:

Nullable 감지

입력 데이터에 어떤 필드의 값이 null이면 해당 스키마 속성은 자동으로 nullable로 표시됩니다. 이를 통해 LLM은 데이터를 사용할 수 없는 필드에 대해 환각된 값을 강제로 넣는 대신 null을 반환할 수 있습니다.

검색 키 강등

검색 키로 표시되었지만 입력 데이터에서 값이 비어 있는 필드는 검색 키 플래그가 제거됩니다. 이는 빈 검색 키가 보강 프롬프트의 초점을 흐리는 것을 방지합니다.

Expertise 컬렉션

모든 전문 영역은 중첩된 속성에서 최상위 목록으로 수집되어, 스키마의 영역 커버리지를 한눈에 쉽게 확인할 수 있습니다.

자연어로 스키마 편집

스키마를 생성한 후 자연어 지침을 사용하여 수정할 수 있습니다. "name과 ownership_percentage를 포함한 parent_company 참조 추가"와 같이 입력하면 AI가 모든 검증 규칙과 전문 분야 할당을 유지하면서 구조적 변경을 적용합니다.

각 AI 편집은 누락된 필드 추가, 설명 개선, expertise domain 재구성 같은 5가지 개선 제안도 생성합니다. 이러한 제안은 클릭 한 번으로 적용할 수 있습니다.

직접 제어를 원하시면 시각적 schema 편집기가 드래그 앤 드롭 속성 정렬, 인라인 필드 편집, 키보드 탐색, 완전한 실행 취소/다시 실행 지원을 제공합니다. 자세한 내용은 schema 편집기 문서를 참조하세요.

schema에서 타입 안전 출력으로

Entity Enricher는 단순히 JSON 스키마 문서를 생성하는 데 그치지 않고 -- 스키마를 런타임에 동적 Pydantic 모델로 변환합니다. 이 모델은 Pydantic-AI 에이전트의 구조화된 출력 타입으로 사용되며, 이는 LLM 출력이 타입 수준에서 스키마에 대해 검증됨을 의미합니다. 잘못된 출력은 자동 재시도를 트리거합니다.

이 접근 방식은 사용자 정의 스키마의 유연성과 컴파일된 모델의 타입 안전성을 결합합니다. 원하는 어떤 형태든 정의하면 시스템이 자동으로 이를 적용하므로, 두 가지 장점을 모두 누릴 수 있습니다.

첫 스키마 생성하기

JSON 샘플을 붙여넣고 모델을 선택하면 몇 초 만에 검증된 보강 스키마를 얻을 수 있습니다. 그런 다음 자연어나 시각적 편집기로 다듬으세요.

무료로 시작하기