Entity Enricher는 최대 40개 언어로 강화 결과를 동시에 생성할 수 있습니다. 다국어 필드는 언어를 키로 하는 JSON 객체로 저장되며 — 이 형식은 이식성이 뛰어나고, 조회가 가능하며, 모든 주요 데이터베이스와 호환됩니다.
스키마 편집기에서 임의의 문자열 또는 문자열 배열 속성에 다국어 플래그를 토글하세요. 활성화되면 LLM이 일반 값 대신 언어 키가 지정된 객체로 감싼 값을 반환합니다.
multilingual: true로 저장됩니다.multilingual: true로 표시되지 않은 필드)에 사용됩니다. 다른 칩을 기본으로 승격하려면 해당 칩의 ↑ 버튼을 사용하세요. 또한 백엔드는 선택에 포함되지 않은 언어 키를 LLM이 생성하더라도 걸러냅니다.dict[str, T]로 감싸며, 키는 ISO 639-1 언어 코드이고 값은 필드 타입과 일치합니다.다국어 값은 언어 코드를 키로 하는 JSON 객체로 저장됩니다. 이 형식은 이식성, 쿼리 용이성, 저장 효율성 덕분에 다른 대안보다 선택되었습니다.
multilingual: true가 없는 필드는 일반 값으로 반환됩니다. 식별자, 코드, URL, 날짜 및 숫자는 일반적으로 다국어가 아닌 상태로 유지됩니다.
다국어 배열에는 두 가지 접근 방식이 있습니다. Entity Enricher는 Format A(언어 키 기반 객체)를 사용하는데, 이는 변환 없이 모든 주요 데이터베이스에서 그대로 작동하는 유일한 형식이기 때문입니다.
| 기준 | A 언어 키 객체 | B 현지화된 항목 배열 |
|---|---|---|
| 구조 | {"en": [...], "fr": [...]} | [{"en": "x", "fr": "y"}, ...] |
| 한 가지 언어 조회 | 직접 액세스data -> 'field' -> 'en' | 반복이 필요합니다jsonb_array_elements + extract |
| 언어 추가 | 객체에 키 하나 추가 | 배열의 모든 항목 업데이트 |
| 스칼라 값과 일관됩니다 | 예 — 동일한 {"en": "...", "fr": "..."} 패턴 | 아니요 — 문자열과 배열의 형태가 다릅니다 |
| 데이터베이스 이식성 | 모든 주요 데이터베이스 | 모든 주요 데이터베이스 |
언어 키 형식은 JSON 열을 지원하는 모든 주요 데이터베이스에서 기본적으로 쿼리할 수 있습니다.
40개 언어를 사용할 수 있습니다. 인리치먼트를 실행할 때 원하는 조합을 선택하세요.
enEnglishzhChinesehiHindiesSpanisharArabicfrFrenchbnBengaliptPortugueseruRussianjaJapanesedeGermanurUrduviVietnamesetrTurkishkoKoreantaTamilmrMarathiteTelugupaPunjabiyueCantoneseitItalianplPolishukUkrainianroRomaniannlDutchelGreekcsCzechhuHungariansvSwedishsrSerbianbgBulgarianhrCroatianskSlovakdaDanishfiFinnishnoNorwegianltLithuanianslSlovenianlvLatvianetEstonian다국어 플래그는 특정 속성 유형에서만 유효합니다. 스키마 편집기가 이를 자동으로 적용합니다.
| 속성 유형 | 다국어 지원? | 출력 형식 |
|---|---|---|
| string | 예 | dict[str, str] |
| number / integer | 예 | dict[str, float] |
| boolean | 예 | dict[str, bool] |
| 기본형 배열 | 예 | dict[str, list[str]] |
| object | 아니요 | 대신 객체 내부의 개별 필드를 표시하세요 |
| 객체 배열 | 아니요 | 대신 항목 내부의 개별 필드를 표시하세요 |
| $ref | 아니요 | 대신 참조된 엔터티 내부의 필드를 표시하세요 |
다국어 지원이 보강 파이프라인의 모든 단계에 녹아 있습니다.
여러 모델의 결과를 융합할 때 다국어 필드는 언어별로 비교됩니다.
| 시나리오 | 해석 |
|---|---|
| 모델들이 영어에는 동의하지만 프랑스어에서는 차이를 보입니다 | 영어는 그대로 전달되고, 프랑스어는 다수결 또는 중재를 통해 언어별로 해결됩니다 |
| 한 모델은 아랍어를 지원하고 다른 모델은 지원하지 않습니다 | null이 아닌 값 우선 (아랍어 유지) |
| 다국어 배열의 길이가 모델마다 다릅니다 | 언어별 모든 항목의 합집합 |