يمكن لـ Entity Enricher إنتاج نتائج الإثراء بما يصل إلى 40 لغة في آنٍ واحد. وتُخزَّن الحقول متعددة اللغات ككائنات JSON مفهرسة حسب اللغة — وهي صيغة قابلة للنقل والاستعلام ومتوافقة مع كل قاعدة بيانات رئيسية.
في محرر المخططات، بدّل عَلَم متعدد اللغات على أي خاصية سلسلة نصية أو مصفوفة سلاسل نصية. عند تفعيله، يُعيد LLM القيم مغلَّفة في كائن مفتاحه اللغة بدلًا من قيمة عادية.
multilingual: true في مخطط JSON.multilingual: true). استخدم زر ↑ على أي شريحة أخرى لترقيتها إلى أساسية. كما تقوم الواجهة الخلفية بتصفية أي مفاتيح لغات دخيلة قد يُصدرها نموذج LLM وليست ضمن اختيارك.dict[str, T]، حيث تكون المفاتيح رموز لغات ISO 639-1 والقيم مطابقة لنوع الحقل.تُخزَّن القيم متعددة اللغات ككائنات JSON برموز اللغات كمفاتيح. وقد اختير هذا التنسيق دون البدائل لقابليته للنقل والاستعلام وكفاءته في التخزين.
الحقول التي لا تحمل multilingual: true تُعاد كقيم عادية. عادةً ما تبقى المعرّفات والرموز وعناوين URL والتواريخ والأرقام غير متعددة اللغات.
يوجد نهجان للمصفوفات متعددة اللغات. يستخدم Entity Enricher Format A (كائن مُفهرَس باللغة) لأنه التنسيق الوحيد الذي يعمل كما هو عبر جميع قواعد البيانات الرئيسية دون تحويل.
| المعايير | A كائن مفهرس حسب اللغة | B مصفوفة من العناصر المُترجمة محليًا |
|---|---|---|
| البنية | {"en": [...], "fr": [...]} | [{"en": "x", "fr": "y"}, ...] |
| استعلم عن لغة واحدة | وصول مباشرdata -> 'field' -> 'en' | يتطلب التكرارjsonb_array_elements + extract |
| إضافة لغة | أضف مفتاحًا واحدًا إلى الكائن | تحديث كل عنصر في المصفوفة |
| متسق مع القيم القياسية | نعم — النمط نفسه {"en": "...", "fr": "..."} | لا — شكل مختلف للسلاسل النصية مقابل المصفوفات |
| قابلية نقل قاعدة البيانات | جميع قواعد البيانات الرئيسية | جميع قواعد البيانات الرئيسية |
التنسيق المُفهرَس باللغة قابل للاستعلام أصليًا في جميع قواعد البيانات الرئيسية التي تدعم أعمدة JSON.
تتوفر 40 لغة. اختر أي مجموعة منها عند تشغيل عملية إثراء.
enEnglishzhChinesehiHindiesSpanisharArabicfrFrenchbnBengaliptPortugueseruRussianjaJapanesedeGermanurUrduviVietnamesetrTurkishkoKoreantaTamilmrMarathiteTelugupaPunjabiyueCantoneseitItalianplPolishukUkrainianroRomaniannlDutchelGreekcsCzechhuHungariansvSwedishsrSerbianbgBulgarianhrCroatianskSlovakdaDanishfiFinnishnoNorwegianltLithuanianslSlovenianlvLatvianetEstonianعلَم تعدّد اللغات صالح فقط على أنواع خصائص معيّنة. ويفرض محرّر المخطّط ذلك تلقائيًا.
| نوع الخاصية | متعدد اللغات؟ | تنسيق الإخراج |
|---|---|---|
| string | نعم | dict[str, str] |
| number / integer | نعم | dict[str, float] |
| boolean | نعم | dict[str, bool] |
| مصفوفة من القيم الأوّلية | نعم | dict[str, list[str]] |
| object | لا | حدّد الحقول الفردية داخل الكائن بدلًا من ذلك |
| مصفوفة من الكائنات | لا | حدّد الحقول الفردية داخل العناصر بدلًا من ذلك |
| $ref | لا | حدّد الحقول داخل الكيان المُشار إليه بدلًا من ذلك |
دعم تعدد اللغات منسوج في كل مرحلة من مراحل مسار الإثراء.
عند دمج النتائج من نماذج متعددة، تُقارَن الحقول متعددة اللغات لكل لغة على حدة.
| السيناريو | الحل |
|---|---|
| تتفق النماذج على الإنجليزية لكنها تختلف على الفرنسية | تمر الإنجليزية دون تغيير؛ وتُحسم الفرنسية لكل لغة عبر التصويت بالأغلبية أو التحكيم |
| أحد النماذج يدعم العربية والآخر لا | تفضيل القيمة غير الفارغة (يُحتفظ بالعربية) |
| تختلف المصفوفات متعددة اللغات في الطول حسب النموذج | اتحاد جميع العناصر لكل لغة |