التصنيف المسبق - توثيق Entity Enricher

التصنيف المسبق

يتحقق التصنيف المسبق من أن الكيان يطابق نوع المخطط المتوقع قبل بدء الإثراء. تمنع هذه الخطوة الاختيارية الهلوسة وإهدار الرموز عندما لا تطابق الكيانات مخططك.

لماذا التصنيف قبل الإثراء؟

نماذج LLM حريصة على المساعدة. فعندما يُطلب منها إثراء كيان وفق schema، تُنتج مخرجات مُهيكلة حتى لو كان الكيان لا يطابق نوع الـ schema على الإطلاق. ويؤدي ذلك إلى بيانات مُهلوَسة تبدو معقولة لكنها خاطئة تماماً.

مشكلة الهلوسة

بدون تصنيف

المخطط: ”كوكب“ — الكيان: ”تيتان“

يتعامل نموذج LLM مع Titan على أنه كوكب ويختلق بيانات: الفترة المدارية، وتركيب الغلاف الجوي، وعدد الأقمار — كلّها تبدو معقولة لكنها خاطئة. Titan في الواقع قمر تابع لكوكب زحل.

مع التصنيف

يكتشف التصنيف: «عدم تطابق — تيتان قمر، وليس كوكبًا»

تستقبل نماذج الإثراء هذا السياق، وتضبط الحقول غير ذات الصلة على null، وتملأ فقط الخصائص التي تنطبق فعلاً على الكيان.

كيف يعمل

يعمل التصنيف كنداء LLM واحد وسريع قبل بدء أي من نماذج الإثراء. ويستخدم نموذجًا سريعًا ومنخفض التكلفة (مثل Claude Haiku أو GPT-4o Mini) لتقليل التكلفة.

إرسال نوع المخطط وبيانات الكيان

يستقبل نموذج التصنيف اسم المخطط ووصفه وبيانات الكيان (مقتطعة إلى 3,000 حرف للحفاظ على انخفاض التكاليف).

تلقّي تصنيف مُنظَّم

يُرجِع النموذج استجابة مُهيكلة تتضمّن حالة (تطابق، أو عدم تطابق، أو غير معروف، أو غامض)، ووصفًا لما يمثّله الكيان فعليًا، ومستوى الثقة، والتعليل.

حقن السياق في الإثراء

تُضاف نتيجة التصنيف إلى بداية كل مُوجّه إثراء كقسم ”تصنيف مبدئي“. يمنح هذا نماذج الإثراء سياقًا حاسمًا حول نوع الكيان.

أربع حالات تصنيف

مطابقة

يطابق الكيان نوع المخطط. يستمر الإثراء بثقة عالية.

أثر المُوجّه

يؤكّد نوع الكيان ويوفّر سياقًا إضافيًا لنماذج الإثراء.

مثال

المخطط "Pharmaceutical Company"، الكيان "Sanofi" — تم تأكيده كشركة أدوية.

عدم تطابق

الكيان من نوع مختلف عمّا يتوقعه المخطط. يوضح التصنيف ماهية الكيان فعلاً.

أثر المُوجّه

ينبّه نماذج الإثراء إلى أن الكيان غير مطابق. ويوجّهها إلى استخدام null للحقول غير ذات الصلة.

مثال

المخطط "Planet"، الكيان "Titan" — تم تحديده كقمر لكوكب زحل، وليس كوكباً.

غير معروف

لا يمكن التعرف على الكيان بيقين. لا يملك LLM معلومات كافية لتصنيفه.

أثر المُوجّه

يوجّه نماذج الإثراء إلى استخدام null عند عدم اليقين بدلًا من التخمين.

مثال

المخطط "Pharmaceutical Company"، الكيان "XYZ Corp" — لا توجد معلومات كافية لتحديد نوع الكيان.

غامض

توجد تفسيرات صحيحة متعددة. ويسرد التصنيف البدائل.

أثر المُوجّه

يعرض التفسيرات المحتملة ويطلب من نماذج الإثراء اختيار الأرجح.

مثال

المخطط "Company"، الكيان "Mercury" — قد يكون الكوكب أو العنصر أو Mercury Insurance.

الخصائص المفتاحية

غير حاجب

التصنيف استشاري بحت. فإذا فشل نداء التصنيف لأي سبب (خطأ في النموذج، أو انتهاء المهلة، أو حدّ المعدل)، يتابع الإثراء بشكل طبيعي دون سياق التصنيف. وهذا يضمن ألا تمنع خطوة التصنيف الاختيارية اكتمال الإثراء أبدًا.

فعّال من حيث التكلفة

صُمِّم التصنيف ليعمل على نماذج سريعة ومنخفضة التكلفة. فهو يرسل حمولة قليلة (اسم المخطط، والوصف، وبيانات الكيان المقتطعة) ويتوقّع استجابة مُهيكلة صغيرة. والتكلفة النموذجية جزء يسير من تكلفة الإثراء نفسه — وهي جديرة تمامًا بتحسين الدقة.

تغذية راجعة آنية

تعرض الواجهة تقدّم التصنيف في الوقت الفعلي عبر أحداث Server-Sent Events. يُطلَق حدث classification_started عند بدء الفحص، يليه classification_completed مع الحالة ودرجة الثقة ووصف الكيان. وتظهر النتيجة كشريط أعلى نتائج النماذج.

قابل للإلغاء

إذا ألغيت الإثراء أثناء مرحلة التصنيف، تتوقف المهمة فورًا دون تشغيل أي نماذج إثراء. ولا تُنفق أي رموز غير ضرورية.

متى تُفعّل التصنيف

موصى به

المخططات ذات نوع كيان ضيّق (مثل ”شركة أدوية“)
بيانات مُدخلة قد تحتوي على أنواع كيانات مختلطة
الإثراء بالدفعات باستخدام كيانات من مصادر متنوعة
عند استخدام نماذج إثراء باهظة التكلفة ورغبتك في تجنب الهدر

غير ضروري

مخططات عامة تقبل أي كيان (مثل «Organization»)
بيانات إدخال منسّقة تتحكم فيها بنوع الكيان
تكرارات سريعة حيث تكون السرعة أهم من الدقة
المخططات التي تفتقر إلى تعريف واضح لنوع الكيان

كيفية التفعيل

في محرر المخططات أو الشريط الجانبي للإثراء بالدُفعات، ابحث عن قائمة ”التصنيف“ المنسدلة. اختر نموذجًا سريعًا ومنخفض التكلفة (Claude Haiku أو GPT-4o Mini أو ما شابه). سيُجرى التصنيف تلقائيًا قبل بدء الإثراء لكل كيان.

عند استخدام واجهة REST API، ضمّن الحقل classification_model في طلب الإثراء مع المفتاح المركّب للنموذج (مثل anthropic::claude-haiku-4-5).

تدفّق الإثراء

شرح كامل لمسار المعالجة

الاستراتيجيات

التمريرة الواحدة مقابل الخبرات المتعددة

دمج متعدد النماذج

دمج النتائج من نماذج متعددة