يتحقق التصنيف المسبق من أن الكيان يطابق نوع المخطط المتوقع قبل بدء الإثراء. تمنع هذه الخطوة الاختيارية الهلوسة وإهدار الرموز عندما لا تطابق الكيانات مخططك.
نماذج LLM حريصة على المساعدة. فعندما يُطلب منها إثراء كيان وفق schema، تُنتج مخرجات مُهيكلة حتى لو كان الكيان لا يطابق نوع الـ schema على الإطلاق. ويؤدي ذلك إلى بيانات مُهلوَسة تبدو معقولة لكنها خاطئة تماماً.
المخطط: ”كوكب“ — الكيان: ”تيتان“
يتعامل نموذج LLM مع Titan على أنه كوكب ويختلق بيانات: الفترة المدارية، وتركيب الغلاف الجوي، وعدد الأقمار — كلّها تبدو معقولة لكنها خاطئة. Titan في الواقع قمر تابع لكوكب زحل.
يكتشف التصنيف: «عدم تطابق — تيتان قمر، وليس كوكبًا»
تستقبل نماذج الإثراء هذا السياق، وتضبط الحقول غير ذات الصلة على null، وتملأ فقط الخصائص التي تنطبق فعلاً على الكيان.
يعمل التصنيف كنداء LLM واحد وسريع قبل بدء أي من نماذج الإثراء. ويستخدم نموذجًا سريعًا ومنخفض التكلفة (مثل Claude Haiku أو GPT-4o Mini) لتقليل التكلفة.
يطابق الكيان نوع المخطط. يستمر الإثراء بثقة عالية.
الكيان من نوع مختلف عمّا يتوقعه المخطط. يوضح التصنيف ماهية الكيان فعلاً.
لا يمكن التعرف على الكيان بيقين. لا يملك LLM معلومات كافية لتصنيفه.
توجد تفسيرات صحيحة متعددة. ويسرد التصنيف البدائل.
التصنيف استشاري بحت. فإذا فشل نداء التصنيف لأي سبب (خطأ في النموذج، أو انتهاء المهلة، أو حدّ المعدل)، يتابع الإثراء بشكل طبيعي دون سياق التصنيف. وهذا يضمن ألا تمنع خطوة التصنيف الاختيارية اكتمال الإثراء أبدًا.
صُمِّم التصنيف ليعمل على نماذج سريعة ومنخفضة التكلفة. فهو يرسل حمولة قليلة (اسم المخطط، والوصف، وبيانات الكيان المقتطعة) ويتوقّع استجابة مُهيكلة صغيرة. والتكلفة النموذجية جزء يسير من تكلفة الإثراء نفسه — وهي جديرة تمامًا بتحسين الدقة.
تعرض الواجهة تقدّم التصنيف في الوقت الفعلي عبر أحداث Server-Sent Events. يُطلَق حدث classification_started عند بدء الفحص، يليه classification_completed مع الحالة ودرجة الثقة ووصف الكيان. وتظهر النتيجة كشريط أعلى نتائج النماذج.
إذا ألغيت الإثراء أثناء مرحلة التصنيف، تتوقف المهمة فورًا دون تشغيل أي نماذج إثراء. ولا تُنفق أي رموز غير ضرورية.
في محرر المخططات أو الشريط الجانبي للإثراء بالدُفعات، ابحث عن قائمة ”التصنيف“ المنسدلة. اختر نموذجًا سريعًا ومنخفض التكلفة (Claude Haiku أو GPT-4o Mini أو ما شابه). سيُجرى التصنيف تلقائيًا قبل بدء الإثراء لكل كيان.
عند استخدام واجهة REST API، ضمّن الحقل classification_model في طلب الإثراء مع المفتاح المركّب للنموذج (مثل anthropic::claude-haiku-4-5).