توليد المخطط بالذكاء الاصطناعي - Entity Enricher

توليد المخطط بالذكاء الاصطناعي

الصق أي عيّنة بيانات JSON ودع الذكاء الاصطناعي يُنشئ مخطط إثراء مُنمّطًا بالكامل — مكتملاً بمجالات الخبرة، ومفاتيح البحث، واكتشاف الحقول متعددة اللغات، وقواعد التحقق. تتضمن عملية الإنشاء ما يصل إلى 6 محاولات للتصحيح الذاتي، لضمان صحة المخطط قبل أن تراه.

مسار توليد المخطط

الخطوة 1

الصق عيّنة JSON

أي كائن أو مصفوفة JSON يمثّل بيانات الكيان الخاصة بك

الخطوة 2

الذكاء الاصطناعي يُولّد المخطط

يحلّل LLM أنواع البيانات والتداخل وأنماط التسمية ومجال الخبرة

الخطوة 3

تحقق من 8 قواعد

1.صحة النوع
2.صحة هدف $ref
3.تعيين الخبرة
4.حدود عدد مجالات الخبرة
5.صلاحية مفتاح البحث
6.تسمية الخصائص
7.عمق البنية المتداخلة
8.قيود الحقول المطلوبة

في حال فشل التحقق، تُعاد الأخطاء إلى LLM للتصحيح الذاتي (حتى 6 محاولات إعادة)

الخطوة 4

المعالجة اللاحقة

كشف القابلية للإبطال، وخفض مفتاح البحث، وجمع مجال الخبرة

الإخراج

مخطط الإثراء المُتحقق منه

جاهز للإثراء بخصائص مُصنّفة النوع ومجالات خبرة ومفاتيح بحث

التصحيح الذاتي عبر ModelRetry

تُنتج نماذج LLM أحياناً مخططات schema بها مشكلات بنيوية — عدم تطابق في النوع بين الـ schema وبيانات الإدخال، أو $ref يشير إلى تعريف غير موجود، أو عدد مفرط من مجالات الخبرة. يستخدم Entity Enricher آلية ModelRetry من Pydantic-AI لاكتشاف هذه المشكلات وإعادتها إلى LLM لتصحيحها ضمن نفس دورة التوليد.

يحدث هذا بشفافية. يتحقق النظام من مُخرَجات LLM مقابل 8 قواعد، وإذا فشلت أي قاعدة، تُعاد الأخطاء المحددة إلى النموذج مع تعليمات لإصلاحها. تعمل حلقة إعادة المحاولة هذه حتى 6 مرات، محقّقةً مُخرَجات مخطط صالحة بنسبة تقارب 100% دون تدخل يدوي.

قواعد التحقق المطبّقة

صحة النوع

يجب أن تتطابق أنواع خصائص المخطط مع أنواع البيانات المرصودة من JSON المُدخل.

سلامة $ref

يجب أن تشير جميع مؤشرات $ref إلى كيانات مُعرَّفة في قسم $defs.

تعيين الخبرة

يجب أن تنتمي كل خاصية إلى مجال خبرة صالح.

عدد الخبرات

يجب أن يبقى إجمالي مجالات الخبرة ضمن الحدود القابلة للتهيئة.

صلاحية مفتاح البحث

يجب أن تشير مفاتيح البحث إلى خصائص موجودة ذات قيم غير فارغة.

تسمية الخصائص

يجب أن تتبع أسماء الخصائص اصطلاح snake_case.

عمق البنية

يجب أن يبقى عمق التداخل ضمن الحدود (10 مستويات افتراضيًا).

قيود الحقل

يتم التحقق من الحقول المطلوبة والقيم الدنيا/القصوى وقيود التعداد.

معالجة لاحقة ذكية

بعد أن يولّد LLM المخطط ويصحّحه ذاتيًا، تُطبَّق تحويلات إضافية مدفوعة بالبيانات:

كشف القابلية للإبطال

إذا كانت بيانات المدخلات تحتوي على قيم فارغة (null) لحقل ما، تُوسَم خاصية المخطط تلقائيًا بأنها قابلة للإفراغ. يتيح ذلك لنماذج LLM إرجاع null للحقول التي تكون بياناتها غير متوفرة، بدلًا من فرض قيم مُهلوَسة.

خفض مفتاح البحث

الحقول المُعلَّمة كمفاتيح بحث لكن بقيم فارغة في بيانات الإدخال تُزال منها علامة مفتاح البحث. يمنع ذلك مفاتيح البحث الفارغة من تشتيت تركيز مُوجّه الإثراء.

مجموعة الخبرات

تُجمَع جميع مجالات الخبرة من الخصائص المتداخلة في قائمة على المستوى الأعلى، مما يسهّل رؤية تغطية المجالات في مخططك بلمحة واحدة.

تحرير المخططات باللغة الطبيعية

بعد توليد مخطط، يمكنك تعديله باستخدام تعليمات بلغة طبيعية. اكتب شيئًا مثل "أضف مرجع parent_company مع name وownership_percentage" فيطبّق الذكاء الاصطناعي التغيير البنيوي مع الحفاظ على جميع قواعد التحقق وتعيينات مجال الخبرة.

كما ينتج كل تعديل بالذكاء الاصطناعي 5 اقتراحات للتحسين — أمور مثل إضافة الحقول الناقصة، أو تحسين الأوصاف، أو إعادة تنظيم مجالات الخبرة. ويمكنك تطبيق هذه الاقتراحات بنقرة واحدة.

للتحكم المباشر، يوفّر محرر المخطط المرئي ترتيب الخصائص بالسحب والإفلات، وتحرير الحقول المضمّن، والتنقل عبر لوحة المفاتيح، ودعماً كاملاً للتراجع والإعادة. راجع وثائق محرر المخطط للمزيد من التفاصيل.

من المخطط إلى مخرجات آمنة الأنواع

لا يكتفي Entity Enricher بإنشاء مستند مخطط JSON فحسب — بل يحوّل مخططك إلى نموذج Pydantic ديناميكي في وقت التشغيل. ويُستخدم هذا النموذج بعد ذلك كنوع الإخراج المنظّم لوكلاء Pydantic-AI، ما يعني التحقق من صحة إخراج LLM مقابل مخططك على مستوى النوع. وتؤدي المخرجات غير الصالحة إلى إعادة محاولات تلقائية.

يجمع هذا النهج بين مرونة المخططات المُعرَّفة من المستخدم وأمان الأنواع في النماذج المُترجَمة. تحصل على أفضل ما في العالمَين: عرّف أي شكل تريده، ويفرضه النظام تلقائيًا.

ولّد مخططك الأول

الصق عيّنة JSON، واختر نموذجًا، واحصل على مخطط إثراء مُتحقَّق منه في ثوانٍ. ثم نقّحه باستخدام اللغة الطبيعية أو المحرّر المرئي.

ابدأ مجانًا