توليد المخطط بالذكاء الاصطناعي - وثائق Entity Enricher

توليد المخطط بالذكاء الاصطناعي

توليد مخططات JSON مُهيكلة من بيانات نموذجية باستخدام الذكاء الاصطناعي، مع التصحيح الذاتي التلقائي والمعالجة اللاحقة الذكية.

كيف يعمل

يحوّل توليد المخطط بيانات الكيان الخام إلى مخطط JSON مُصنّف ومُوثّق يحدد بدقة المعلومات المطلوب استخلاصها أثناء الإثراء. فبدلاً من كتابة المخططات يدوياً، تلصق عينة JSON وتدع الذكاء الاصطناعي يحلل البنية، ويستنتج الأنواع، ويخصص مجالات الخبرة، ويقترح التحسينات.

مسار التوليد

  1. المعالجة الأولية للإدخال — يُحلَّل نموذج JSON الخاص بك. تُختزل الكائنات المُترجَمة (مثل {"en": "...", "fr": "..."}) إلى قيمة واحدة، ويحدد عدد الخصائص كم عدد مجالات الخبرة المسموح بها.
  2. إنشاء الموجّه — يُبنى موجّه نظام تكيّفي بناءً على مدى تعقيد بياناتك: هل تحتوي على كائنات متداخلة، وكم عدد الخصائص التي تتضمنها، وهل تم اكتشاف حقول متعددة اللغات.
  3. التوليد بـ LLM مع التصحيح الذاتي — يولّد الذكاء الاصطناعي المخطط. إذا فشلت أيٌّ من قواعد التحقق الثماني، تُرسَل الأخطاء إلى الذكاء الاصطناعي للتصحيح — بحد أقصى 6 محاولات إجمالًا.
  4. المعالجة اللاحقة — قواعد حتمية تصقل المخطط: تحديد الحقول القابلة للإفراغ، ومسح مفاتيح البحث الفارغة، وجمع بيانات الخبرة الوصفية.
  5. الحفظ التلقائي — يُحفظ المخطط المُولَّد تلقائيًا وتُزال التكرارات باستخدام تجزئة المحتوى، فلا تتكرر المخططات المتطابقة.

حلقة التصحيح الذاتي

حلقة التصحيح الذاتي هي ما يجعل توليد المخطط موثوقًا. بعد أن يُنتج الذكاء الاصطناعي مخططًا، يمرّ عبر مُدقِّق يتحقق من 8 قواعد تغطي صحة الأنواع، وتعيين الخبرة، وسلامة المراجع، واكتمال البيانات. إذا فشلت أي قاعدة، تُرسَل رسالة الخطأ المحدّدة إلى الذكاء الاصطناعي ليصلح المشكلة في محاولته التالية.

مثال على التصحيح الذاتي

المحاولة 1يُولّد الذكاء الاصطناعي المخطط. يكتشف المُدقّق: revenue: عدم تطابق في النوع — الإدخال رقم لكن المخطط يقول 'string'
إعادة المحاولةيُعاد إرسال الخطأ إلى الذكاء الاصطناعي مع سياق حول ما حدث من خلل.
المحاولة 2يصحّح الذكاء الاصطناعي النوع إلى number. تنجح جميع القواعد الثماني. يُقبَل المخطط.

هذا النهج أكثر موثوقية بكثير من مطالبة الذكاء الاصطناعي بأن "يتوخى الحذر بشأن الأنواع" في المُوجّه. يلتقط المُدقِّق الأخطاء الملموسة ويقدّم للذكاء الاصطناعي ملاحظات دقيقة لإصلاحها. تعرّف على المزيد حول كل قاعدة في دليل قواعد التحقق.

ما الذي يحتويه المخطط

المخطط المُولَّد أكثر من مجرد تعريف نوع بسيط. تتضمن كل خاصية بيانات وصفية توجّه عملية الإثراء:

النوع

نوع مخطط JSON (string، number، integer، boolean، array، object)

الوصف

وصف سياقي يخبر الذكاء الاصطناعي بالمعلومات التي ينبغي البحث عنها

الخبرة

أي مجال خبرة (مالي، تنظيمي، إلخ) يوفّر هذه القيمة

مفتاح البحث

ما إذا كان هذا الحقل يُعرّف الكيان (بحث) أم يزيل التكرار من المصفوفات (دمج)

قابل للإبطال (Nullable)

ما إذا كان الحقل يمكن أن يكون null، مما يمنع إعادات المحاولة غير الضرورية للبيانات الاختيارية

متعدد اللغات

ما إذا كان ينبغي إثراء الحقل عبر لغات متعددة

الحفاظ

ما إذا كان يجب إبقاء القيمة الأصلية دون تغيير أثناء الإثراء

أمثلة

قيم أمثلة واقعية توجّه الذكاء الاصطناعي نحو التنسيق الصحيح

اكتشاف مجال الخبرة

يجمّع الذكاء الاصطناعي خصائص المخطط في مجالات خبرة بناءً على معناها الدلالي. على سبيل المثال، قد يحتوي مخطط شركة أدوية على مجالات مثل ”محلل مالي“ و”خبير تنظيمي“ و”معلومات الشركة“. وتستخدم استراتيجية الخبرات المتعددة هذه المجالات لتشغيل استدعاءات LLM متوازية ومتخصصة للحصول على نتائج أعمق.

حدود عدد المجالات

يُحدَّد عدد مجالات الخبرة تلقائيًا بناءً على عدد خصائص بياناتك لمنع التجزئة المفرطة:

5 خصائص
مجال واحد
12 خاصية
مجالان
30 خاصية
5 مجالات
60 خاصية
10 مجالات

المعالجة اللاحقة

بعد أن يولّد الذكاء الاصطناعي مخططًا صالحًا، تُنقّحه ثلاث خطوات معالجة لاحقة حتمية استنادًا إلى بيانات إدخالك الفعلية:

كشف القابلية للإبطال

الحقول ذات القيم الفارغة (null) في إدخالك تُعلَّم تلقائيًا كقابلة للإفراغ، بحيث لا يهدر الذكاء الاصطناعي إعادة المحاولات في محاولة ملئها.

مسح مفتاح البحث الفارغ

تُزال علامات مفتاح البحث من الحقول ذات القيم الفارغة (null، أو سلسلة فارغة، أو صفر) لأنها لا تساعد في تحديد الكيان.

مجموعة الخبرات

تُجمَع جميع مجالات الخبرة الفريدة من المخطط لأغراض المقاييس وإعداد الاستراتيجية.

تحرير المخطط بالذكاء الاصطناعي

بعد التوليد، يمكنك تعديل المخططات باستخدام تعليمات بلغة طبيعية. اكتب أمرًا فيطبّق الذكاء الاصطناعي التغيير مع الحفاظ على بنية مخططك الحالية. ينتج عن كل تعديل أيضًا 5 اقتراحات لمزيد من التحسينات.

أمثلة على أوامر التحرير

أضف حقل عدد صحيح employee_count
أنشئ كائن عنوان متداخل يحتوي على المدينة والدولة
أضف أوصافاً بالفرنسية إلى جميع الحقول النصية
تعريف مرجع للشركة الأم باستخدام $defs
حدّد حقل الموقع الإلكتروني كقابل للقيمة الفارغة

يُتحقَّق من تعديلات الذكاء الاصطناعي باستخدام مجموعة فرعية من قواعد التوليد (فحص الأنواع، وسلامة المراجع، واتساق مجال الخبرة) دون مقارنتها ببيانات الإدخال، لأنك قد تضيف حقولًا أو تحذفها عمدًا.

اقتراحات الذكاء الاصطناعي

يُنتج كل من توليد المخطط والتحرير بالذكاء الاصطناعي 5 اقتراحات موجّهة تغطي فئات تحسين مختلفة:

اكتمال البياناتالحقول المفقودة التي يمكن أن تُثري الكيان الخاص بك
جودة البياناتأنماط التحقق، قيود التنسيق
العلاقاتبنى متداخلة، مراجع الكيانات عبر $defs
التدويلترجمات متعددة اللغات، دعم اللغات المحلية
السياق التجاريالحقول الخاصة بالمجال وتجميعات مجال الخبرة

تظهر الاقتراحات كرقائق قابلة للنقر في محرّر المخطط — انقر على إحداها لملء حقل تعديل الذكاء الاصطناعي تلقائيًا وتطبيقه.

الخطوات التالية