معالجة الدفعات - توثيق Entity Enricher

معالجة الدفعات

أثرِ حتى 100 كيان بالتوازي مع تتبّع التقدّم في الوقت الفعلي والدمج التلقائي متعدد النماذج والتصدير إلى JSON أو Excel.

طرق الإدخال

يدعم الإثراء بالدفعات طريقتين لتوفير بيانات الكيانات:

محرّر JSON

الصق أو اكتب مصفوفة JSON من الكيانات مباشرة. يوفّر المحرّر تمييز بناء الجملة، وعلامات التحقق، ويحفظ بياناتك عبر الجلسات في التخزين المحلي.

[
  { "name": "Sanofi", "country": "France" },
  { "name": "Pfizer", "country": "USA" },
  { "name": "Novartis", "country": "CH" }
]

جلب URL

جلب الكيانات من أي نقطة نهاية REST API. يستخرج النظام المصفوفات تلقائيًا من أغلفة الاستجابة الشائعة.

المصادقة المدعومة:

لا شيءرمز Bearerترويسة مفتاح APIالمصادقة الأساسية

إذا أعاد الـ API كائنًا، يفحص النظام مفاتيح مثل data وresults وitems بحثًا عن مصفوفة مضمّنة.

اختيار الكيان والتحقق منه

بعد تحميل الكيانات، تظهر في قائمة قابلة للتحديد مع حالة التحقق. يمكنك اختيار الكيانات التي تريد تضمينها في الدفعة:

تحديد متعدد— انقر لتحديد كيانات فردية. Shift+نقر لتحديد النطاقات. Ctrl+A لتحديد الكل، Ctrl+D لإلغاء تحديد الكل.

التحرير المُضمَّن— انقر على حقول مفاتيح البحث (الاسم، الدولة، إلخ) لتحريرها مباشرةً في القائمة قبل الإثراء.

التحقق— يُتحقّق من كل كيان مقابل مفاتيح البحث الخاصة بالمخطط. يجب ملء مفتاح بحث واحد على الأقل. تُظهر الكيانات غير الصالحة تحذيرات لكن يمكن اختيارها مع ذلك.

المعالجة الانتقائية— تُرسل الكيانات المحددة فقط للإثراء. ألغِ تحديد الكيانات التي لا ترغب في معالجتها.

التهيئة

يعكس الشريط الجانبي خيارات إعداد الإثراء الفردي:

خيار	الوصف
المخطط	الـ schema المستهدف الذي يحدد بنية مخرجات الإثراء
الاستراتيجية	تمريرة واحدة، أو مجالات خبيرة، أو خبرات متعددة (استدعاءات متوازية لكل مجال)
النماذج	نموذج ذكاء اصطناعي واحد أو أكثر لتشغيله لكل كيان. تعدد النماذج يتيح الدمج التلقائي.
اللغات	اللغات المستخدمة في إثراء الحقول متعدد اللغات (مثل الإنجليزية + الفرنسية)
التصنيف	نموذج سريع اختياري للتحقق من نوع الكيان قبل الإثراء
التحكيم	نموذج لحل التعارضات المعتمد على LLM أثناء الدمج. إذا لم يُحدَّد، يُستخدم دمج قائم على القواعد.

تقدير التكلفة

قبل بدء الدفعة، يعرض مربع حوار تأكيد تقديرًا للتكلفة وملخصًا. يُحسب التقدير بناءً على عدد الخصائص، وتسعير النموذج، وعدد الكيانات والنماذج المحددة. يظهر تحذير عندما يتجاوز إجمالي عدد استدعاءات الـ LLM حد 100.

الكيانات

النماذج

إجمالي الاستدعاءات

~40

التكلفة التقديرية

~$1.50

التنفيذ المتوازي

تُعالَج جميع الكيانات المحددة في آنٍ واحد. ويمرّ كل كيان عبر مسار الإثراء الكامل بشكل مستقل:

خط معالجة لكل كيان

التصنيف (اختياري) — يتحقق نموذج سريع من نوع الكِيان. في وضع الدُّفعات، لا تُوقِف حالات عدم التطابق المهمة؛ ويُمرَّر السياق.
الإثراء متعدد النماذج — يُثري كل نموذج محدد الكيان بالتوازي، مع تحديد للمعدل لكل مزوّد.
الدمج التلقائي (عند نجاح نموذجين أو أكثر) — تُدمج النتائج تلقائيًا باستخدام اكتشاف التعارضات وحلّها.

تحديد المعدل

يمنع محدِّد المعدل العام إغراق مزوّدي الذكاء الاصطناعي. تشترك جميع الكيانات في حدود التزامن نفسها لكل مزوّد (عادةً 5 استدعاءات متزامنة لكل مزوّد). مع 20 كيانًا ونموذجين، يعمل ما يصل إلى 5 استدعاءات متزامنة لكل مزوّد — وينتظر الباقي توفّر الإتاحة. يضمن ذلك تنفيذًا موثوقًا دون بلوغ حدود معدل API.

تقدّم آني

تعرض لوحة النتائج التقدّم المباشر باستخدام أحداث الخادم المُرسلة (SSE). لكل كيان بطاقة قابلة للطي تتحدّث في الوقت الفعلي:

قيد الانتظار

بانتظار بدء المعالجة

قيد التشغيل

قيد الإثراء حاليًا، مع شارات تقدّم الخبرة التي تُظهر نسبة الإكمال لكل مجال

مكتمل

اكتملت جميع النماذج بنجاح. تُطوى البطاقة تلقائيًا.

جزئي

فشلت بعض النماذج أو الخبرات. تتوفر نتائج جزئية.

فشل

فشلت جميع النماذج لهذا الكيان. تُعرَض تفاصيل الخطأ.

الإلغاء ومعالجة الأخطاء

يمكنك إلغاء دفعة قيد التشغيل في أي وقت. الإلغاء تعاوني — تُكمل الكيانات الجارية بالفعل استدعاء LLM الحالي، لكن لا تبدأ أي استدعاءات جديدة. تُحفَظ النتائج الجزئية من الكيانات المكتملة.

المرونة تجاه الأخطاء

صُممت معالجة الدفعات لتكون مرنة. لا توقف حالات الفشل الفردية الدفعة:

إذا فشل التصنيف لكيان ما، يستمر الإثراء دون سياق
إذا فشل نموذج واحد، تستمر النماذج الأخرى لذلك الكيان
إذا فشلت جميع النماذج لكيان ما، يُوسَم بأنه فاشل بينما تستمر الكيانات الأخرى
يُلغى تفعيل النماذج التي تُعيد أخطاء ”غير موجود“ تلقائيًا

صيغ التصدير

بعد اكتمال الدفعة، صدّر النتائج بثلاث صيغ. لكل كيان، يُفضَّل نتيجة الدمج إن كانت متاحة؛ وإلا فتُستخدم نتيجة أفضل نموذج.

ملف JSON

نزّل النتائج الكاملة كملف JSON منظم يحتوي على جميع بيانات الكيانات ومخرجات النماذج وبيانات دمج الوصفية.

الحافظة

انسخ نتائج JSON مباشرة إلى الحافظة للصقها في أدوات أو نصوص برمجية أخرى.

Excel

مصنّف من ثلاث أوراق: النتائج (صف واحد لكل كيان بخصائص مُسطَّحة)، والملخص (بيانات الدفعة الوصفية والنماذج والتكاليف)، والتعارضات (تفاصيل التعارض لكل كيان مع تعليل الحل).

الحدود

الحد	القيمة
الحد الأقصى للكيانات لكل دفعة	100
الحد الأقصى لحجم بيانات الكيان	50٬000 حرف
الحد الأقصى لطول المُوجِّه	100,000 حرف
انتهت مهلة جلب URL	30 ثانية