النماذج والتسعير - وثائق Entity Enricher

النماذج والتسعير

إدارة مزوّدي ونماذج LLM، ومزامنة النماذج من السجلات الخارجية، وإجراء فحوص السلامة، وتهيئة مفاتيح API لكل مؤسسة من أجل فوترة مستقلة.

إدارة المزوّدين

يدعم Entity Enricher مجموعة واسعة من مزوّدي LLM. ويمكن لكل مزوّد أن يمتلك عدّة نماذج بأسعار وقدرات وإعدادات فردية.

المزوّدون المدعومون

AnthropicOpenAIGoogleMistralDeepSeekGroqTogether AIFireworks AICoherexAINVIDIA NIMOllamaAzure OpenAI

أنواع المزوّدين

قياسييستخدم معظم المزوّدين (Anthropic وOpenAI وMistral وغيرهم) نقاط نهاية API قياسية مع مصادقة برمز الحامل (bearer token). كما يمكن للمزوّد القياسي أن يشير إلى نقطة نهاية مخصّصة متوافقة مع OpenAI — راجع نقاط النهاية المخصّصة والمؤسسية أدناه.
Azureيستخدم Azure OpenAI نقاط نهاية نشر مخصّصة مع تهيئة إصدار API.
Ollamaنسخ Ollama ذاتية الاستضافة مع عناوين نقاط نهاية مخصصة واكتشاف تلقائي للنماذج.

نقاط النهاية المخصّصة والمؤسسية

تُوجّه العديد من الفرق حركة LLM عبر بوابة ذكاء اصطناعي مؤسسية، أو نقطة نهاية إقليمية، أو مزوّد غير مدمج — على سبيل المثال وكيل LiteLLM مؤسسي، أو Cloudflare AI Gateway، أو Alibaba DashScope (لنماذج Qwen). تضيف هذه بوصفها مزوّد قياسي (متوافق مع OpenAI) خاص بها مع عنوان URL أساسي مخصص.

إضافة مزوّد بوابة

  1. أنشئ مزوّدًا باسم ليس من الأسماء المدمجة (مثل acme-openai-gw). الأسماء المدمجة مثل openai أو anthropic محجوزة.
  2. اختر النوع القياسي (المتوافق مع OpenAI) واملأ نقطة نهاية API المخصصة (عنوان URL الأساسي) — مثل https://gateway.example.com/v1. هذا الحقل مطلوب لأي مزوّد لا يملك Entity Enricher عميلًا مدمجًا له.
  3. أضف مفتاح البوابة بوصفه مفتاح مؤسسة لذلك المزوّد (مفاتيح API ← مفاتيح مزوّدي الذكاء الاصطناعي)، حتى تتم المحاسبة والتدوير على مستوى المؤسسة.
  4. أضف النماذج التي تخدمها البوابة. يُرسَل معرّف النموذج حرفيًا، لذا يجب أن يطابق تمامًا ما تتوقعه البوابة.

معلومة مفيدة

  • المزوّدون المدمجون يُخفون حقل نقطة النهاية. يعرف Anthropic وOpenAI وMistral وغيرهم من المزوّدين المعروفين نقطة النهاية الخاصة بهم مسبقًا، لذا لا شيء يحتاج إلى إعداد. وإذا أصبح مزوّد مخصص مدمجًا لاحقًا، فستظل نقطة النهاية المُخزّنة له مرئية حتى تتمكن من مسحها.
  • HTTPS عام فقط. يجب أن تكون نقاط النهاية عناوين URL عامة https://. تُرفض عناوين الاسترجاع الداخلي والنطاقات الخاصة (localhost، 10.x، 192.168.x) لمنع هجمات SSRF — يجب أن يكون الخادم المستضاف ذاتيًا قابلاً للوصول عبر الإنترنت. بالنسبة إلى Ollama محلي، استخدم نفق Ollama المخصص بدلاً من ذلك.
  • تنسيق نقل متوافق مع OpenAI. تُوجَّه الاستدعاءات إلى مزوّد مخصص عبر واجهة API المتوافقة مع OpenAI، لذا يجب أن تتحدث نقطة النهاية بروتوكول OpenAI /v1 (إكمالات المحادثة، /models).
  • اختبار الاتصال يفحص {endpoint}/models للتحقق من المفتاح وعنوان URL الأساسي قبل تشغيل عملية إثراء.

حدود التزامن (لكل مفتاح)

لكل مزوّد إعداد الحد الأقصى للاستدعاءات المتزامنة لكل مفتاح (تجاوزه لحد المعدّل). وهو يحدّد عدد استدعاءات الـ LLM التي يشغّلها مفتاح API واحد على التوازي — شاملاً كل تدفّق يستخدم المفتاح: توزيع الإثراء متعدد الخبرات، والتصنيف، والمفاضلة، وتوليد المخطط/العيّنة.

  • محدود لكل مفتاح، لا لكل مزوّد. يحصل كل مفتاح مؤسسة والمفتاح العام المشترك على ميزانية مستقلة خاصة به، بحيث لا تزاحم الاستدعاءات المتوازية لمفتاح ما استدعاءات مفتاح آخر أبدًا.
  • يعود إلى قيمة افتراضية معقولة عند تركه غير محدد (قيم افتراضية لكل مزوّد، عادةً 3–5 استدعاءات متزامنة).
  • يسري مفعوله في المهمة التالية — دون حاجة لإعادة التشغيل.

هذا منفصل عن حد أقصى عدد المهام المتزامنة في خطتك، الذي يحدّ عدد مهام الإثراء التي تشغّلها مؤسستك بالكامل في آنٍ واحد عبر جميع المزوّدين.

قدرات النموذج

يتتبّع كل نموذج قدراته، التي تُعرض على شكل أيقونات في مُحدِّد النماذج:

القدرةالوصف
الرؤيةيمكنه معالجة الصور والمدخلات المرئية
استدعاءات الأدواتيدعم استدعاء الدوال / استخدام الأدوات
الإدخال الصوتييمكنه معالجة المدخلات الصوتية
إدخال PDFيمكنه معالجة مستندات PDF
التخزين المؤقت للمُوجّهيدعم تخزين الموجّه مؤقتًا لخفض التكلفة
الاستدلالقدرات التفكير الموسّع / سلسلة الأفكار

المزامنة التلقائية للأسعار

حافظ على تحديث تسعير النماذج عبر المزامنة من السجلات الخارجية. تكتشف عملية المزامنة النماذج الجديدة وتغييرات الأسعار والنماذج المُزالة تلقائياً.

سجل LiteLLM

مصدر التسعير الافتراضي. يجلب البيانات من سجل LiteLLM الذي يديره المجتمع على GitHub مع أسماء نماذج API الحقيقية والتسعير وأطوال السياق والقدرات.

يغطي ~30 مزوّدًا. لا يتضمن أسماء العرض أو معايير القياس أو سرعة التوليد.

PricePerToken

مصدر بديل من pricepertoken.com. يتضمن أسماء العرض، واختبارات الأداء (درجات البرمجة والرياضيات)، وسرعة التوليد (عدد الرموز في الثانية).

يغطي ~20 مزوّدًا. يوفّر بيانات وصفية أغنى من LiteLLM.

عملية المزامنة

  1. معاينة التشغيل التجريبي — اطّلع على ما سيتغير قبل التطبيق. اعرض النماذج الجديدة وتحديثات الأسعار وعمليات التعطيل.
  2. مطابقة محدودة النطاق بالمصدر — يؤثّر كل مصدر فقط في النماذج التابعة له. لا تُمَسّ النماذج اليدوية أبدًا.
  3. مفاتيح مزامنة ثابتة — تُطابَق النماذج بواسطة معرّف ثابت لا بالاسم. يمكنك إعادة تسمية النماذج دون كسر المزامنة.
  4. تطبيق معامَلاتي — تُطبَّق كل التغييرات في معامَلة قاعدة بيانات واحدة لضمان الاتساق.
  5. الإنشاء التلقائي للمزوّد — إذا كان النموذج المُزامَن ينتمي إلى مزوّد غير معروف، يُنشأ المزوّد تلقائيًا.

فحوصات صحة النموذج

تحقّق استباقياً من إمكانية الوصول إلى النماذج عبر تشغيل موجّه بسيط لفحص الصحة. يكتشف هذا النماذج المعطّلة قبل أن يواجه المستخدمون أخطاء أثناء الإثراء.

ناجحيستجيب النموذج بنجاح. إذا كان قد أُلغي تفعيله تلقائيًا سابقًا، فسيُعاد تفعيله.
غير موجوديُعيد النموذج خطأ ”غير موجود“. يُلغى تفعيله تلقائيًا لمنع الإخفاقات المستقبلية.
خطأ آخريتم الإبلاغ عن أخطاء المصادقة أو انتهاء المهلة أو حدود المعدّل، لكنها لا تؤدي إلى إلغاء التنشيط.

يمكن إجراء فحوص السلامة على جميع النماذج، أو على نماذج مزوّد محدّد، أو على نموذج واحد. تُبَثّ النتائج في الوقت الفعلي عبر SSE مع شريط تقدّم يعرض عدد حالات النجاح والفشل.

إلغاء التنشيط التلقائي

عندما يفشل استدعاء إثراء بخطأ ”النموذج غير موجود“، يُعطَّل النموذج تلقائيًا لمنع تكرار الإخفاقات. يحدث ذلك في الوقت الفعلي أثناء عمليات الإثراء العادية.

سبب إلغاء التفعيلحُدِّد بواسطةإعادة التنشيط تلقائيًا؟
النموذج غير موجودأخطاء الإثراء أو فحوصات السلامةنعم (عبر مزامنة الأسعار أو التحقق)
تمت إزالة المزامنةمزامنة التسعير (اختفى النموذج)نعم (إذا ظهر النموذج مجددًا في السجل)
يدويمفتاح تبديل للمشرف في الواجهةلا (إعادة التفعيل يدويًا فقط)

أحضِر مفتاحك الخاص (BYOK)

يمكن للمؤسسات تكوين مفاتيح API الخاصة بمزوّد LLM لديها من أجل فوترة وتتبّع استخدام مستقلَّين. يستخدم النظام حلًّا للمفاتيح من مستويين مع اختيار LRU:

الأول
مجمّع مفاتيح المؤسسة

مفاتيح لكل مؤسسة يتم تكوينها في صفحة مفاتيح API. يدعم مفاتيح متعددة لكل مزوّد مع تدوير LRU. مشفّرة باستخدام Fernet.

الثاني
مجموعة المفاتيح العامة

مفاتيح على مستوى النظام يديرها المسؤولون. مشتركة بين كل المؤسسات. يدعم أيضًا عدة مفاتيح لكل مزوّد مع تدوير LRU.

يسجّل كل إثراء المفتاح الذي استُخدم، بحيث يمكنك تتبّع التكاليف لكل مفتاح. تتضمّن المفاتيح دعم فحص السلامة وعدّادات الاستخدام، ويُعطّل تلقائياً عند حدوث إخفاقات دائمة (مفتاح غير صالح، أو دفع مطلوب). أما المفاتيح المقيّدة بالمعدّل فيُتراجع عنها مؤقتاً بينما تُستخدم مفاتيح أخرى في المجموعة. تعرّف على كيفية إدارة المفاتيح في دليل مفاتيح API.

الاستيراد والتصدير

صدّر إعدادات المزودين والنماذج بالكامل بصيغة JSON للنسخ الاحتياطي أو النقل إلى نسخة أخرى. الاستيراد دائماً عملية تحديث أو إضافة (upsert): تتم مطابقة المزودين والنماذج الحالية بالاسم وتحديثها في مكانها، بينما تُضاف الجديدة — ولا يُحذف أي شيء.

يشمل التصدير إعدادات المزوّد، وتكوينات النماذج، والتسعير، والقدرات، والمواصفات المعيارية للنماذج — لكنه لا يشمل مطلقًا مفاتيح API التي تُخزَّن بشكل منفصل. بعد الاستيراد، اضبط مفاتيح API بشكل منفصل. يقوم مسؤولو النظام بعمل نسخة احتياطية من الكتالوج العام الكامل؛ أما مالكو المؤسسات فيصدّرون ويستوردون مزوّدي ونماذج مؤسستهم الخاصة فقط — ولا يمكن إنشاء الكتالوج العام المشترك أو تعديله عبر الاستيراد.

الخطوات التالية