أثرِ النوع نفسه من الكيانات مرارًا وتكرارًا وستظل تعيد اكتشاف الأشياء الواقعية نفسها — الشركة نفسها، والأثر الجانبي نفسه للدواء، والشخص نفسه — موصوفة بكلمات مختلفة قليلًا في كل مرة. المعرّف الدلالي هو معرّف ثابت على مستوى المؤسسة يمنحه Entity Enricher لكائن من حقوله الأساسية، بحيث تنهار تلك الأشياء شبه المكررة إلى هوية واحدة يمكنك التجميع وإزالة التكرار والربط عليها.
تُبنى هوية الكائن من حقوله الأساسية — وقد يكون هناك حقل واحد أو عدة حقول. مثالان:
الاسميظهر بصيغة Headache وCéphalée وCephalalgia عبر عمليات التشغيل واللغات المختلفة. حقل مفتاحي واحد، وثلاث طرق كتابة، ومفهوم حقيقي واحد.
الاسم + البلدAcme Inc. · United States وAcme Incorporated · United States هما الشركة نفسها — بينما Acme Inc. · Germany شركة مختلفة. المفتاح الثاني يزيل الالتباس؛ ولهذا يمكن أن يحمل الكائن أكثر من مفتاح.
تفشل المطابقة النصية البسيطة في كل هذه الحالات؛ ويعرف الإنسان أيّها متطابق. أما المعرّفات الدلالية فتُرمّز ذلك الحكم تلقائيًا.
نصية واحدة على كائن (تُسمّى id افتراضياً)، تحمل معرّفاً غير شفاف وثابتاً.محفوظ): دائمًا سلسلة نصية، وليس مفتاحًا أبدًا، وليس متعدد اللغات، وواحد على الأكثر لكل كائن.manufacturer)، أو كل عنصر في مصفوفة (مثل كل side_effect).بعد أن يُعيد النموذج نتيجته، يحلّ Entity Enricher كل معرّف دلالي عبر أربع خطوات — الأرخص أولًا:
“Acme Inc.” و“Acme Incorporated” جنبًا إلى جنب.0.92، وقابلة للضبط لكل خاصية)، يُعاد استخدام معرّف ذلك المفهوم. وإلا يُنشَأ معرّف جديد تمامًا ويُخزَّن للمرة القادمة.موازنة العتبة: العتبة الأعلى أكثر صرامة (اندماجات عرضية أقل)؛ والأدنى أكثر تساهلًا (إزالة تكرار أكثر جرأةً). اضبطها لكل خاصية عندما يفرط الحد الافتراضي 0.92 في الدمج أو يقصّر عنه.
يعتمد ما إذا كان المعرّف يُنشأ على ما إذا كان موجودًا بالفعل في المُدخل لذلك الكائن. هذا ما يتيح لك الرحلة ذهابًا وإيابًا: أثرِ البيانات مرة واحدة للحصول على المعرّفات، ثم مرّر معرّفًا معروفًا في عمليات التشغيل اللاحقة لإرفاق حقائق جديدة بالهوية نفسها — أرخص وأوضح.
إذا كان الكائن الذي ترسله يحمل بالفعل معرّفًا دلاليًا، فيُعامَل كعملية بحث: يُحتفَظ بالمعرّف حرفيًا، ويُربَط السجل بذلك المفهوم الحالي، ولا يوجد تضمين — لا تكلفة ولا مطابقة أو إنشاء. أنت بذلك تخبر المنصّة "هذا الكائن مُعرَّف بالفعل في قاعدة بياناتنا".
إذا لم يكن للكائن معرّف دلالي، تُنشئ المنصّة واحدًا بالخطوات الأربع أعلاه. ويصبح ذلك المعرّف هو المعرّف الثابت للكائن في قاعدة بيانات مؤسستك من تلك اللحظة فصاعدًا.
يُتجاهَل أي قيمة موجودة لكن غير قابلة للتعرّف عليها (وليست معرّف مفهوم حقيقي)، ويُولَّد معرّف بدلاً منها.
يكلّف الحل قدرًا صغيرًا من استخدام التضمين لكل عملية إثراء (يُحتسب مثل أي استدعاء نموذج). تجعل ذاكرة التخزين المؤقت للمطابقة التامة عمليات التكرار مجانية، ولا تكلّف المعرّفات المقدَّمة ضمن المدخلات شيئًا.
تظهر المعرّفات المحلولة في مخرجات الإثراء بصيغة JSON (حقل id في كل كائن) وفي المفاهيم الدلالية لتفاصيل السجل. استخدمها من أجل:
الدمج يوفّق بين الاختلافات عبر النماذج ضمن تشغيل واحد؛ بينما توفّق المعرّفات الدلالية بين الكِيان نفسه عبر عمليات التشغيل والزمن. ويعمل الاثنان معًا.