जब आप एक ही एनरिचमेंट को कई AI मॉडलों पर चलाते हैं, तो Entity Enricher परिणामों को एक एकल, उच्च-कॉन्फ़िडेंस आउटपुट में फ्यूज़ कर सकता है। फ्यूज़न मॉडल आउटपुट के बीच टकरावों का पता लगाता है और उन्हें नियतात्मक नियमों या LLM-संचालित आर्बिट्रेशन का उपयोग करके हल करता है।
कॉन्फ्लिक्ट डिटेक्टर सभी मॉडल आउटपुट में हर फ़ील्ड की तुलना करता है। जिन फ़ील्ड पर सभी मॉडल सहमत होते हैं वे अपरिवर्तित पास हो जाती हैं। जिन फ़ील्ड पर मॉडल असहमत होते हैं उन्हें ऐसे विरोध के रूप में चिह्नित किया जाता है जिन्हें हल करने की आवश्यकता होती है।
| प्रकार | तुलना कैसे की गई | सहमति का अर्थ |
|---|---|---|
| स्केलर | सामान्यीकृत सटीक मिलान (ट्रिम किया गया, लोअरकेस, राउंड किया गया) | सामान्यीकरण के बाद सभी मान समान हैं |
| बहुभाषी | प्रति-भाषा तुलना | हर भाषा key models के बीच मेल खाती है |
| Array | Set तुलना (क्रम-स्वतंत्र) | क्रम की परवाह किए बिना समान आइटम |
| Object | प्रति-प्रॉपर्टी पुनरावर्ती | सभी नेस्टेड प्रॉपर्टीज़ मेल खाती हैं |
| Null | Null, अनुपस्थित के बराबर है | समतुल्य माना गया |
कॉन्फ्लिक्ट का समाधान दो तरीकों में से किसी एक से किया जाता है, यह इस पर निर्भर करता है कि आपने साइडबार में कोई आर्बिट्रेशन मॉडल चुना है या नहीं।
प्रत्येक फ़ील्ड के डेटा प्रकार के आधार पर नियतात्मक नियम लागू किए जाते हैं। किसी अतिरिक्त LLM कॉल की आवश्यकता नहीं — समाधान तत्काल और निःशुल्क है।
| फ़ील्ड टाइप | नियम | औचित्य |
|---|---|---|
| स्ट्रिंग | बहुमत मत; बराबरी होने पर सबसे लंबा मान चुना जाता है | आमतौर पर ज़्यादा विवरण बेहतर होता है |
| Number | माध्यिका मान | आउटलायर्स के प्रति मज़बूत |
| बूलियन | बहुमत; बराबरी में true जीतता है | रूढ़िवादी डिफ़ॉल्ट |
| बहुभाषी | प्रति-भाषा बहुमत मत | हर भाषा स्वतंत्र रूप से हल की जाती है |
| Array | सभी आइटम्स का यूनियन | सारी जानकारी सुरक्षित रखें |
| Object | प्रति-फ़ील्ड पुनरावर्ती | नेस्टेड फ़ील्ड्स पर नियम लागू करें |
| Null बनाम मान | नॉन-नल को प्राथमिकता दें | अनुपस्थित डेटा किसी भी मान से बदतर है |
टाई-ब्रेकर: जब मत बराबर होते हैं, तो अधिक कीमत वाले मॉडल का मान जीतता है (क्षमता के प्रॉक्सी के रूप में), उसके बाद वर्णानुक्रम में मॉडल नाम क्रम।
जब आप साइडबार में कोई आर्बिट्रेशन मॉडल चुनते हैं, तो टकराव बुद्धिमान समाधान के लिए किसी LLM को भेजे जाते हैं। आर्बिट्रेटर को एंटिटी संदर्भ, स्कीमा फ़ील्ड विवरण, और सभी परस्पर विरोधी मान प्राप्त होते हैं, फिर वह तर्कसंगत निर्णय लेता है।
फ़ॉलबैक: यदि आर्बिट्रेशन मॉडल विफल होता है (टाइमआउट, त्रुटि), तो सिस्टम स्वचालित रूप से नियम-आधारित मर्ज पर वापस आ जाता है ताकि आपको हमेशा एक परिणाम मिले।
कॉन्फ्लिक्ट समाधान के बाद, सिस्टम एक एकल मर्ज किया गया परिणाम बनाता है और उसे डेटाबेस में “आर्बिट्रेशन” रिकॉर्ड के रूप में संग्रहीत करता है। प्रत्येक मर्ज किए गए परिणाम में एक ऑडिट ट्रेल शामिल होता है ताकि आप ट्रेस कर सकें कि प्रत्येक कॉन्फ्लिक्ट कैसे हल हुआ।
हर मर्ज किया गया परिणाम मेटाडेटा शामिल करता है जो फ्यूज़न प्रक्रिया को प्रलेखित करता है:
फ्यूज़न पूरा होने के बाद, परिणाम पैनल में “Merged” टैब दिखाता है:
Batch enrichment में, जब आप दो या अधिक models चुनते हैं तो fusion स्वचालित रूप से होता है। आपको मैन्युअल रूप से “Merge Results” पर क्लिक करने की आवश्यकता नहीं है — जैसे ही किसी entity के लिए सभी models पूरे होते हैं, fusion चलता है और मर्ज किया गया परिणाम अलग-अलग model आउटपुट के साथ दिखाई देता है।
fusion_started, conflicts_detected, और fusion_completed इवेंट देखते हैं।