Enrichment रणनीतियाँ - Entity Enricher दस्तावेज़ीकरण

Enrichment रणनीतियाँ

Entity Enricher दो संवर्धन रणनीतियाँ प्रदान करता है जो नियंत्रित करती हैं कि LLM कॉल्स को कैसे ऑर्केस्ट्रेट किया जाए। सही रणनीति चुनना सटीकता, गति, और लागत को प्रभावित करता है।

पाइपलाइन डायग्राम

सबसे सरल से सबसे शक्तिशाली कॉन्फ़िगरेशन तक। प्रत्येक पिछले पर आधारित है।

सरल

सिंगल पास — 1 मॉडल

एक model, एक call। पूरा schema एक ही prompt में भेजा जाता है। तेज़ और सस्ता — सरल schemas या त्वरित पुनरावृत्ति के लिए आदर्श।

Entity

Aspirin

कोई भी एंटिटी: कंपनी, ड्रग, कानूनी मामला, शोध पत्र...

Anthropic

अपनी खुद की API key के साथ कोई भी LLM प्रोवाइडर उपयोग करें।

Anthropicपूरा स्कीमा

एक ही कॉल में पूरा स्कीमा — वैलिडेशन विफलता पर ऑटो-रिट्राई।

संवर्धित परिणाम

Aspirin

मल्टी-मॉडल

सिंगल पास — 3 मॉडल

वही रणनीति, लेकिन कई मॉडल पर समानांतर में चलाई गई। एकल उच्च-कॉन्फिडेंस आउटपुट बनाने के लिए परिणामों की फ़ील्ड-दर-फ़ील्ड तुलना और आर्बिट्रेशन किया जाता है।

Entity

Aspirin

कोई भी एंटिटी: कंपनी, ड्रग, कानूनी मामला, शोध पत्र...

प्री-फ्लाइट क्लासिफिकेशन

मिलान — Pharmaceutical Compound

LLM क्रेडिट बर्बाद करने से पहले टाइप मिसमैच को पकड़ लेता है।

Anthropic
OpenAI
Google Gemini

अपनी खुद की API keys लाएँ — किसी भी LLM provider के साथ काम करता है।

Anthropicपूरा स्कीमा
OpenAIपूरा स्कीमा
Geminiपूरा स्कीमा

एक ही कॉल में पूरा स्कीमा — वैलिडेशन विफलता पर ऑटो-रिट्राई।

अंतिम Enriched परिणाम

Aspirin

आर्बिट्रेट किया गया

तर्कसंगत फ़ील्ड-स्तरीय विरोध समाधान अंतिम विश्वसनीय परिणाम तैयार करता है।

उन्नत

मल्टी-एक्सपर्टीज़ — 3 मॉडल

स्कीमा को एक्सपर्टीज़ डोमेन के अनुसार विभाजित किया जाता है। हर मॉडल को प्रत्येक डोमेन के लिए केंद्रित सब-प्रॉम्प्ट मिलते हैं। परिणाम प्रति मॉडल डीप-मर्ज किए जाते हैं, फिर मॉडलों के बीच आर्बिट्रेशन किया जाता है। जटिल, मल्टी-डोमेन स्कीमा के लिए अधिकतम सटीकता।

Entity

Aspirin

कोई भी एंटिटी: कंपनी, ड्रग, कानूनी मामला, शोध पत्र...

प्री-फ्लाइट क्लासिफिकेशन

मिलान — Pharmaceutical Compound

LLM क्रेडिट बर्बाद करने से पहले टाइप मिसमैच को पकड़ लेता है।

Anthropic
OpenAI
Google Gemini

अपनी खुद की API keys लाएँ — किसी भी LLM provider के साथ काम करता है।

Anthropic
फार्माकोलॉजीLLM प्रॉम्प्ट
विनियामकLLM प्रॉम्प्ट
OpenAI
फार्माकोलॉजीLLM प्रॉम्प्ट
विनियामकLLM प्रॉम्प्ट
Gemini
फार्माकोलॉजीLLM प्रॉम्प्ट
विनियामकLLM प्रॉम्प्ट

स्कीमा क्षेत्र के अनुसार विभाजित — सत्यापन विफलता पर स्व-सुधार करने वाले प्रॉम्प्ट पुनः प्रयास करते हैं।

Anthropic परिणाम
OpenAI परिणाम
Gemini परिणाम

प्रति मॉडल एक्सपर्टीज़ डोमेन रिस्पॉन्स का डीप मर्ज।

अंतिम Enriched परिणाम

Aspirin

आर्बिट्रेट किया गया

तर्कसंगत फ़ील्ड-स्तरीय विरोध समाधान अंतिम विश्वसनीय परिणाम तैयार करता है।

विस्तृत तुलना

पहलूसिंगल पासमल्टी-एक्सपर्टीज़
LLM कॉलप्रति मॉडल 1प्रति मॉडल N (प्रति विशेषज्ञता क्षेत्र 1)
स्कीमा भेजा गयाएक ही प्रॉम्प्ट में पूरा स्कीमाप्रति एक्सपर्टीज़ डोमेन सबसेट
एक्ज़िक्यूशनअनुक्रमिक (एक call)समानांतर (सभी एक्सपर्टीज़ डोमेन एक साथ चलते हैं)
सटीकतासरल स्कीमा के लिए अच्छाअधिक — केंद्रित प्रॉम्प्ट बेहतर परिणाम देते हैं
गतिछोटे स्कीमा के लिए तेज़बड़े स्कीमा के लिए समानांतर निष्पादन तेज़ हो सकता है
लागतकम (एकल कॉल ओवरहेड)अधिक (प्रति-कॉल ओवरहेड के साथ कई कॉल)
स्ट्रीमिंगपूर्ण-या-शून्य परिणामप्रोग्रेसिव — प्रत्येक एक्सपर्टीज़ डोमेन पूरा होते ही परिणाम स्ट्रीम होते हैं
आंशिक सफलतानहीं — पूरा कॉल या तो सफल होता है या विफलहाँ — सफल expertise संरक्षित रहती हैं, असफल को फिर से retry किया जा सकता है

प्रत्येक रणनीति कब उपयोग करें

सिंगल पास कब उपयोग करें:

  • आपके schema में 15–20 से कम प्रॉपर्टीज हैं
  • सभी प्रॉपर्टीज़ एक ही डोमेन से संबंधित हैं (उदा., सभी वित्तीय डेटा)
  • आप सबसे तेज़, सबसे सस्ता परिणाम चाहते हैं और सटीकता कम महत्वपूर्ण है
  • आप एक नए schema का परीक्षण कर रहे हैं और तेज़ी से पुनरावृत्ति कर रहे हैं

मल्टी-एक्सपर्टीज़ कब उपयोग करें:

  • आपका schema कई expertise domain में फैला हुआ है (फार्मास्युटिकल, वित्तीय, भौगोलिक, आदि)
  • आपके पास 20+ प्रॉपर्टीज़ वाला एक जटिल schema है
  • सटीकता महत्वपूर्ण है और आप केंद्रित, विशेषीकृत prompts चाहते हैं
  • आप प्रत्येक डोमेन के पूरा होने पर रीयल-टाइम प्रगति चाहते हैं
  • आपको आंशिक सफलता हैंडलिंग चाहिए — केवल जो विफल हुआ उसे फिर से आज़माएँ

मल्टी-एक्सपर्टीज़ विस्तार से कैसे काम करता है

मल्टी-एक्सपर्टीज़ रणनीति हर मॉडल के लिए चार-चरणीय प्रक्रिया का पालन करती है:

1
प्रॉपर्टीज़ को विशेषज्ञता के अनुसार समूहित करें

स्कीमा को पुनरावर्ती रूप से ट्रैवर्स किया जाता है। एक्सपर्टीज़ डोमेन टैग वाली हर प्रॉपर्टी को समान डोमेन साझा करने वाली अन्य प्रॉपर्टीज़ के साथ समूहीकृत किया जाता है। उदाहरण के लिए, revenue और market_cap “financial” समूह में जाते हैं, जबकि gmp_status “regulatory” में जाता है।

2
केंद्रित सब-schema बनाएँ

हर expertise समूह एक न्यूनतम सब-schema बन जाता है जिसमें केवल उसकी प्रॉपर्टीज़ होती हैं। इसका मतलब है कि LLM को एक छोटा, अधिक केंद्रित prompt मिलता है और उसे केवल वही फ़ील्ड भरने होते हैं जिनमें वह विशेषज्ञ है।

3
समानांतर में रन करें

सभी विशेषज्ञता कॉल समवर्ती रूप से चलती हैं। 5 विशेषज्ञता डोमेन वाली एक स्कीमा एक साथ 5 LLM कॉल लॉन्च करेगी। जैसे ही हर एक पूरी होती है, उसके परिणाम संचित आउटपुट में डीप-मर्ज किए जाते हैं और रियल-टाइम में UI पर स्ट्रीम किए जाते हैं।

4
आंशिक विफलताओं को संभालें

यदि कुछ विशेषज्ञताएँ विफल हो जाती हैं, तो सिस्टम सफल हुई विशेषज्ञताओं का विलय किया गया आउटपुट “आंशिक” स्थिति के साथ लौटाता है। आप केवल विफल विशेषज्ञताओं को पुनः प्रयास कर सकते हैं, और नए परिणाम पहले से सफल हुए कार्य को दोहराए बिना मौजूदा आउटपुट में विलय कर दिए जाएँगे।

Multi-Model Enrichment के साथ संयोजन

दोनों रणनीतियों को multi-model एनरिचमेंट के साथ जोड़ा जा सकता है। जब आप कई मॉडल चुनते हैं, तो प्रत्येक मॉडल चुनी गई रणनीति को स्वतंत्र रूप से चलाता है। फिर एकल उच्च-विश्वास आउटपुट उत्पन्न करने के लिए परिणामों को multi-model फ्यूज़न का उपयोग करके मर्ज किया जा सकता है।

उदाहरण: 3 मॉडल और 4 विशेषज्ञता डोमेन वाले स्कीमा के साथ मल्टी-एक्सपर्टीज़ का उपयोग कुल 12 LLM कॉल शुरू करेगा (3 मॉडल x 4 विशेषज्ञताएँ)। अलग-अलग प्रोवाइडर के मॉडल समानांतर में चलते हैं, जबकि एक ही प्रोवाइडर के मॉडल रेट सीमा का सम्मान करने के लिए कतार में रखे जाते हैं।