Entity Enricher दो संवर्धन रणनीतियाँ प्रदान करता है जो नियंत्रित करती हैं कि LLM कॉल्स को कैसे ऑर्केस्ट्रेट किया जाए। सही रणनीति चुनना सटीकता, गति, और लागत को प्रभावित करता है।
सबसे सरल से सबसे शक्तिशाली कॉन्फ़िगरेशन तक। प्रत्येक पिछले पर आधारित है।
एक model, एक call। पूरा schema एक ही prompt में भेजा जाता है। तेज़ और सस्ता — सरल schemas या त्वरित पुनरावृत्ति के लिए आदर्श।
Aspirin
कोई भी एंटिटी: कंपनी, ड्रग, कानूनी मामला, शोध पत्र...
अपनी खुद की API key के साथ कोई भी LLM प्रोवाइडर उपयोग करें।
एक ही कॉल में पूरा स्कीमा — वैलिडेशन विफलता पर ऑटो-रिट्राई।
Aspirin
वही रणनीति, लेकिन कई मॉडल पर समानांतर में चलाई गई। एकल उच्च-कॉन्फिडेंस आउटपुट बनाने के लिए परिणामों की फ़ील्ड-दर-फ़ील्ड तुलना और आर्बिट्रेशन किया जाता है।
Aspirin
कोई भी एंटिटी: कंपनी, ड्रग, कानूनी मामला, शोध पत्र...
मिलान — Pharmaceutical Compound
LLM क्रेडिट बर्बाद करने से पहले टाइप मिसमैच को पकड़ लेता है।
अपनी खुद की API keys लाएँ — किसी भी LLM provider के साथ काम करता है।
एक ही कॉल में पूरा स्कीमा — वैलिडेशन विफलता पर ऑटो-रिट्राई।
Aspirin
आर्बिट्रेट किया गयातर्कसंगत फ़ील्ड-स्तरीय विरोध समाधान अंतिम विश्वसनीय परिणाम तैयार करता है।
स्कीमा को एक्सपर्टीज़ डोमेन के अनुसार विभाजित किया जाता है। हर मॉडल को प्रत्येक डोमेन के लिए केंद्रित सब-प्रॉम्प्ट मिलते हैं। परिणाम प्रति मॉडल डीप-मर्ज किए जाते हैं, फिर मॉडलों के बीच आर्बिट्रेशन किया जाता है। जटिल, मल्टी-डोमेन स्कीमा के लिए अधिकतम सटीकता।
Aspirin
कोई भी एंटिटी: कंपनी, ड्रग, कानूनी मामला, शोध पत्र...
मिलान — Pharmaceutical Compound
LLM क्रेडिट बर्बाद करने से पहले टाइप मिसमैच को पकड़ लेता है।
अपनी खुद की API keys लाएँ — किसी भी LLM provider के साथ काम करता है।
स्कीमा क्षेत्र के अनुसार विभाजित — सत्यापन विफलता पर स्व-सुधार करने वाले प्रॉम्प्ट पुनः प्रयास करते हैं।
प्रति मॉडल एक्सपर्टीज़ डोमेन रिस्पॉन्स का डीप मर्ज।
Aspirin
आर्बिट्रेट किया गयातर्कसंगत फ़ील्ड-स्तरीय विरोध समाधान अंतिम विश्वसनीय परिणाम तैयार करता है।
| पहलू | सिंगल पास | मल्टी-एक्सपर्टीज़ |
|---|---|---|
| LLM कॉल | प्रति मॉडल 1 | प्रति मॉडल N (प्रति विशेषज्ञता क्षेत्र 1) |
| स्कीमा भेजा गया | एक ही प्रॉम्प्ट में पूरा स्कीमा | प्रति एक्सपर्टीज़ डोमेन सबसेट |
| एक्ज़िक्यूशन | अनुक्रमिक (एक call) | समानांतर (सभी एक्सपर्टीज़ डोमेन एक साथ चलते हैं) |
| सटीकता | सरल स्कीमा के लिए अच्छा | अधिक — केंद्रित प्रॉम्प्ट बेहतर परिणाम देते हैं |
| गति | छोटे स्कीमा के लिए तेज़ | बड़े स्कीमा के लिए समानांतर निष्पादन तेज़ हो सकता है |
| लागत | कम (एकल कॉल ओवरहेड) | अधिक (प्रति-कॉल ओवरहेड के साथ कई कॉल) |
| स्ट्रीमिंग | पूर्ण-या-शून्य परिणाम | प्रोग्रेसिव — प्रत्येक एक्सपर्टीज़ डोमेन पूरा होते ही परिणाम स्ट्रीम होते हैं |
| आंशिक सफलता | नहीं — पूरा कॉल या तो सफल होता है या विफल | हाँ — सफल expertise संरक्षित रहती हैं, असफल को फिर से retry किया जा सकता है |
मल्टी-एक्सपर्टीज़ रणनीति हर मॉडल के लिए चार-चरणीय प्रक्रिया का पालन करती है:
स्कीमा को पुनरावर्ती रूप से ट्रैवर्स किया जाता है। एक्सपर्टीज़ डोमेन टैग वाली हर प्रॉपर्टी को समान डोमेन साझा करने वाली अन्य प्रॉपर्टीज़ के साथ समूहीकृत किया जाता है। उदाहरण के लिए, revenue और market_cap “financial” समूह में जाते हैं, जबकि gmp_status “regulatory” में जाता है।
हर expertise समूह एक न्यूनतम सब-schema बन जाता है जिसमें केवल उसकी प्रॉपर्टीज़ होती हैं। इसका मतलब है कि LLM को एक छोटा, अधिक केंद्रित prompt मिलता है और उसे केवल वही फ़ील्ड भरने होते हैं जिनमें वह विशेषज्ञ है।
सभी विशेषज्ञता कॉल समवर्ती रूप से चलती हैं। 5 विशेषज्ञता डोमेन वाली एक स्कीमा एक साथ 5 LLM कॉल लॉन्च करेगी। जैसे ही हर एक पूरी होती है, उसके परिणाम संचित आउटपुट में डीप-मर्ज किए जाते हैं और रियल-टाइम में UI पर स्ट्रीम किए जाते हैं।
यदि कुछ विशेषज्ञताएँ विफल हो जाती हैं, तो सिस्टम सफल हुई विशेषज्ञताओं का विलय किया गया आउटपुट “आंशिक” स्थिति के साथ लौटाता है। आप केवल विफल विशेषज्ञताओं को पुनः प्रयास कर सकते हैं, और नए परिणाम पहले से सफल हुए कार्य को दोहराए बिना मौजूदा आउटपुट में विलय कर दिए जाएँगे।
दोनों रणनीतियों को multi-model एनरिचमेंट के साथ जोड़ा जा सकता है। जब आप कई मॉडल चुनते हैं, तो प्रत्येक मॉडल चुनी गई रणनीति को स्वतंत्र रूप से चलाता है। फिर एकल उच्च-विश्वास आउटपुट उत्पन्न करने के लिए परिणामों को multi-model फ्यूज़न का उपयोग करके मर्ज किया जा सकता है।