रियल-टाइम प्रगति ट्रैकिंग, स्वचालित मल्टी-मॉडल फ्यूज़न, और JSON या Excel में एक्सपोर्ट के साथ एक साथ 100 तक एंटिटीज़ को संवर्धित करें।
बैच एनरिचमेंट एंटिटी डेटा प्रदान करने के दो तरीकों का समर्थन करता है:
entity की एक JSON array सीधे पेस्ट करें या टाइप करें। एडिटर सिंटैक्स हाइलाइटिंग, वैलिडेशन मार्कर प्रदान करता है और आपका डेटा सेशनों के बीच लोकल स्टोरेज में बनाए रखता है।
[
{ "name": "Sanofi", "country": "France" },
{ "name": "Pfizer", "country": "USA" },
{ "name": "Novartis", "country": "CH" }
]किसी भी REST API एंडपॉइंट से एंटिटीज़ फ़ेच करें। सिस्टम स्वचालित रूप से सामान्य रिस्पॉन्स रैपर्स से arrays निकाल लेता है।
समर्थित प्रमाणीकरण:
यदि API कोई ऑब्जेक्ट लौटाता है, तो सिस्टम एम्बेडेड array के लिए data, results, items जैसी कुंजियों की जाँच करता है।
एंटिटीज़ लोड होने के बाद, वे वैलिडेशन स्थिति के साथ एक चयन योग्य सूची में दिखाई देती हैं। आप चुन सकते हैं कि बैच में कौन-सी एंटिटीज़ शामिल करनी हैं:
साइडबार सिंगल एनरिचमेंट कॉन्फ़िगरेशन विकल्पों को दर्शाता है:
| विकल्प | विवरण |
|---|---|
| स्कीमा | लक्ष्य schema जो enrichment आउटपुट संरचना को परिभाषित करता है |
| रणनीति | सिंगल पास, एक्सपर्ट डोमेन, या मल्टी-एक्सपर्टीज़ (प्रति डोमेन पैरेलल कॉल) |
| मॉडल | प्रति entity चलाने के लिए एक या अधिक AI models। कई models स्वचालित fusion को सक्षम करते हैं। |
| भाषाएँ | बहुभाषी फ़ील्ड संवर्धन के लिए भाषाएँ (जैसे, अंग्रेज़ी + फ़्रेंच) |
| क्लासिफिकेशन | एनरिचमेंट से पहले एंटिटी प्रकार सत्यापन के लिए वैकल्पिक तेज़ मॉडल |
| आर्बिट्रेशन | फ़्यूज़न के दौरान LLM-आधारित संघर्ष समाधान के लिए मॉडल। यदि अनसेट है, तो नियम-आधारित मर्ज का उपयोग किया जाता है। |
बैच शुरू करने से पहले, एक पुष्टिकरण डायलॉग लागत अनुमान और सारांश दिखाता है। यह अनुमान प्रॉपर्टी काउंट, मॉडल प्राइसिंग, और चुनी गई एंटिटीज़ व मॉडल्स की संख्या के आधार पर गणना किया जाता है। कुल LLM कॉल काउंट 100 से अधिक होने पर एक चेतावनी दिखाई देती है।
सभी चयनित एंटिटी एक साथ प्रोसेस की जाती हैं। प्रत्येक एंटिटी स्वतंत्र रूप से पूरी एनरिचमेंट पाइपलाइन से गुज़रती है:
एक ग्लोबल rate limiter AI provider पर अत्यधिक भार पड़ने से रोकता है। सभी entity समान per-provider concurrency सीमाएँ साझा करती हैं (आमतौर पर प्रति provider 5 एक साथ call)। 20 entity और 2 model के साथ, प्रति provider एक साथ 5 call तक चलते हैं — बाकी उपलब्धता के लिए प्रतीक्षा करते हैं। यह API rate सीमाओं से टकराए बिना विश्वसनीय निष्पादन सुनिश्चित करता है।
रिज़ल्ट पैनल Server-Sent Events (SSE) का उपयोग करके लाइव प्रगति दिखाता है। हर एंटिटी के पास एक कोलैप्सिबल कार्ड होता है जो रियल टाइम में अपडेट होता है:
प्रोसेसिंग शुरू होने की प्रतीक्षा में
वर्तमान में संवर्धित किया जा रहा है, प्रत्येक डोमेन के अनुसार पूर्णता दर्शाने वाले विशेषज्ञता प्रगति बैज के साथ
सभी मॉडल सफलतापूर्वक पूरे हुए। कार्ड स्वतः संक्षिप्त हो जाता है।
कुछ मॉडल या विशेषज्ञताएँ विफल हुईं। आंशिक परिणाम उपलब्ध हैं।
इस एंटिटी के लिए सभी मॉडल विफल रहे। त्रुटि विवरण दिखाया गया है।
आप किसी भी समय चल रहे batch को रद्द कर सकते हैं। रद्दीकरण सहयोगात्मक है — पहले से प्रक्रिया में मौजूद entity अपना मौजूदा LLM कॉल पूरा करती हैं, लेकिन कोई नया कॉल शुरू नहीं होता। पूर्ण हुई entity के आंशिक परिणाम संरक्षित रहते हैं।
बैच प्रोसेसिंग को लचीला बनाने के लिए डिज़ाइन किया गया है। व्यक्तिगत विफलताएँ बैच को नहीं रोकतीं:
बैच पूरा होने के बाद, परिणामों को तीन फ़ॉर्मैट में एक्सपोर्ट करें। प्रत्येक एंटिटी के लिए, यदि उपलब्ध हो तो फ्यूज़न परिणाम को प्राथमिकता दी जाती है; अन्यथा, सर्वश्रेष्ठ मॉडल परिणाम का उपयोग किया जाता है।
सभी एंटिटी डेटा, मॉडल आउटपुट और फ्यूज़न मेटाडेटा सहित पूरे परिणामों को एक संरचित JSON फ़ाइल के रूप में डाउनलोड करें।
JSON परिणामों को सीधे अपने क्लिपबोर्ड पर कॉपी करें ताकि उन्हें अन्य टूल या स्क्रिप्ट में पेस्ट किया जा सके।
एक तीन-शीट वर्कबुक: Results (प्रति entity एक पंक्ति, समतल की गई प्रॉपर्टीज़ के साथ), Summary (batch मेटाडेटा, models, लागतें), और Conflicts (समाधान तर्क सहित प्रति-entity विरोध विवरण)।
| सीमा | मान |
|---|---|
| प्रति batch अधिकतम entities | 100 |
| अधिकतम entity डेटा आकार | 50,000 अक्षर |
| अधिकतम prompt लंबाई | 100,000 वर्ण |
| URL फ़ेच टाइमआउट | 30 सेकंड |