बैच प्रोसेसिंग - Entity Enricher

बैच प्रोसेसिंग

रियल-टाइम प्रगति ट्रैकिंग, प्रति-प्रोवाइडर रेट लिमिटिंग, स्वचालित मल्टी-मॉडल फ्यूज़न, और JSON या Excel में एक्सपोर्ट के साथ एक साथ 100 तक एंटिटीज़ को संवर्धित करें। बैच प्रोसेसिंग Entity Enricher को एकल-एंटिटी टूल से एक प्रोडक्शन-ग्रेड डेटा पाइपलाइन में बदल देती है।

बैच प्रोसेसिंग पाइपलाइन

इनपुट A

JSON Array पेस्ट करें

इनपुट B

URL से फ़ेच करें

इनपुट C

फ़ाइल ड्रैग और ड्रॉप करें

सत्यापित करें और चुनें

Entity सूची

entities चुनें, schema के मुकाबले सत्यापित करें, इनलाइन संपादन

समानांतर निष्पादन

सभी entity को एक साथ एनरिच करें

प्रति-provider रेट लिमिटिंग, प्रति-entity SSE प्रगति, रद्द/पुनः प्रयास समर्थन

ऑटो-फ़्यूज़न (यदि 2+ मॉडल)

प्रति entity परिणाम मर्ज करें

प्रत्येक एंटिटी पूरी होने के बाद कॉन्फ्लिक्ट डिटेक्शन और समाधान स्वतः चलता है

JSON निर्यात

संरचित परिणाम ऐरे

EXCEL एक्सपोर्ट

कॉन्फ़्लिक्ट वाली 3-शीट वर्कबुक

लचीली इनपुट विधियाँ

JSON पेस्ट करें

entity ऑब्जेक्ट्स की एक JSON array सीधे एडिटर में पेस्ट करें। सिस्टम array संरचना को स्वतः पहचानता है और अलग-अलग entity निकालता है। JSON एडिटर सिंटैक्स हाइलाइटिंग, वैलिडेशन मार्कर और लाइन नंबर प्रदान करता है।

URL से फ़ेच करें

entity को रिमोटली फ़ेच करने के लिए एक REST API URL दर्ज करें। बियरर टोकन, API की और बेसिक ऑथेंटिकेशन को सपोर्ट करता है। सिस्टम नेस्टेड रिस्पॉन्स रैपर से ऐरे स्वतः निकाल लेता है (जैसे, { results: [...] })।

ड्रैग और ड्रॉप

एक JSON फ़ाइल को सीधे पेज पर ड्रैग करें। पेस्ट ओवरले क्लिपबोर्ड या फ़ाइल ड्रॉप से JSON सामग्री का पता लगाता है और एंटिटीज़ को स्वतः लोड कर देता है।

रीयल-टाइम प्रगति ट्रैकिंग

हर बैच जॉब सर्वर-सेंट इवेंट्स (SSE) के ज़रिए प्रगति इवेंट स्ट्रीम करता है। UI यह दिखाता है:

हर entity परिणाम कार्ड को समेटा जा सकता है, जिसमें रॉ आउटपुट के साथ प्रति-model टैब और fusion सक्षम होने पर एक merged परिणाम टैब दिखता है। विफल entity को पूरा batch दोबारा चलाए बिना अलग-अलग पुनः प्रयास किया जा सकता है।

प्रति-Provider रेट लिमिटिंग

बैच प्रोसेसिंग API रेट लिमिट के भीतर रहने के लिए प्रति प्रोवाइडर समवर्ती सेमाफोर का उपयोग करती है। यदि आप 3 मॉडल्स के साथ 50 एंटिटीज़ को एनरिच कर रहे हैं, तो सिस्टम एक साथ 150 API कॉल्स नहीं करता। इसके बजाय, यह प्रत्येक प्रोवाइडर की कॉन्फ़िगर की गई रेट लिमिट का सम्मान करता है -- उदाहरण के लिए, Anthropic को 5 समवर्ती कॉल्स, OpenAI को 10, और सेल्फ-होस्टेड Ollama इंस्टेंस को 3।

रेट लिमिट्स मॉडल मैनेजमेंट सेटिंग्स में हर प्रोवाइडर के लिए कॉन्फ़िगर की जा सकती हैं। सिस्टम आपकी लिमिट्स के भीतर थ्रूपुट को अधिकतम करता है और साथ ही 429 एरर्स को रोकता है।

एक्सपोर्ट फॉर्मेट

JSON निर्यात

प्रति entity एक ऑब्जेक्ट के साथ एक संरचित JSON ऐरे। इसमें पूरा enriched आउटपुट, मेटाडेटा, और fusion परिणाम शामिल हैं। प्रोग्रामेटिक उपभोग और डाउनस्ट्रीम डेटा पाइपलाइनों के लिए आदर्श।

[
  {
    "entity": { "name": "..." },
    "enriched": { ... },
    "metadata": {
      "models": [...],
      "cost_usd": 0.012
    }
  }
]

Excel एक्सपोर्ट

विश्लेषकों और हितधारकों के लिए डिज़ाइन की गई एक तीन-शीट वर्कबुक:

  • परिणाम शीट: प्रति एंटिटी एक पंक्ति, जिसमें फ़्लैटन किए गए एनरिचमेंट फ़ील्ड्स कॉलम के रूप में होते हैं।
  • सारांश शीट: बैच मेटाडेटा, मॉडल कॉन्फ़िगरेशन, कुल लागत, और प्रोसेसिंग समय।
  • कॉन्फ्लिक्ट शीट: आर्बिट्रेशन तर्क और विश्वास स्कोर के साथ फ़ील्ड-स्तरीय कॉन्फ्लिक्ट विवरण।

रद्द करें और पुनः प्रयास करें

चल रहे बैच जॉब को किसी भी समय रद्द किया जा सकता है। रद्दीकरण सुगम होता है -- चल रहे LLM कॉल पूरे होते हैं (आपको फिर भी उनके परिणाम मिलते हैं), लेकिन कोई नया कॉल शुरू नहीं होता। पहले से पूरे हो चुके एंटिटी अपने परिणाम बनाए रखते हैं।

बैच शुरू करने से पहले, सिस्टम चुने गए मॉडल्स, एंटिटी काउंट, और स्कीमा जटिलता के आधार पर एक लागत अनुमान प्रदान करता है। इससे आप रन के लिए प्रतिबद्ध होने से पहले अपेक्षित लागत को मान्य कर सकते हैं।

बैच एनरिचमेंट शुरू करें

अपनी एंटिटी सूची अपलोड करें, मॉडल चुनें, और एक साथ 100 तक एंटिटीज़ एनरिच करें। पूर्ण कॉन्फ्लिक्ट रिपोर्ट के साथ परिणाम JSON या Excel के रूप में एक्सपोर्ट करें।

मुफ़्त में शुरू करें