AI स्कीमा जनरेशन - Entity Enricher

AI स्कीमा जनरेशन

कोई भी JSON डेटा सैंपल पेस्ट करें और AI को एक पूरी तरह टाइप्ड enrichment schema जनरेट करने दें -- expertise domain, search key, बहुभाषी फ़ील्ड डिटेक्शन और वैलिडेशन नियमों सहित। जनरेशन प्रक्रिया में 6 तक स्व-सुधार प्रयास शामिल हैं, जो सुनिश्चित करते हैं कि schema आपके देखने से पहले ही वैध हो।

स्कीमा जनरेशन पाइपलाइन

स्टेप 1

सैंपल JSON पेस्ट करें

आपके एंटिटी डेटा का प्रतिनिधित्व करने वाला कोई भी JSON ऑब्जेक्ट या ऐरे

स्टेप 2

AI स्कीमा जनरेट करता है

LLM डेटा टाइप, नेस्टिंग, नामकरण पैटर्न और विशेषज्ञता डोमेन का विश्लेषण करता है

स्टेप 3

8-नियम Validation

1.प्रकार शुद्धता
2.$ref लक्ष्य वैधता
3.expertise असाइनमेंट
4.विशेषज्ञता गणना सीमाएँ
5.सर्च की वैधता
6.प्रॉपर्टी नामकरण
7.नेस्टेड संरचना की गहराई
8.आवश्यक फ़ील्ड की बाध्यताएँ

यदि validation विफल होता है, तो त्रुटियाँ स्व-सुधार के लिए LLM को वापस भेजी जाती हैं (6 बार तक retry)

चरण 4

पोस्ट-प्रोसेसिंग

Nullable डिटेक्शन, search key डिमोशन, expertise domain संग्रह

आउटपुट

सत्यापित enrichment schema

टाइप्ड प्रॉपर्टीज़, विशेषज्ञता डोमेन्स, और सर्च कीज़ के साथ एनरिचमेंट के लिए तैयार

ModelRetry के माध्यम से स्व-सुधार

LLM कभी-कभी संरचनात्मक समस्याओं वाले स्कीमा बना देते हैं — स्कीमा और इनपुट डेटा के बीच टाइप बेमेल, किसी गैर-मौजूद परिभाषा की ओर इशारा करता $ref, या बहुत अधिक विशेषज्ञता डोमेन। Entity Enricher इन समस्याओं को पकड़ने और उसी जनरेशन रन के भीतर सुधार के लिए उन्हें वापस LLM को देने के लिए Pydantic-AI के ModelRetry तंत्र का उपयोग करता है।

यह पारदर्शी रूप से होता है। सिस्टम LLM आउटपुट को 8 नियमों के विरुद्ध वैलिडेट करता है, और यदि कोई नियम विफल होता है, तो विशिष्ट त्रुटियाँ उन्हें ठीक करने के निर्देशों के साथ मॉडल को वापस भेजी जाती हैं। यह रिट्राई लूप 6 बार तक चलता है, जिससे मैन्युअल हस्तक्षेप के बिना लगभग-100% मान्य स्कीमा आउटपुट प्राप्त होता है।

लागू किए गए सत्यापन नियम

प्रकार शुद्धता

स्कीमा प्रॉपर्टी टाइप इनपुट JSON में देखे गए डेटा टाइप से मेल खाने चाहिए।

$ref अखंडता

सभी $ref पॉइंटर्स को $defs सेक्शन में परिभाषित एंटिटीज़ को रेफरेंस करना चाहिए।

Expertise असाइनमेंट

हर प्रॉपर्टी को एक मान्य विशेषज्ञता डोमेन से संबंधित होना चाहिए।

Expertise गिनती

कुल विशेषज्ञता डोमेन कॉन्फ़िगर करने योग्य सीमाओं के भीतर रहने चाहिए।

सर्च की वैधता

सर्च कीज़ को गैर-खाली मानों वाली मौजूदा प्रॉपर्टीज़ का संदर्भ देना चाहिए।

प्रॉपर्टी नामकरण

प्रॉपर्टी नामों को snake_case परंपरा का पालन करना चाहिए।

संरचना गहराई

नेस्टिंग की गहराई सीमा के भीतर रहनी चाहिए (डिफ़ॉल्ट 10 स्तर)।

फ़ील्ड कंस्ट्रेंट्स

आवश्यक फ़ील्ड, न्यूनतम/अधिकतम मान, और enum बाध्यताएँ सत्यापित की जाती हैं।

इंटेलिजेंट पोस्ट-प्रोसेसिंग

LLM द्वारा स्कीमा जनरेट और स्व-सुधार करने के बाद, अतिरिक्त डेटा-संचालित रूपांतरण लागू किए जाते हैं:

Nullable डिटेक्शन

यदि इनपुट डेटा में किसी फ़ील्ड के लिए null मान हैं, तो स्कीमा property स्वचालित रूप से nullable के रूप में चिह्नित हो जाती है। इससे LLM उन फ़ील्ड के लिए null लौटा सकते हैं जहाँ डेटा उपलब्ध नहीं है, बजाय इसके कि मनगढ़ंत मान थोपे जाएँ।

सर्च की डिमोशन

जो फ़ील्ड सर्च कीज़ के रूप में चिह्नित हैं लेकिन इनपुट डेटा में खाली मान रखते हैं, उनका सर्च की फ्लैग हटा दिया जाता है। इससे खाली सर्च कीज़ को संवर्धन प्रॉम्प्ट के फोकस को कमजोर करने से रोका जाता है।

Expertise संग्रह

सभी विशेषज्ञता डोमेन नेस्टेड प्रॉपर्टीज़ से एक टॉप-लेवल सूची में एकत्र किए जाते हैं, जिससे आपकी स्कीमा की डोमेन कवरेज को एक नज़र में देखना आसान हो जाता है।

प्राकृतिक भाषा के साथ Schemas एडिट करें

स्कीमा जनरेट करने के बाद, आप इसे प्राकृतिक भाषा निर्देशों का उपयोग करके संशोधित कर सकते हैं। कुछ इस तरह टाइप करें जैसे "add a parent_company reference with name and ownership_percentage" और AI संरचनात्मक परिवर्तन लागू करता है, सभी वैलिडेशन नियमों और एक्सपर्टीज़ डोमेन असाइनमेंट को बनाए रखते हुए।

हर AI एडिट 5 सुधार सुझाव भी बनाता है -- जैसे छूटे हुए फ़ील्ड जोड़ना, विवरण बेहतर करना, या expertise domain को पुनर्गठित करना। आप इन सुझावों को एक ही क्लिक से लागू कर सकते हैं।

सीधे नियंत्रण के लिए, विज़ुअल schema एडिटर ड्रैग-एंड-ड्रॉप प्रॉपर्टी क्रमबद्धता, इनलाइन फ़ील्ड संपादन, कीबोर्ड नेविगेशन, और पूर्ण अनडू/रीडू समर्थन प्रदान करता है। विवरण के लिए schema एडिटर दस्तावेज़ीकरण देखें।

schema से टाइप-सुरक्षित आउटपुट तक

Entity Enricher केवल एक JSON स्कीमा दस्तावेज़ ही उत्पन्न नहीं करता -- यह आपके स्कीमा को रनटाइम पर एक डायनामिक Pydantic मॉडल में परिवर्तित करता है। फिर इस मॉडल का उपयोग Pydantic-AI एजेंट्स के लिए संरचित आउटपुट प्रकार के रूप में किया जाता है, जिसका अर्थ है कि LLM आउटपुट आपके स्कीमा के विरुद्ध टाइप स्तर पर मान्य किया जाता है। अमान्य आउटपुट स्वचालित पुनः प्रयास ट्रिगर करते हैं।

यह दृष्टिकोण उपयोगकर्ता-परिभाषित स्कीमा के लचीलेपन को कंपाइल किए गए मॉडल की टाइप सुरक्षा के साथ जोड़ता है। आपको दोनों का सर्वश्रेष्ठ मिलता है: जो भी आकार चाहें उसे परिभाषित करें, और सिस्टम इसे स्वचालित रूप से लागू करता है।

अपना पहला Schema जेनरेट करें

एक JSON सैंपल पेस्ट करें, एक model चुनें, और सेकंडों में एक वैलिडेटेड enrichment schema पाएं। फिर उसे प्राकृतिक भाषा या विज़ुअल एडिटर से परिष्कृत करें।

मुफ़्त में शुरू करें