LlamaExtract (LlamaIndex से) एक कस्टम स्कीमा के विरुद्ध आपके द्वारा दिए गए दस्तावेज़ों से संरचित डेटा निकालता है, जिसके नीचे एक बेहतरीन पार्सर काम करता है। Entity Enricher इसके उलट काम करता है: यह दुनिया के सर्वश्रेष्ठ LLM — साथ ही लाइव वेब सर्च और आपके दस्तावेज़ों — से एक एंटिटी को एनरिच करता है, फिर हर फ़ील्ड को मॉडलों के बीच क्रॉस-चेक करता है और टकरावों को हल करता है। दोनों “स्कीमा अंदर, संरचित JSON बाहर” पर ओवरलैप करते हैं, लेकिन समस्या के अलग-अलग हिस्सों को हल करते हैं।
स्रोतों के रूप में LLM ज्ञान, वेब, और आपके दस्तावेज़ों का उपयोग करते हुए, जो आपके डेटा में नहीं है उसका उत्तर देता है।
आपके द्वारा अपलोड किए गए दस्तावेज़ में जो पहले से लिखा है उसे निकालता है। कोई बाहरी ज्ञान या वेब लुकअप नहीं।
2+ LLM को समानांतर में चलाता है और फ़ील्ड-स्तरीय असहमतियों का आर्बिट्रेशन करता है, तर्क को रिकॉर्ड करते हुए।
प्रति दस्तावेज़ एक अकेला एक्सट्रैक्शन पास। कोई क्रॉस-model सत्यापन या arbitration नहीं।
सिमैंटिक ID प्रत्येक एंटिटी को एक स्थिर जॉइन की देते हैं जो रन, मॉडल और भाषाओं के पार डीडुप करती है।
आउटपुट उस दस्तावेज़ तक सीमित है जिससे आपने निकाला है; क्रॉस-दस्तावेज़ पहचान आपकी ज़िम्मेदारी है।
Entity Enricher पहले से ही PDF, Office फ़ाइलें और इमेज मूल रूप से इनजेस्ट करता है — और किसी parser के आउटपुट को इनपुट के रूप में ले सकता है।
एक बेहतरीन upstream parser। इसका उपयोग कठिन दस्तावेज़ तैयार करने के लिए करें, फिर परिणाम को Entity Enricher में enrich करें।
| फ़ीचर | Entity Enricher | LlamaExtract |
|---|---|---|
| कस्टम आउटपुट स्कीमा | ||
| दस्तावेज़ों से संरचित निष्कर्षण | ||
| LLM के विश्व ज्ञान से एनरिच करें | ||
| स्रोत के रूप में लाइव वेब सर्च | ||
| मल्टी-मॉडल फैन-आउट (समानांतर में 2+ LLM) | ||
| फ़ील्ड-स्तरीय फ्यूजन और कॉन्फ्लिक्ट समाधान | ||
| आर्बिट्रेशन ऑडिट ट्रेल | ||
| सिमैंटिक ID (पहचान / डीडुप) | ||
| प्री-फ्लाइट एंटिटी क्लासिफिकेशन | ||
| बहुभाषी आउटपुट (40 भाषाएँ) | ||
| बैच प्रोसेसिंग और स्ट्रीमिंग प्रगति | ||
| अपनी खुद की keys लाएं / सेल्फ-होस्टेड मॉडल | आंशिक | |
| REST API + MCP + n8n / Make सरफ़ेस | API + SDK | |
| बेजोड़ दस्तावेज़ पार्सिंग | बिल्ट-इन | |
| मूल्य निर्धारण मॉडल | पे-पर-टोकन (BYOK) | प्रति-पेज / credits |
पे-पर-टोकन
अपनी खुद की LLM API keys लाएं और उपभोग किए गए टोकन के लिए सीधे अपने प्रोवाइडर को भुगतान करें। डॉक्युमेंट इनजेशन बिल्ट-इन है, इसलिए अधिकांश फ़ाइलों के लिए कोई अलग पार्सिंग बिल नहीं है।
प्रति-पेज / credits
पार्स और एक्सट्रैक्ट किए गए पेजों के आधार पर मीटर किया जाता है, LlamaCloud credit टियर्स पर (शुरुआत के लिए एक फ्री टियर के साथ)। लागत entity संख्या के बजाय डॉक्युमेंट वॉल्यूम और पेज संख्या के अनुसार बढ़ती है।
मूल्य निर्धारण सार्वजनिक रूप से प्रकाशित टियर्स को दर्शाता है और बदल सकता है — मौजूदा दरों के लिए हर वेंडर की जाँच करें।
दस्तावेज़ पार्स करें और मॉडल ज्ञान व वेब से एनरिच करें — मल्टी-मॉडल आर्बिट्रेशन, ऑडिट ट्रेल, और सिमेंटिक-ID पहचान के साथ, सब एक ही पाइपलाइन में।
मुफ़्त में शुरू करें