दस्तावेज़ अटैचमेंट - Entity Enricher दस्तावेज़ीकरण

दस्तावेज़ अटैचमेंट

किसी भी enrichment, schema जनरेशन, सैंपल जनरेशन, AI schema एडिट या playground रिक्वेस्ट में PDF, इमेज, ऑडियो रिकॉर्डिंग, Office डॉक्युमेंट, स्प्रेडशीट, स्लाइड और टेक्स्ट फ़ाइलें attach करें। फ़ाइलें model तक या तो नेटिव बाइट्स के रूप में पहुँचती हैं (PDF-, विज़न- और ऑडियो-सक्षम models के लिए) या सर्वर-द्वारा निकाले गए टेक्स्ट के रूप में prompt में इनलाइन कर दी जाती हैं — किसी मैनुअल OCR, ट्रांसक्रिप्शन, कन्वर्ज़न या चंकिंग की आवश्यकता नहीं।

आप दस्तावेज़ कहां अटैच कर सकते हैं

सिंगल एनरिचमेंट
JSON इनपुट के साथ प्रति-record attachment
बैच एनरिचमेंट
batch में हर entity पर लागू किए गए साझा attachments
स्कीमा जनरेशन (गाइडेड)
एक उदाहरण दस्तावेज़ से schema जेनरेट करें
नमूना JSON जनरेशन
स्रोत फ़ाइल से एक नमूना एंटिटी निकालें
AI स्कीमा एडिटिंग
प्राकृतिक भाषा + एक संदर्भ दस्तावेज़ के साथ स्कीमा को परिष्कृत करें
प्लेग्राउंड
attachment के साथ फ्री-फ़ॉर्म कस्टम prompt

दो डिलीवरी मोड

प्रत्येक समर्थित MIME प्रकार का एक एडमिन द्वारा कॉन्फ़िगर किया गया डिलीवरी मोड होता है। यह मोड निर्धारित करता है कि फ़ाइल model तक कैसे पहुँचती है।

binaryनेटिव बाइट्स

मूल बाइट्स मॉडल को BinaryContent के रूप में पास किए जाते हैं। मॉडल फ़ाइल को सीधे पढ़ता है — कोई सर्वर-साइड प्रीप्रोसेसिंग नहीं।

मिलान करने वाले कैपेबिलिटी फ़्लैग वाले model की आवश्यकता होती है (PDF के लिए supports_pdf_input, इमेज के लिए supports_vision, ऑडियो के लिए supports_audio_input)। model पिकर स्वचालित रूप से केवल संगत models दिखाने के लिए फ़िल्टर हो जाता है।

inline_textनिकाला गया टेक्स्ट

एक सर्वर-साइड एक्सट्रैक्टर अपलोड के समय एक बार चलता है और परिणामी टेक्स्ट को कैश कर लेता है। हर बाद के LLM कॉल पर कैश किया गया टेक्स्ट user prompt में इनलाइन कर दिया जाता है।

किसी model क्षमता की आवश्यकता नहीं — हर model के साथ काम करता है। Plain text और Markdown एक्सट्रैक्टर को छोड़कर सीधे raw bytes को डिकोड करते हैं।

समर्थित फ़ॉर्मैट

19 फ़ॉर्मेट डिफ़ॉल्ट रूप से सक्षम आते हैं। सिस्टम एडमिनिस्ट्रेटर किसी भी फ़ॉर्मेट को binary और inline_text मोड के बीच बदल सकते हैं, उसका लेबल बदल सकते हैं, या उसे Model Management → Document policies से पूरी तरह अक्षम कर सकते हैं।

फ़ॉर्मैटएक्सटेंशनडिफ़ॉल्ट मोडक्षमता / एक्सट्रैक्टर
PDF दस्तावेज़.pdfbinarysupports_pdf_input
PNG इमेज.pngbinarysupports_vision
JPEG छवि.jpg, .jpegbinarysupports_vision
MP3 ऑडियो.mp3binarysupports_audio_input
WAV ऑडियो.wavbinarysupports_audio_input
M4A ऑडियो.m4abinarysupports_audio_input
OGG ऑडियो.ogg, .ogabinarysupports_audio_input
FLAC ऑडियो.flacbinarysupports_audio_input
सादा टेक्स्ट.txtinline_textरॉ डिकोड
Markdown.md, .markdowninline_textरॉ डिकोड
Word (लीगेसी .doc).docbinarydocx2txt
Word (.docx).docxbinarypython-docx
OpenDocument text.odtbinaryodfpy
Rich Text Format.rtfbinarystriprtf
EPUB ईबुक.epubbinaryebooklib
HTML.html, .htmbinarybeautifulsoup
CSV.csvbinarycsv (stdlib)
स्प्रेडशीट (.xlsx).xlsxbinaryopenpyxl
प्रेज़ेंटेशन (.pptx).pptxbinarypython-pptx

सीमाएँ

10 MB
प्रति फ़ाइल
इस सीमा से ऊपर के अपलोड अस्वीकार करें
50 MB
प्रति अनुरोध
एक ही अपलोड की सभी फ़ाइलों का योग
कोई सीमा नहीं
फ़ाइल संख्या
केवल 50 MB प्रति-अनुरोध कुल द्वारा सीमित
निकाले गए टेक्स्ट की सीमा: प्रति अटैचमेंट 500 KB — सर्वर-साइड निकालते समय लंबे स्रोत दस्तावेज़ छोटे कर दिए जाते हैं। एक्सट्रैक्टर टाइमआउट: प्रति अटैचमेंट 10 सेकंड (टाइमआउट से अधिक अपलोड फिर भी सफल होते हैं; फ़ाइल सहेजी जाती है लेकिन उसका निकाला गया टेक्स्ट खाली रहता है)।

लाइफ़साइकल

1
अपलोड करें
किसी भी समर्थित पेज के अटैचमेंट पैनल में फ़ाइलें ड्रैग-एंड-ड्रॉप करें या चुनें। ब्राउज़र द्वारा दिया गया कंटेंट टाइप विश्वसनीय नहीं है — सर्वर मैजिक बाइट्स को सूँघता है और अनुमति-सूची से बाहर की किसी भी चीज़ को अस्वीकार कर देता है। प्रत्येक फ़ाइल को हैश (SHA-256) किया जाता है और एन्क्रिप्टेड ब्लॉक स्टोरेज पर संग्रहीत किया जाता है।
2
कंटेंट के आधार पर डीडुप
एक ही संगठन के भीतर दो बार अपलोड किए गए समान बाइट्स एक ही संग्रहीत फ़ाइल में डीडुप्लिकेट हो जाते हैं। दो अलग-अलग संगठन एक ही फ़ाइल अपलोड करें तो दो स्वतंत्र पंक्तियाँ बनती हैं — कोई क्रॉस-टेनेंट लीकेज नहीं। डीडुप कुंजी (organization_id, sha256) है।
3
एक बार निकालें (inline_text मोड)
inline_text फ़ॉर्मैट के लिए, एक्सट्रैक्टर अपलोड के समय चलता है और परिणामी टेक्स्ट attachment पंक्ति पर कैश हो जाता है। बाद की LLM कॉल कैश किए गए टेक्स्ट का पुनः उपयोग करती हैं — कोई पुनः-एक्सट्रैक्शन लागत नहीं। binary फ़ॉर्मैट यह चरण छोड़ देते हैं।
4
किसी भी जॉब में ID द्वारा संदर्भ दें
अपलोड होने के बाद, attachments को बाद के enrichment, schema-generation या playground अनुरोधों में ID द्वारा पास किया जाता है। प्रत्येक attachment को model के user content में या तो native bytes (binary mode) या inlined text (inline_text mode) के रूप में जोड़ा जाता है, जिससे मूल फ़ाइलनाम सुरक्षित रहता है।
5
record पर सहेजा गया
जब कोई संवर्धन रिकॉर्ड सहेजा जाता है, तो अटैचमेंट ID उससे लिंक हो जाते हैं। रिकॉर्ड विवरण पृष्ठ सभी अटैचमेंट को डाउनलोड बटन के साथ सूचीबद्ध करता है। रिकॉर्ड को दोबारा अपलोड किए बिना फिर से मर्ज या रिट्राई किया जा सकता है।
6
पूर्ण होने पर हटाएँ (वैकल्पिक)
जब आपको किसी फ़ाइल की ज़रूरत न रहे, तो उसे DELETE /api/attachments/{id} से हटा दें — enrichment के बाद का एक सुविधाजनक क्लीनअप कदम। हटाना org-scoped होता है और { success, id, filename } लौटाता है।

अटैचमेंट को केवल वेब UI से ही नहीं, बल्कि प्रोग्रामेटिक रूप से भी अपलोड और डिलीट किया जा सकता है: n8n कनेक्टर नेटिव multipart के ज़रिए अपलोड करता है, Make.com और MCP कनेक्टर base64 JSON रूट के ज़रिए अपलोड करते हैं, और कोई भी क्लाइंट सीधे REST API का उपयोग कर सकता है (क्लीनअप के लिए DELETE /api/attachments/{id})।

ऑटोमैटिक मॉडल फ़िल्टरिंग

जब आप कोई कैपेबिलिटी आवश्यकता वाली बाइनरी फ़ाइल (PDF, इमेज या ऑडियो) अटैच करते हैं, तो मॉडल पिकर फ़िल्टर होकर केवल वही मॉडल दिखाता है जो उस कैपेबिलिटी की घोषणा करते हैं। यदि आप अलग-अलग आवश्यकताओं वाली कई फ़ाइलें अटैच करते हैं, तो केवल सभी आवश्यकताओं को पूरा करने वाले मॉडल ही दिखते हैं।

अटैच की गई फ़ाइलेंयोग्य models
1 PDFsupports_pdf_input
1 PNGsupports_vision
1 MP3supports_audio_input
1 PDF + 1 PNGsupports_pdf_input और supports_vision
1 DOCX (बाइनरी मोड, कोई क्षमता नहीं)सभी मॉडल — जब कोई क्षमता फ़्लैग सेट नहीं होता तो नेटिव बाइट समर्थन मान लिया जाता है
1 TXT या 1 MD (inline_text मोड)सभी मॉडल — टेक्स्ट को प्रॉम्प्ट में इनलाइन किया जाता है

मूल्य निर्धारण और टोकन उपयोग

अटैचमेंट का बिलिंग मॉडल प्रोवाइडर द्वारा रिपोर्ट किए गए इनपुट टोकन के रूप में किया जाता है — Entity Enricher प्रति-दस्तावेज़ कोई अलग शुल्क नहीं लेता। लागत फ़ाइल प्रकार और चयनित मॉडल पर निर्भर करती है।

PDF, इमेज और ऑडियो (binary मोड)

model-विशिष्ट इनपुट टोकन खर्च करते हैं। Anthropic प्रति PDF पेज लगभग 1700 टोकन चार्ज करता है; OpenAI विज़न इनपुट की कीमत टाइल संख्या के अनुसार लेता है; ऑडियो-सक्षम models ऑडियो इनपुट को उसकी अवधि के अनुपात में मीटर करते हैं। अपने model का प्राइसिंग कार्ड Models & Pricing में देखें।

ऑफ़िस डॉक्स और स्प्रेडशीट (निकाला गया टेक्स्ट)

एक्सट्रैक्ट किया गया टेक्स्ट स्टैंडर्ड टेक्स्ट रेट पर इनपुट टोकन खर्च करता है। बड़े डॉक्युमेंट 500 KB एक्सट्रैक्टेड टेक्स्ट तक सीमित होते हैं — इससे लंबा कंटेंट ट्रंकेट कर दिया जाता है।

सुरक्षा और टेनेंसी

मैजिक-बाइट स्निफिंग के साथ MIME allow-list
ब्राउज़र द्वारा दिया गया कंटेंट टाइप अनदेखा किया जाता है। सर्वर फ़ाइल हेडर की जाँच करता है और कॉन्फ़िगर की गई अनुमति-सूची से बाहर की किसी भी चीज़ को अस्वीकार कर देता है।
संगठन-स्कोप्ड स्टोरेज
हर फ़ाइल अपने स्वामी organization के अंतर्गत संग्रहीत होती है। डाउनलोड एंडपॉइंट org सदस्यता लागू करता है — API के ज़रिए किसी अन्य टेनेंट की फ़ाइलों तक पहुँचने का कोई रास्ता नहीं है।
सैंडबॉक्स्ड एक्सट्रैक्टर
हर extractor एक try/except सीमा के भीतर 10-सेकंड वॉल-क्लॉक टाइमआउट के साथ चलता है। कोई ख़राब व्यवहार वाली फ़ाइल API प्रोसेस को रोक या क्रैश नहीं कर सकती।
रेस्ट पर एन्क्रिप्टेड
attachment बाइट्स एन्क्रिप्टेड ब्लॉक स्टोरेज पर रहते हैं, जो प्रतिबंधित अनुमतियों के साथ एप्लिकेशन कंटेनर में माउंट किए जाते हैं।
एडमिन-नियंत्रित प्रति-MIME नीतियाँ
सिस्टम एडमिनिस्ट्रेटर किसी भी फ़ॉर्मैट को ग्लोबल रूप से निष्क्रिय कर सकते हैं, किसी फ़ॉर्मैट को binary से inline_text (या इसके विपरीत) में बदल सकते हैं, या उसका लेबल बदल सकते हैं। बदलाव उस MIME टाइप के अगले अपलोड पर प्रभावी होते हैं।