दस्तावेज़ अटैचमेंट - Entity Enricher दस्तावेज़ीकरण

दस्तावेज़ अटैचमेंट

किसी भी enrichment, schema जनरेशन, सैंपल जनरेशन, AI schema एडिट या playground रिक्वेस्ट में PDF, इमेज, ऑडियो रिकॉर्डिंग, Office डॉक्युमेंट, स्प्रेडशीट, स्लाइड और टेक्स्ट फ़ाइलें attach करें। फ़ाइलें model तक या तो नेटिव बाइट्स के रूप में पहुँचती हैं (PDF-, विज़न- और ऑडियो-सक्षम models के लिए) या सर्वर-द्वारा निकाले गए टेक्स्ट के रूप में prompt में इनलाइन कर दी जाती हैं — किसी मैनुअल OCR, ट्रांसक्रिप्शन, कन्वर्ज़न या चंकिंग की आवश्यकता नहीं।

आप दस्तावेज़ कहां अटैच कर सकते हैं

सिंगल एनरिचमेंट

JSON इनपुट के साथ प्रति-record attachment

बैच एनरिचमेंट

batch में हर entity पर लागू किए गए साझा attachments

स्कीमा जनरेशन (गाइडेड)

एक उदाहरण दस्तावेज़ से schema जेनरेट करें

नमूना JSON जनरेशन

स्रोत फ़ाइल से एक नमूना एंटिटी निकालें

AI स्कीमा एडिटिंग

प्राकृतिक भाषा + एक संदर्भ दस्तावेज़ के साथ स्कीमा को परिष्कृत करें

प्लेग्राउंड

attachment के साथ फ्री-फ़ॉर्म कस्टम prompt

दो डिलीवरी मोड

प्रत्येक समर्थित MIME प्रकार का एक एडमिन द्वारा कॉन्फ़िगर किया गया डिलीवरी मोड होता है। यह मोड निर्धारित करता है कि फ़ाइल model तक कैसे पहुँचती है।

binaryनेटिव बाइट्स

मूल बाइट्स मॉडल को BinaryContent के रूप में पास किए जाते हैं। मॉडल फ़ाइल को सीधे पढ़ता है — कोई सर्वर-साइड प्रीप्रोसेसिंग नहीं।

मिलान करने वाले कैपेबिलिटी फ़्लैग वाले model की आवश्यकता होती है (PDF के लिए supports_pdf_input, इमेज के लिए supports_vision, ऑडियो के लिए supports_audio_input)। model पिकर स्वचालित रूप से केवल संगत models दिखाने के लिए फ़िल्टर हो जाता है।

inline_textनिकाला गया टेक्स्ट

एक सर्वर-साइड एक्सट्रैक्टर अपलोड के समय एक बार चलता है और परिणामी टेक्स्ट को कैश कर लेता है। हर बाद के LLM कॉल पर कैश किया गया टेक्स्ट user prompt में इनलाइन कर दिया जाता है।

किसी model क्षमता की आवश्यकता नहीं — हर model के साथ काम करता है। Plain text और Markdown एक्सट्रैक्टर को छोड़कर सीधे raw bytes को डिकोड करते हैं।

समर्थित फ़ॉर्मैट

19 फ़ॉर्मेट डिफ़ॉल्ट रूप से सक्षम आते हैं। सिस्टम एडमिनिस्ट्रेटर किसी भी फ़ॉर्मेट को binary और inline_text मोड के बीच बदल सकते हैं, उसका लेबल बदल सकते हैं, या उसे Model Management → Document policies से पूरी तरह अक्षम कर सकते हैं।

फ़ॉर्मैट	एक्सटेंशन	डिफ़ॉल्ट मोड	क्षमता / एक्सट्रैक्टर
PDF दस्तावेज़	.pdf	binary	`supports_pdf_input`
PNG इमेज	.png	binary	`supports_vision`
JPEG छवि	.jpg, .jpeg	binary	`supports_vision`
MP3 ऑडियो	.mp3	binary	`supports_audio_input`
WAV ऑडियो	.wav	binary	`supports_audio_input`
M4A ऑडियो	.m4a	binary	`supports_audio_input`
OGG ऑडियो	.ogg, .oga	binary	`supports_audio_input`
FLAC ऑडियो	.flac	binary	`supports_audio_input`
सादा टेक्स्ट	.txt	inline_text	रॉ डिकोड
Markdown	.md, .markdown	inline_text	रॉ डिकोड
Word (लीगेसी .doc)	.doc	binary	docx2txt
Word (.docx)	.docx	binary	python-docx
OpenDocument text	.odt	binary	odfpy
Rich Text Format	.rtf	binary	striprtf
EPUB ईबुक	.epub	binary	ebooklib
HTML	.html, .htm	binary	beautifulsoup
CSV	.csv	binary	csv (stdlib)
स्प्रेडशीट (.xlsx)	.xlsx	binary	openpyxl
प्रेज़ेंटेशन (.pptx)	.pptx	binary	python-pptx

सीमाएँ

10 MB

प्रति फ़ाइल

इस सीमा से ऊपर के अपलोड अस्वीकार करें

50 MB

प्रति अनुरोध

एक ही अपलोड की सभी फ़ाइलों का योग

कोई सीमा नहीं

फ़ाइल संख्या

केवल 50 MB प्रति-अनुरोध कुल द्वारा सीमित

निकाले गए टेक्स्ट की सीमा: प्रति अटैचमेंट 500 KB — सर्वर-साइड निकालते समय लंबे स्रोत दस्तावेज़ छोटे कर दिए जाते हैं। एक्सट्रैक्टर टाइमआउट: प्रति अटैचमेंट 10 सेकंड (टाइमआउट से अधिक अपलोड फिर भी सफल होते हैं; फ़ाइल सहेजी जाती है लेकिन उसका निकाला गया टेक्स्ट खाली रहता है)।

लाइफ़साइकल

अपलोड करें

किसी भी समर्थित पेज के अटैचमेंट पैनल में फ़ाइलें ड्रैग-एंड-ड्रॉप करें या चुनें। ब्राउज़र द्वारा दिया गया कंटेंट टाइप विश्वसनीय नहीं है — सर्वर मैजिक बाइट्स को सूँघता है और अनुमति-सूची से बाहर की किसी भी चीज़ को अस्वीकार कर देता है। प्रत्येक फ़ाइल को हैश (SHA-256) किया जाता है और एन्क्रिप्टेड ब्लॉक स्टोरेज पर संग्रहीत किया जाता है।

कंटेंट के आधार पर डीडुप

एक ही संगठन के भीतर दो बार अपलोड किए गए समान बाइट्स एक ही संग्रहीत फ़ाइल में डीडुप्लिकेट हो जाते हैं। दो अलग-अलग संगठन एक ही फ़ाइल अपलोड करें तो दो स्वतंत्र पंक्तियाँ बनती हैं — कोई क्रॉस-टेनेंट लीकेज नहीं। डीडुप कुंजी (organization_id, sha256) है।

एक बार निकालें (inline_text मोड)

inline_text फ़ॉर्मैट के लिए, एक्सट्रैक्टर अपलोड के समय चलता है और परिणामी टेक्स्ट attachment पंक्ति पर कैश हो जाता है। बाद की LLM कॉल कैश किए गए टेक्स्ट का पुनः उपयोग करती हैं — कोई पुनः-एक्सट्रैक्शन लागत नहीं। binary फ़ॉर्मैट यह चरण छोड़ देते हैं।

किसी भी जॉब में ID द्वारा संदर्भ दें

अपलोड होने के बाद, attachments को बाद के enrichment, schema-generation या playground अनुरोधों में ID द्वारा पास किया जाता है। प्रत्येक attachment को model के user content में या तो native bytes (binary mode) या inlined text (inline_text mode) के रूप में जोड़ा जाता है, जिससे मूल फ़ाइलनाम सुरक्षित रहता है।

record पर सहेजा गया

जब कोई संवर्धन रिकॉर्ड सहेजा जाता है, तो अटैचमेंट ID उससे लिंक हो जाते हैं। रिकॉर्ड विवरण पृष्ठ सभी अटैचमेंट को डाउनलोड बटन के साथ सूचीबद्ध करता है। रिकॉर्ड को दोबारा अपलोड किए बिना फिर से मर्ज या रिट्राई किया जा सकता है।

पूर्ण होने पर हटाएँ (वैकल्पिक)

जब आपको किसी फ़ाइल की ज़रूरत न रहे, तो उसे DELETE /api/attachments/{id} से हटा दें — enrichment के बाद का एक सुविधाजनक क्लीनअप कदम। हटाना org-scoped होता है और { success, id, filename } लौटाता है।

अटैचमेंट को केवल वेब UI से ही नहीं, बल्कि प्रोग्रामेटिक रूप से भी अपलोड और डिलीट किया जा सकता है: n8n कनेक्टर नेटिव multipart के ज़रिए अपलोड करता है, Make.com और MCP कनेक्टर base64 JSON रूट के ज़रिए अपलोड करते हैं, और कोई भी क्लाइंट सीधे REST API का उपयोग कर सकता है (क्लीनअप के लिए DELETE /api/attachments/{id})।

ऑटोमैटिक मॉडल फ़िल्टरिंग

जब आप कोई कैपेबिलिटी आवश्यकता वाली बाइनरी फ़ाइल (PDF, इमेज या ऑडियो) अटैच करते हैं, तो मॉडल पिकर फ़िल्टर होकर केवल वही मॉडल दिखाता है जो उस कैपेबिलिटी की घोषणा करते हैं। यदि आप अलग-अलग आवश्यकताओं वाली कई फ़ाइलें अटैच करते हैं, तो केवल सभी आवश्यकताओं को पूरा करने वाले मॉडल ही दिखते हैं।

अटैच की गई फ़ाइलें	योग्य models
1 PDF	`supports_pdf_input`
1 PNG	`supports_vision`
1 MP3	`supports_audio_input`
1 PDF + 1 PNG	`supports_pdf_input` और `supports_vision`
1 DOCX (बाइनरी मोड, कोई क्षमता नहीं)	सभी मॉडल — जब कोई क्षमता फ़्लैग सेट नहीं होता तो नेटिव बाइट समर्थन मान लिया जाता है
1 TXT या 1 MD (inline_text मोड)	सभी मॉडल — टेक्स्ट को प्रॉम्प्ट में इनलाइन किया जाता है

मूल्य निर्धारण और टोकन उपयोग

अटैचमेंट का बिलिंग मॉडल प्रोवाइडर द्वारा रिपोर्ट किए गए इनपुट टोकन के रूप में किया जाता है — Entity Enricher प्रति-दस्तावेज़ कोई अलग शुल्क नहीं लेता। लागत फ़ाइल प्रकार और चयनित मॉडल पर निर्भर करती है।

PDF, इमेज और ऑडियो (binary मोड)

model-विशिष्ट इनपुट टोकन खर्च करते हैं। Anthropic प्रति PDF पेज लगभग 1700 टोकन चार्ज करता है; OpenAI विज़न इनपुट की कीमत टाइल संख्या के अनुसार लेता है; ऑडियो-सक्षम models ऑडियो इनपुट को उसकी अवधि के अनुपात में मीटर करते हैं। अपने model का प्राइसिंग कार्ड Models & Pricing में देखें।

ऑफ़िस डॉक्स और स्प्रेडशीट (निकाला गया टेक्स्ट)

एक्सट्रैक्ट किया गया टेक्स्ट स्टैंडर्ड टेक्स्ट रेट पर इनपुट टोकन खर्च करता है। बड़े डॉक्युमेंट 500 KB एक्सट्रैक्टेड टेक्स्ट तक सीमित होते हैं — इससे लंबा कंटेंट ट्रंकेट कर दिया जाता है।

सुरक्षा और टेनेंसी

मैजिक-बाइट स्निफिंग के साथ MIME allow-list

ब्राउज़र द्वारा दिया गया कंटेंट टाइप अनदेखा किया जाता है। सर्वर फ़ाइल हेडर की जाँच करता है और कॉन्फ़िगर की गई अनुमति-सूची से बाहर की किसी भी चीज़ को अस्वीकार कर देता है।

संगठन-स्कोप्ड स्टोरेज

हर फ़ाइल अपने स्वामी organization के अंतर्गत संग्रहीत होती है। डाउनलोड एंडपॉइंट org सदस्यता लागू करता है — API के ज़रिए किसी अन्य टेनेंट की फ़ाइलों तक पहुँचने का कोई रास्ता नहीं है।

सैंडबॉक्स्ड एक्सट्रैक्टर

हर extractor एक try/except सीमा के भीतर 10-सेकंड वॉल-क्लॉक टाइमआउट के साथ चलता है। कोई ख़राब व्यवहार वाली फ़ाइल API प्रोसेस को रोक या क्रैश नहीं कर सकती।

रेस्ट पर एन्क्रिप्टेड

attachment बाइट्स एन्क्रिप्टेड ब्लॉक स्टोरेज पर रहते हैं, जो प्रतिबंधित अनुमतियों के साथ एप्लिकेशन कंटेनर में माउंट किए जाते हैं।

एडमिन-नियंत्रित प्रति-MIME नीतियाँ

सिस्टम एडमिनिस्ट्रेटर किसी भी फ़ॉर्मैट को ग्लोबल रूप से निष्क्रिय कर सकते हैं, किसी फ़ॉर्मैट को binary से inline_text (या इसके विपरीत) में बदल सकते हैं, या उसका लेबल बदल सकते हैं। बदलाव उस MIME टाइप के अगले अपलोड पर प्रभावी होते हैं।

संवर्धन प्रवाह

अटैचमेंट पाइपलाइन में कैसे फ़िट होते हैं

स्कीमा जनरेशन