Allegati documento - Documentazione di Entity Enricher

Allegati documento

Allega PDF, immagini, registrazioni audio, documenti Office, fogli di calcolo, diapositive e file di testo a qualsiasi richiesta di arricchimento, generazione di schemi, generazione di campioni, modifica di schemi con IA o playground. I file raggiungono il modello come byte nativi (per i modelli in grado di gestire PDF, immagini e audio) oppure come testo estratto dal server e inserito nel prompt — senza necessità di OCR, trascrizione, conversione o suddivisione manuali.

Dove è possibile allegare documenti

Arricchimento singolo

Allegati per record insieme all'input JSON

Arricchimento in batch

Allegati condivisi applicati a ogni entità del batch

Generazione dello schema (guidata)

Genera uno schema da un documento di esempio

Generazione di JSON di esempio

Estrai un'entity di esempio da un file di origine

Modifica dello schema con AI

Affina uno schema con il linguaggio naturale + un documento di riferimento

Playground

Prompt personalizzati in formato libero con attachment

Due modalità di consegna

Ogni tipo MIME supportato ha una modalità di consegna configurata dall'amministratore. La modalità determina come il file raggiunge il modello.

binaryByte nativi

I byte originali vengono passati al modello come BinaryContent. Il modello legge il file direttamente — nessuna preelaborazione lato server.

Richiede un modello con il flag di capacità corrispondente (supports_pdf_input per i PDF,supports_vision per le immagini,supports_audio_input per l'audio). Il selettore dei modelli viene filtrato automaticamente per mostrare solo i modelli compatibili.

inline_textTesto estratto

Un estrattore lato server viene eseguito una sola volta al momento del caricamento e memorizza nella cache il testo risultante. A ogni successiva chiamata LLM il testo memorizzato viene inserito nel prompt utente.

Nessuna capacità del modello richiesta — funziona con qualsiasi modello. Il testo semplice e il Markdown saltano l'estrattore e decodificano direttamente i byte grezzi.

Formati supportati

19 formati sono abilitati per impostazione predefinita. Gli amministratori di sistema possono alternare qualsiasi formato tra la modalità binary einline_text, modificarne l'etichetta o disabilitarlo completamente da Gestione modelli → Criteri documenti.

Formato	Estensioni	Modalità predefinita	Funzionalità / estrattore
Documento PDF	.pdf	binary	`supports_pdf_input`
Immagine PNG	.png	binary	`supports_vision`
Immagine JPEG	.jpg, .jpeg	binary	`supports_vision`
Audio MP3	.mp3	binary	`supports_audio_input`
Audio WAV	.wav	binary	`supports_audio_input`
Audio M4A	.m4a	binary	`supports_audio_input`
Audio OGG	.ogg, .oga	binary	`supports_audio_input`
Audio FLAC	.flac	binary	`supports_audio_input`
Testo semplice	.txt	inline_text	decodifica raw
Markdown	.md, .markdown	inline_text	decodifica raw
Word (.doc legacy)	.doc	binary	docx2txt
Word (.docx)	.docx	binary	python-docx
Testo OpenDocument	.odt	binary	odfpy
Rich Text Format	.rtf	binary	striprtf
Ebook EPUB	.epub	binary	ebooklib
HTML	.html, .htm	binary	beautifulsoup
CSV	.csv	binary	csv (stdlib)
Foglio di calcolo (.xlsx)	.xlsx	binary	openpyxl
Presentazione (.pptx)	.pptx	binary	python-pptx

Limiti

10 MB

Per file

Rifiuta il caricamento oltre questo limite

50 MB

Per richiesta

Somma di tutti i file in un singolo caricamento

Nessun limite

Numero di file

Limitato solo dal totale di 50 MB per richiesta

Limite del testo estratto: 500 KB per allegato — i documenti sorgente più lunghi vengono troncati durante l'estrazione lato server. Timeout dell'estrattore: 10 s effettivi per allegato (i caricamenti che superano il timeout vengono comunque completati; il file viene memorizzato ma il suo testo estratto è vuoto).

Ciclo di vita

Carica

Trascinare e rilasciare o selezionare i file nel pannello degli allegati di qualsiasi pagina supportata. Il tipo di contenuto fornito dal browser non è considerato attendibile: il server analizza i magic byte e rifiuta qualsiasi elemento non incluso nell'allow-list. Ogni file viene sottoposto ad hashing (SHA-256) e archiviato su block storage crittografato.

Deduplicazione per contenuto

Byte identici caricati due volte all'interno della stessa organizzazione vengono deduplicati in un unico file archiviato. Due organizzazioni diverse che caricano lo stesso file producono due righe indipendenti, senza fughe tra tenant. La chiave di deduplicazione è (organization_id, sha256).

Estrai una volta (modalità inline_text)

Per i formati inline_text, l'estrattore viene eseguito al momento del caricamento e il testo risultante viene memorizzato nella cache sulla riga dell'attachment. Le chiamate LLM successive riutilizzano il testo memorizzato — senza costi di ri-estrazione. I formati binary saltano questo passaggio.

Fai riferimento tramite ID in qualsiasi job

Una volta caricati, gli allegati vengono passati tramite ID nelle successive richieste di arricchimento, generazione di schema o playground. Ogni allegato viene aggiunto al contenuto utente del modello come byte nativi (modalità binary) o testo inline (modalità inline_text), conservando il nome file originale.

Reso persistente nel record

Quando un record di arricchimento viene salvato, gli ID degli allegati vengono collegati ad esso. La pagina di dettaglio del record elenca tutti gli allegati con un pulsante di download. I record possono essere nuovamente fusi o ritentati senza dover ricaricare i file.

Elimina al termine (opzionale)

Quando un file non serve più, eliminatelo con DELETE /api/attachments/{id} — un comodo passaggio di pulizia post-arricchimento. L'eliminazione è limitata all'organizzazione e restituisce { success, id, filename }.

Gli allegati possono essere caricati ed eliminati in modo programmatico, non solo dall'interfaccia web: il connettore n8n carica tramite multipart nativo, i connettori Make.com e MCP caricano tramite il percorso JSON base64 e qualsiasi client può usare direttamente l'API REST (DELETE /api/attachments/{id} per la pulizia).

Filtraggio automatico dei modelli

Quando si allega un file binario con un requisito di capacità (PDF, immagine o audio), il selettore dei modelli viene filtrato per mostrare solo i modelli che dichiarano tale capacità. Se si allegano più file con requisiti diversi, vengono mostrati solo i modelli che soddisfano tutti i requisiti.

File allegati	Modelli idonei
1 PDF	`supports_pdf_input`
1 PNG	`supports_vision`
1 MP3	`supports_audio_input`
1 PDF + 1 PNG	`supports_pdf_input` E `supports_vision`
1 DOCX (modalità binaria, nessuna capacità)	Tutti i modelli — il supporto nativo per i byte è presunto quando non è impostato alcun flag di capacità
1 TXT o 1 MD (modalità inline_text)	Tutti i modelli — il testo viene incorporato nel prompt

Prezzi e utilizzo dei token

Gli allegati vengono fatturati come token di input riportati dal provider del modello — Entity Enricher non applica una tariffa separata per documento. Il costo dipende dal tipo di file e dal modello selezionato.

PDF, immagini e audio (modalità binaria)

Consumano token di input specifici del modello. Anthropic addebita circa 1700 token per pagina PDF; OpenAI calcola il prezzo degli input visivi in base al numero di riquadri; i modelli in grado di gestire l'audio misurano l'input audio in proporzione alla sua durata. Consulta la scheda dei prezzi del tuo modello in Modelli e prezzi.

Documenti Office e fogli di calcolo (testo estratto)

Il testo estratto consuma token di input alla tariffa standard per il testo. I documenti di grandi dimensioni sono limitati a 500 KB di testo estratto — i contenuti più lunghi vengono troncati.

Sicurezza e tenancy

Elenco consentiti MIME con rilevamento magic-byte

Il content type fornito dal browser viene ignorato. Il server ispeziona le intestazioni dei file e rifiuta tutto ciò che non rientra nell'allow-list configurata.

Archiviazione con ambito dell'organizzazione

Ogni file viene archiviato sotto l'organization proprietaria. L'endpoint di download applica l'appartenenza all'organization: non esiste alcun percorso attraverso l'API per raggiungere i file di un altro tenant.

Estrattori in sandbox

Ogni estrattore viene eseguito con un timeout di 10 secondi in tempo reale all'interno di un blocco try/except. Un file che si comporta in modo anomalo non può bloccare o arrestare il processo API.

Crittografato a riposo

I byte degli allegati risiedono su storage a blocchi cifrato, montato nel container dell'applicazione con permessi limitati.

Criteri per tipo MIME controllati dall'amministratore

Gli amministratori di sistema possono disattivare qualsiasi formato a livello globale, cambiare un formato da binary a inline_text (o viceversa) o rinominarlo. Le modifiche hanno effetto al successivo caricamento di quel tipo MIME.

Flusso di arricchimento

Come gli allegati si integrano nella pipeline

Generazione dello schema