Allegati documento - Documentazione di Entity Enricher

Allegati documento

Allega PDF, immagini, registrazioni audio, documenti Office, fogli di calcolo, diapositive e file di testo a qualsiasi richiesta di arricchimento, generazione di schemi, generazione di campioni, modifica di schemi con IA o playground. I file raggiungono il modello come byte nativi (per i modelli in grado di gestire PDF, immagini e audio) oppure come testo estratto dal server e inserito nel prompt — senza necessità di OCR, trascrizione, conversione o suddivisione manuali.

Dove è possibile allegare documenti

Arricchimento singolo
Allegati per record insieme all'input JSON
Arricchimento in batch
Allegati condivisi applicati a ogni entità del batch
Generazione dello schema (guidata)
Genera uno schema da un documento di esempio
Generazione di JSON di esempio
Estrai un'entity di esempio da un file di origine
Modifica dello schema con AI
Affina uno schema con il linguaggio naturale + un documento di riferimento
Playground
Prompt personalizzati in formato libero con attachment

Due modalità di consegna

Ogni tipo MIME supportato ha una modalità di consegna configurata dall'amministratore. La modalità determina come il file raggiunge il modello.

binaryByte nativi

I byte originali vengono passati al modello come BinaryContent. Il modello legge il file direttamente — nessuna preelaborazione lato server.

Richiede un modello con il flag di capacità corrispondente (supports_pdf_input per i PDF,supports_vision per le immagini,supports_audio_input per l'audio). Il selettore dei modelli viene filtrato automaticamente per mostrare solo i modelli compatibili.

inline_textTesto estratto

Un estrattore lato server viene eseguito una sola volta al momento del caricamento e memorizza nella cache il testo risultante. A ogni successiva chiamata LLM il testo memorizzato viene inserito nel prompt utente.

Nessuna capacità del modello richiesta — funziona con qualsiasi modello. Il testo semplice e il Markdown saltano l'estrattore e decodificano direttamente i byte grezzi.

Formati supportati

19 formati sono abilitati per impostazione predefinita. Gli amministratori di sistema possono alternare qualsiasi formato tra la modalità binary einline_text, modificarne l'etichetta o disabilitarlo completamente da Gestione modelli → Criteri documenti.

FormatoEstensioniModalità predefinitaFunzionalità / estrattore
Documento PDF.pdfbinarysupports_pdf_input
Immagine PNG.pngbinarysupports_vision
Immagine JPEG.jpg, .jpegbinarysupports_vision
Audio MP3.mp3binarysupports_audio_input
Audio WAV.wavbinarysupports_audio_input
Audio M4A.m4abinarysupports_audio_input
Audio OGG.ogg, .ogabinarysupports_audio_input
Audio FLAC.flacbinarysupports_audio_input
Testo semplice.txtinline_textdecodifica raw
Markdown.md, .markdowninline_textdecodifica raw
Word (.doc legacy).docbinarydocx2txt
Word (.docx).docxbinarypython-docx
Testo OpenDocument.odtbinaryodfpy
Rich Text Format.rtfbinarystriprtf
Ebook EPUB.epubbinaryebooklib
HTML.html, .htmbinarybeautifulsoup
CSV.csvbinarycsv (stdlib)
Foglio di calcolo (.xlsx).xlsxbinaryopenpyxl
Presentazione (.pptx).pptxbinarypython-pptx

Limiti

10 MB
Per file
Rifiuta il caricamento oltre questo limite
50 MB
Per richiesta
Somma di tutti i file in un singolo caricamento
Nessun limite
Numero di file
Limitato solo dal totale di 50 MB per richiesta
Limite del testo estratto: 500 KB per allegato — i documenti sorgente più lunghi vengono troncati durante l'estrazione lato server. Timeout dell'estrattore: 10 s effettivi per allegato (i caricamenti che superano il timeout vengono comunque completati; il file viene memorizzato ma il suo testo estratto è vuoto).

Ciclo di vita

1
Carica
Trascinare e rilasciare o selezionare i file nel pannello degli allegati di qualsiasi pagina supportata. Il tipo di contenuto fornito dal browser non è considerato attendibile: il server analizza i magic byte e rifiuta qualsiasi elemento non incluso nell'allow-list. Ogni file viene sottoposto ad hashing (SHA-256) e archiviato su block storage crittografato.
2
Deduplicazione per contenuto
Byte identici caricati due volte all'interno della stessa organizzazione vengono deduplicati in un unico file archiviato. Due organizzazioni diverse che caricano lo stesso file producono due righe indipendenti, senza fughe tra tenant. La chiave di deduplicazione è (organization_id, sha256).
3
Estrai una volta (modalità inline_text)
Per i formati inline_text, l'estrattore viene eseguito al momento del caricamento e il testo risultante viene memorizzato nella cache sulla riga dell'attachment. Le chiamate LLM successive riutilizzano il testo memorizzato — senza costi di ri-estrazione. I formati binary saltano questo passaggio.
4
Fai riferimento tramite ID in qualsiasi job
Una volta caricati, gli allegati vengono passati tramite ID nelle successive richieste di arricchimento, generazione di schema o playground. Ogni allegato viene aggiunto al contenuto utente del modello come byte nativi (modalità binary) o testo inline (modalità inline_text), conservando il nome file originale.
5
Reso persistente nel record
Quando un record di arricchimento viene salvato, gli ID degli allegati vengono collegati ad esso. La pagina di dettaglio del record elenca tutti gli allegati con un pulsante di download. I record possono essere nuovamente fusi o ritentati senza dover ricaricare i file.
6
Elimina al termine (opzionale)
Quando un file non serve più, eliminatelo con DELETE /api/attachments/{id} — un comodo passaggio di pulizia post-arricchimento. L'eliminazione è limitata all'organizzazione e restituisce { success, id, filename }.

Gli allegati possono essere caricati ed eliminati in modo programmatico, non solo dall'interfaccia web: il connettore n8n carica tramite multipart nativo, i connettori Make.com e MCP caricano tramite il percorso JSON base64 e qualsiasi client può usare direttamente l'API REST (DELETE /api/attachments/{id} per la pulizia).

Filtraggio automatico dei modelli

Quando si allega un file binario con un requisito di capacità (PDF, immagine o audio), il selettore dei modelli viene filtrato per mostrare solo i modelli che dichiarano tale capacità. Se si allegano più file con requisiti diversi, vengono mostrati solo i modelli che soddisfano tutti i requisiti.

File allegatiModelli idonei
1 PDFsupports_pdf_input
1 PNGsupports_vision
1 MP3supports_audio_input
1 PDF + 1 PNGsupports_pdf_input E supports_vision
1 DOCX (modalità binaria, nessuna capacità)Tutti i modelli — il supporto nativo per i byte è presunto quando non è impostato alcun flag di capacità
1 TXT o 1 MD (modalità inline_text)Tutti i modelli — il testo viene incorporato nel prompt

Prezzi e utilizzo dei token

Gli allegati vengono fatturati come token di input riportati dal provider del modello — Entity Enricher non applica una tariffa separata per documento. Il costo dipende dal tipo di file e dal modello selezionato.

PDF, immagini e audio (modalità binaria)

Consumano token di input specifici del modello. Anthropic addebita circa 1700 token per pagina PDF; OpenAI calcola il prezzo degli input visivi in base al numero di riquadri; i modelli in grado di gestire l'audio misurano l'input audio in proporzione alla sua durata. Consulta la scheda dei prezzi del tuo modello in Modelli e prezzi.

Documenti Office e fogli di calcolo (testo estratto)

Il testo estratto consuma token di input alla tariffa standard per il testo. I documenti di grandi dimensioni sono limitati a 500 KB di testo estratto — i contenuti più lunghi vengono troncati.

Sicurezza e tenancy

Elenco consentiti MIME con rilevamento magic-byte
Il content type fornito dal browser viene ignorato. Il server ispeziona le intestazioni dei file e rifiuta tutto ciò che non rientra nell'allow-list configurata.
Archiviazione con ambito dell'organizzazione
Ogni file viene archiviato sotto l'organization proprietaria. L'endpoint di download applica l'appartenenza all'organization: non esiste alcun percorso attraverso l'API per raggiungere i file di un altro tenant.
Estrattori in sandbox
Ogni estrattore viene eseguito con un timeout di 10 secondi in tempo reale all'interno di un blocco try/except. Un file che si comporta in modo anomalo non può bloccare o arrestare il processo API.
Crittografato a riposo
I byte degli allegati risiedono su storage a blocchi cifrato, montato nel container dell'applicazione con permessi limitati.
Criteri per tipo MIME controllati dall'amministratore
Gli amministratori di sistema possono disattivare qualsiasi formato a livello globale, cambiare un formato da binary a inline_text (o viceversa) o rinominarlo. Le modifiche hanno effetto al successivo caricamento di quel tipo MIME.