Attachments de documentos - Documentação do Entity Enricher

Attachments de documentos

Anexe PDFs, imagens, gravações de áudio, documentos Office, folhas de cálculo, slides e ficheiros de texto a qualquer pedido de enriquecimento, geração de esquemas, geração de amostras, edição de esquemas com IA ou playground. Os ficheiros chegam ao modelo como bytes nativos (para modelos com capacidade de PDF, visão e áudio) ou como texto extraído no servidor e inserido no prompt — sem necessidade de OCR, transcrição, conversão ou divisão manuais.

Onde Pode Anexar Documentos

Enriquecimento individual

Anexos por registo juntamente com entrada JSON

Enriquecimento em lote

Anexos partilhados aplicados a todas as entidades do lote

Geração de esquemas (guiada)

Gere um schema a partir de um documento de exemplo

Geração de JSON de exemplo

Extrair uma entidade de exemplo a partir de um ficheiro de origem

Edição de esquemas com IA

Refine um esquema com linguagem natural + um documento de referência

Playground

Prompts personalizados de formato livre com anexos

Dois Modos de Entrega

Cada tipo MIME suportado tem um modo de entrega configurado pelo administrador. O modo determina como o ficheiro chega ao model.

binaryBytes nativos

Os bytes originais são passados ao modelo como BinaryContent. O modelo lê o ficheiro diretamente — sem pré-processamento do lado do servidor.

Requer um modelo com a flag de capacidade correspondente (supports_pdf_input para PDFs,supports_vision para imagens,supports_audio_input para áudio). O seletor de modelos é filtrado automaticamente para mostrar apenas modelos compatíveis.

inline_textTexto extraído

Um extrator do lado do servidor é executado uma vez no momento do carregamento e coloca em cache o texto resultante. Em cada chamada LLM subsequente, o texto em cache é incorporado no prompt do utilizador.

Nenhuma capacidade de modelo necessária — funciona com todos os modelos. Texto simples e Markdown ignoram o extrator e descodificam os bytes brutos diretamente.

Formatos suportados

19 formatos são ativados por predefinição. Os administradores de sistema podem alternar qualquer formato entre o modo binary einline_text, alterar o respetivo rótulo ou desativá-lo por completo em Gestão de Modelos → Políticas de documentos.

Formato	Extensões	Modo predefinido	Capacidade / extrator
Documento PDF	.pdf	binary	`supports_pdf_input`
Imagem PNG	.png	binary	`supports_vision`
Imagem JPEG	.jpg, .jpeg	binary	`supports_vision`
Áudio MP3	.mp3	binary	`supports_audio_input`
Áudio WAV	.wav	binary	`supports_audio_input`
Áudio M4A	.m4a	binary	`supports_audio_input`
Áudio OGG	.ogg, .oga	binary	`supports_audio_input`
Áudio FLAC	.flac	binary	`supports_audio_input`
Texto simples	.txt	inline_text	descodificação em bruto
Markdown	.md, .markdown	inline_text	descodificação em bruto
Word (.doc antigo)	.doc	binary	docx2txt
Word (.docx)	.docx	binary	python-docx
Texto OpenDocument	.odt	binary	odfpy
Rich Text Format	.rtf	binary	striprtf
Ebook EPUB	.epub	binary	ebooklib
HTML	.html, .htm	binary	beautifulsoup
CSV	.csv	binary	csv (stdlib)
Folha de cálculo (.xlsx)	.xlsx	binary	openpyxl
Apresentação (.pptx)	.pptx	binary	python-pptx

Limites

10 MB

Por ficheiro

Rejeitar carregamentos acima deste limite

50 MB

Por pedido

Soma de todos os ficheiros num único carregamento

Sem limite

Número de ficheiros

Limitado apenas pelo total de 50 MB por pedido

Limite de texto extraído: 500 KB por anexo — os documentos de origem mais longos são truncados quando extraídos no servidor. Tempo limite do extrator: 10s de tempo real por anexo (os carregamentos que excedem o tempo limite continuam a ser bem-sucedidos; o ficheiro é guardado, mas o seu texto extraído fica vazio).

Ciclo de vida

Carregar

Arraste e largue ou selecione ficheiros no painel de anexos de qualquer página suportada. O tipo de conteúdo fornecido pelo navegador não é fidedigno — o servidor analisa os magic bytes e rejeita tudo o que esteja fora da lista de permissões. Cada ficheiro é submetido a hash (SHA-256) e armazenado em armazenamento de blocos encriptado.

Desduplicar por conteúdo

Bytes idênticos carregados duas vezes dentro da mesma organization são deduplicados para um único ficheiro armazenado. Duas organizations diferentes que carreguem o mesmo ficheiro produzem duas linhas independentes — sem fugas entre inquilinos. A chave de deduplicação é (organization_id, sha256).

Extrair uma vez (modo inline_text)

Para formatos inline_text, o extrator é executado no momento do carregamento e o texto resultante é armazenado em cache na linha do anexo. As chamadas LLM subsequentes reutilizam o texto em cache — sem custo de reextração. Os formatos binary ignoram este passo.

Referenciar por ID em qualquer tarefa

Depois de carregados, os anexos são passados por ID nos pedidos subsequentes de enriquecimento, geração de esquema ou playground. Cada anexo é adicionado ao conteúdo de utilizador do modelo como bytes nativos (modo binário) ou texto embutido (modo inline_text), preservando o nome de ficheiro original.

Persistido no registo

Quando um record de enriquecimento é guardado, os IDs dos attachments são associados a ele. A página de detalhe do record lista todos os attachments com um botão de transferência. Os records podem ser refundidos ou repetidos sem novo carregamento.

Eliminar quando concluído (opcional)

Quando já não precisar de um ficheiro, elimine-o com DELETE /api/attachments/{id} — um prático passo de limpeza pós-enriquecimento. A eliminação é limitada à organização e devolve { success, id, filename }.

Os anexos podem ser carregados e eliminados programaticamente, não apenas a partir da interface web: o conector n8n carrega através de multipart nativo, os conectores Make.com e MCP carregam através da rota base64 JSON, e qualquer cliente pode usar diretamente a REST API (DELETE /api/attachments/{id} para limpeza).

Filtragem automática de modelos

Quando anexa um ficheiro binário com um requisito de capacidade (PDF, imagem ou áudio), o seletor de modelos é filtrado para mostrar apenas os modelos que declaram essa capacidade. Se anexar vários ficheiros com requisitos diferentes, apenas aparecem os modelos que satisfazem todos os requisitos.

Ficheiros anexados	Models elegíveis
1 PDF	`supports_pdf_input`
1 PNG	`supports_vision`
1 MP3	`supports_audio_input`
1 PDF + 1 PNG	`supports_pdf_input` E `supports_vision`
1 DOCX (modo binário, sem capacidade)	Todos os modelos — assume-se suporte nativo de bytes quando nenhum sinalizador de capacidade está definido
1 TXT ou 1 MD (modo inline_text)	Todos os modelos — o texto é incorporado no prompt

Preços e utilização de tokens

Os anexos são faturados como tokens de entrada reportados pelo provider do model — o Entity Enricher não cobra uma taxa separada por documento. O custo depende do tipo de ficheiro e do model selecionado.

PDFs, imagens e áudio (modo binário)

Consomem tokens de entrada específicos de cada modelo. A Anthropic cobra cerca de 1700 tokens por página de PDF; a OpenAI cobra as entradas de visão pelo número de blocos; os modelos com capacidade de áudio medem a entrada de áudio em proporção à respetiva duração. Consulte a ficha de preços do seu modelo em Modelos e Preços.

Documentos e folhas de cálculo do Office (texto extraído)

O texto extraído consome tokens de entrada à taxa padrão de texto. Documentos grandes estão limitados a 500 KB de texto extraído — conteúdo mais longo é truncado.

Segurança e Multitenância

Lista de permissões MIME com deteção de magic bytes

O tipo de conteúdo fornecido pelo browser é ignorado. O servidor inspeciona os cabeçalhos do ficheiro e rejeita tudo o que esteja fora da lista de permissões configurada.

Armazenamento delimitado à organização

Cada ficheiro é armazenado sob a organização a que pertence. O endpoint de transferência impõe a pertença à organização — não há qualquer caminho através da API para aceder aos ficheiros de outro inquilino.

Extratores em sandbox

Cada extrator é executado com um tempo-limite real de 10 segundos dentro de um bloco try/except. Um ficheiro problemático não pode bloquear nem fazer falhar o processo da API.

Encriptado em repouso

Os bytes dos anexos residem em armazenamento de blocos encriptado, montado no contentor da aplicação com permissões restritas.

Políticas por MIME controladas pelo administrador

Os administradores do sistema podem desativar qualquer formato globalmente, alterar um formato de binary para inline_text (ou vice-versa) ou renomeá-lo. As alterações entram em vigor no próximo carregamento desse tipo MIME.

Fluxo de enriquecimento

Como os attachments se integram no pipeline

Geração de Esquemas