Attachments de documentos - Documentação do Entity Enricher

Attachments de documentos

Anexe PDFs, imagens, gravações de áudio, documentos Office, folhas de cálculo, slides e ficheiros de texto a qualquer pedido de enriquecimento, geração de esquemas, geração de amostras, edição de esquemas com IA ou playground. Os ficheiros chegam ao modelo como bytes nativos (para modelos com capacidade de PDF, visão e áudio) ou como texto extraído no servidor e inserido no prompt — sem necessidade de OCR, transcrição, conversão ou divisão manuais.

Onde Pode Anexar Documentos

Enriquecimento individual
Anexos por registo juntamente com entrada JSON
Enriquecimento em lote
Anexos partilhados aplicados a todas as entidades do lote
Geração de esquemas (guiada)
Gere um schema a partir de um documento de exemplo
Geração de JSON de exemplo
Extrair uma entidade de exemplo a partir de um ficheiro de origem
Edição de esquemas com IA
Refine um esquema com linguagem natural + um documento de referência
Playground
Prompts personalizados de formato livre com anexos

Dois Modos de Entrega

Cada tipo MIME suportado tem um modo de entrega configurado pelo administrador. O modo determina como o ficheiro chega ao model.

binaryBytes nativos

Os bytes originais são passados ao modelo como BinaryContent. O modelo lê o ficheiro diretamente — sem pré-processamento do lado do servidor.

Requer um modelo com a flag de capacidade correspondente (supports_pdf_input para PDFs,supports_vision para imagens,supports_audio_input para áudio). O seletor de modelos é filtrado automaticamente para mostrar apenas modelos compatíveis.

inline_textTexto extraído

Um extrator do lado do servidor é executado uma vez no momento do carregamento e coloca em cache o texto resultante. Em cada chamada LLM subsequente, o texto em cache é incorporado no prompt do utilizador.

Nenhuma capacidade de modelo necessária — funciona com todos os modelos. Texto simples e Markdown ignoram o extrator e descodificam os bytes brutos diretamente.

Formatos suportados

19 formatos são ativados por predefinição. Os administradores de sistema podem alternar qualquer formato entre o modo binary einline_text, alterar o respetivo rótulo ou desativá-lo por completo em Gestão de Modelos → Políticas de documentos.

FormatoExtensõesModo predefinidoCapacidade / extrator
Documento PDF.pdfbinarysupports_pdf_input
Imagem PNG.pngbinarysupports_vision
Imagem JPEG.jpg, .jpegbinarysupports_vision
Áudio MP3.mp3binarysupports_audio_input
Áudio WAV.wavbinarysupports_audio_input
Áudio M4A.m4abinarysupports_audio_input
Áudio OGG.ogg, .ogabinarysupports_audio_input
Áudio FLAC.flacbinarysupports_audio_input
Texto simples.txtinline_textdescodificação em bruto
Markdown.md, .markdowninline_textdescodificação em bruto
Word (.doc antigo).docbinarydocx2txt
Word (.docx).docxbinarypython-docx
Texto OpenDocument.odtbinaryodfpy
Rich Text Format.rtfbinarystriprtf
Ebook EPUB.epubbinaryebooklib
HTML.html, .htmbinarybeautifulsoup
CSV.csvbinarycsv (stdlib)
Folha de cálculo (.xlsx).xlsxbinaryopenpyxl
Apresentação (.pptx).pptxbinarypython-pptx

Limites

10 MB
Por ficheiro
Rejeitar carregamentos acima deste limite
50 MB
Por pedido
Soma de todos os ficheiros num único carregamento
Sem limite
Número de ficheiros
Limitado apenas pelo total de 50 MB por pedido
Limite de texto extraído: 500 KB por anexo — os documentos de origem mais longos são truncados quando extraídos no servidor. Tempo limite do extrator: 10s de tempo real por anexo (os carregamentos que excedem o tempo limite continuam a ser bem-sucedidos; o ficheiro é guardado, mas o seu texto extraído fica vazio).

Ciclo de vida

1
Carregar
Arraste e largue ou selecione ficheiros no painel de anexos de qualquer página suportada. O tipo de conteúdo fornecido pelo navegador não é fidedigno — o servidor analisa os magic bytes e rejeita tudo o que esteja fora da lista de permissões. Cada ficheiro é submetido a hash (SHA-256) e armazenado em armazenamento de blocos encriptado.
2
Desduplicar por conteúdo
Bytes idênticos carregados duas vezes dentro da mesma organization são deduplicados para um único ficheiro armazenado. Duas organizations diferentes que carreguem o mesmo ficheiro produzem duas linhas independentes — sem fugas entre inquilinos. A chave de deduplicação é (organization_id, sha256).
3
Extrair uma vez (modo inline_text)
Para formatos inline_text, o extrator é executado no momento do carregamento e o texto resultante é armazenado em cache na linha do anexo. As chamadas LLM subsequentes reutilizam o texto em cache — sem custo de reextração. Os formatos binary ignoram este passo.
4
Referenciar por ID em qualquer tarefa
Depois de carregados, os anexos são passados por ID nos pedidos subsequentes de enriquecimento, geração de esquema ou playground. Cada anexo é adicionado ao conteúdo de utilizador do modelo como bytes nativos (modo binário) ou texto embutido (modo inline_text), preservando o nome de ficheiro original.
5
Persistido no registo
Quando um record de enriquecimento é guardado, os IDs dos attachments são associados a ele. A página de detalhe do record lista todos os attachments com um botão de transferência. Os records podem ser refundidos ou repetidos sem novo carregamento.
6
Eliminar quando concluído (opcional)
Quando já não precisar de um ficheiro, elimine-o com DELETE /api/attachments/{id} — um prático passo de limpeza pós-enriquecimento. A eliminação é limitada à organização e devolve { success, id, filename }.

Os anexos podem ser carregados e eliminados programaticamente, não apenas a partir da interface web: o conector n8n carrega através de multipart nativo, os conectores Make.com e MCP carregam através da rota base64 JSON, e qualquer cliente pode usar diretamente a REST API (DELETE /api/attachments/{id} para limpeza).

Filtragem automática de modelos

Quando anexa um ficheiro binário com um requisito de capacidade (PDF, imagem ou áudio), o seletor de modelos é filtrado para mostrar apenas os modelos que declaram essa capacidade. Se anexar vários ficheiros com requisitos diferentes, apenas aparecem os modelos que satisfazem todos os requisitos.

Ficheiros anexadosModels elegíveis
1 PDFsupports_pdf_input
1 PNGsupports_vision
1 MP3supports_audio_input
1 PDF + 1 PNGsupports_pdf_input E supports_vision
1 DOCX (modo binário, sem capacidade)Todos os modelos — assume-se suporte nativo de bytes quando nenhum sinalizador de capacidade está definido
1 TXT ou 1 MD (modo inline_text)Todos os modelos — o texto é incorporado no prompt

Preços e utilização de tokens

Os anexos são faturados como tokens de entrada reportados pelo provider do model — o Entity Enricher não cobra uma taxa separada por documento. O custo depende do tipo de ficheiro e do model selecionado.

PDFs, imagens e áudio (modo binário)

Consomem tokens de entrada específicos de cada modelo. A Anthropic cobra cerca de 1700 tokens por página de PDF; a OpenAI cobra as entradas de visão pelo número de blocos; os modelos com capacidade de áudio medem a entrada de áudio em proporção à respetiva duração. Consulte a ficha de preços do seu modelo em Modelos e Preços.

Documentos e folhas de cálculo do Office (texto extraído)

O texto extraído consome tokens de entrada à taxa padrão de texto. Documentos grandes estão limitados a 500 KB de texto extraído — conteúdo mais longo é truncado.

Segurança e Multitenância

Lista de permissões MIME com deteção de magic bytes
O tipo de conteúdo fornecido pelo browser é ignorado. O servidor inspeciona os cabeçalhos do ficheiro e rejeita tudo o que esteja fora da lista de permissões configurada.
Armazenamento delimitado à organização
Cada ficheiro é armazenado sob a organização a que pertence. O endpoint de transferência impõe a pertença à organização — não há qualquer caminho através da API para aceder aos ficheiros de outro inquilino.
Extratores em sandbox
Cada extrator é executado com um tempo-limite real de 10 segundos dentro de um bloco try/except. Um ficheiro problemático não pode bloquear nem fazer falhar o processo da API.
Encriptado em repouso
Os bytes dos anexos residem em armazenamento de blocos encriptado, montado no contentor da aplicação com permissões restritas.
Políticas por MIME controladas pelo administrador
Os administradores do sistema podem desativar qualquer formato globalmente, alterar um formato de binary para inline_text (ou vice-versa) ou renomeá-lo. As alterações entram em vigor no próximo carregamento desse tipo MIME.