Adjuntos de documentos - Documentación de Entity Enricher

Adjuntos de documentos

Adjunte PDF, imágenes, grabaciones de audio, documentos de Office, hojas de cálculo, diapositivas y archivos de texto a cualquier solicitud de enriquecimiento, generación de esquemas, generación de muestras, edición de esquemas con IA o playground. Los archivos llegan al modelo como bytes nativos (para modelos con capacidad de PDF, visión y audio) o como texto extraído por el servidor e insertado en el prompt: sin necesidad de OCR, transcripción, conversión ni segmentación manuales.

Dónde puede adjuntar documentos

Enriquecimiento individual
Adjuntos por registro junto con la entrada JSON
Enriquecimiento por lotes
Adjuntos compartidos aplicados a cada entidad del lote
Generación de esquemas (guiada)
Genere un esquema a partir de un documento de ejemplo
Generación de JSON de muestra
Extraer una entidad de muestra de un archivo de origen
Edición de esquemas con IA
Refinar un schema con lenguaje natural + un documento de referencia
Playground
Prompts personalizados de forma libre con adjuntos

Dos modos de entrega

Cada tipo MIME admitido tiene un modo de entrega configurado por el administrador. El modo determina cómo llega el archivo al model.

binaryBytes nativos

Los bytes originales se pasan al modelo como BinaryContent. El modelo lee el archivo directamente, sin preprocesamiento en el servidor.

Requiere un modelo con el indicador de capacidad correspondiente (supports_pdf_input para PDF,supports_vision para imágenes,supports_audio_input para audio). El selector de modelos se filtra automáticamente para mostrar solo los modelos compatibles.

inline_textTexto extraído

Un extractor del lado del servidor se ejecuta una sola vez al subir el archivo y almacena en caché el texto resultante. En cada llamada posterior al LLM, el texto en caché se inserta en el prompt del usuario.

No se requiere ninguna capacidad del model — funciona con todos los models. El texto sin formato y Markdown omiten el extractor y decodifican los bytes sin procesar directamente.

Formatos admitidos

19 formatos vienen habilitados por defecto. Los administradores del sistema pueden cambiar cualquier formato entre el modo binary einline_text, modificar su etiqueta o deshabilitarlo por completo desde Gestión de modelos → Políticas de documentos.

FormatoExtensionesModo predeterminadoCapacidad / extractor
Documento PDF.pdfbinarysupports_pdf_input
Imagen PNG.pngbinarysupports_vision
Imagen JPEG.jpg, .jpegbinarysupports_vision
Audio MP3.mp3binarysupports_audio_input
Audio WAV.wavbinarysupports_audio_input
Audio M4A.m4abinarysupports_audio_input
Audio OGG.ogg, .ogabinarysupports_audio_input
Audio FLAC.flacbinarysupports_audio_input
Texto sin formato.txtinline_textdecodificación en bruto
Markdown.md, .markdowninline_textdecodificación en bruto
Word (.doc heredado).docbinarydocx2txt
Word (.docx).docxbinarypython-docx
Texto de OpenDocument.odtbinaryodfpy
Formato de texto enriquecido.rtfbinarystriprtf
Libro electrónico EPUB.epubbinaryebooklib
HTML.html, .htmbinarybeautifulsoup
CSV.csvbinarycsv (stdlib)
Hoja de cálculo (.xlsx).xlsxbinaryopenpyxl
Presentación (.pptx).pptxbinarypython-pptx

Límites

10 MB
Por archivo
Rechazar las cargas que superen este límite
50 MB
Por solicitud
Suma de todos los archivos en una sola carga
Sin límite
Cantidad de archivos
Limitado únicamente por el total de 50 MB por solicitud
Límite de texto extraído: 500 KB por adjunto — los documentos de origen más largos se truncan al extraerse del lado del servidor. Tiempo de espera del extractor: 10 s de reloj por adjunto (las cargas que superan el tiempo de espera aún tienen éxito; el archivo se almacena, pero su texto extraído queda vacío).

Ciclo de vida

1
Subir
Arrastre y suelte o seleccione archivos en el panel de adjuntos de cualquier página compatible. El tipo de contenido proporcionado por el navegador no es de confianza: el servidor analiza los magic bytes y rechaza todo lo que quede fuera de la lista permitida. Cada archivo se somete a hash (SHA-256) y se almacena en almacenamiento de bloques cifrado.
2
Deduplicar por contenido
Los bytes idénticos subidos dos veces dentro de la misma organización se deduplican en un único archivo almacenado. Dos organizaciones distintas que suben el mismo archivo generan dos filas independientes, sin fugas entre inquilinos. La clave de deduplicación es (organization_id, sha256).
3
Extraer una vez (modo inline_text)
Para los formatos inline_text, el extractor se ejecuta durante la carga y el texto resultante se almacena en caché en la fila del adjunto. Las llamadas posteriores al LLM reutilizan el texto en caché, sin coste de reextracción. Los formatos binary omiten este paso.
4
Referenciar por ID en cualquier trabajo
Una vez cargados, los adjuntos se pasan por ID en las solicitudes posteriores de enriquecimiento, generación de esquemas o Playground. Cada adjunto se añade al contenido de usuario del modelo como bytes nativos (modo binario) o como texto insertado (modo inline_text), conservando el nombre de archivo original.
5
Persistido en el registro
Cuando se guarda un registro de enriquecimiento, los ID de los adjuntos se vinculan a él. La página de detalles del registro enumera todos los adjuntos con un botón de descarga. Los registros se pueden volver a fusionar o reintentar sin necesidad de volver a subirlos.
6
Eliminar al finalizar (opcional)
Cuando ya no necesite un archivo, elimínelo con DELETE /api/attachments/{id}: un práctico paso de limpieza posterior al enriquecimiento. La eliminación tiene alcance de organización y devuelve { success, id, filename }.

Los adjuntos se pueden cargar y eliminar mediante programación, no solo desde la interfaz web: el conector de n8n carga mediante multipart nativo, los conectores de Make.com y MCP cargan mediante la ruta JSON en base64, y cualquier cliente puede usar la API REST directamente (DELETE /api/attachments/{id} para la limpieza).

Filtrado automático de modelos

Cuando adjunta un archivo binario con un requisito de capacidad (PDF, imagen o audio), el selector de modelos se filtra para mostrar solo los modelos que declaran esa capacidad. Si adjunta varios archivos con requisitos diferentes, solo aparecen los modelos que cumplen todos los requisitos.

Archivos adjuntosModels elegibles
1 PDFsupports_pdf_input
1 PNGsupports_vision
1 MP3supports_audio_input
1 PDF + 1 PNGsupports_pdf_input Y supports_vision
1 DOCX (modo binario, sin capacidad)Todos los modelos: se asume compatibilidad nativa con bytes cuando no se establece ningún indicador de capacidad
1 TXT o 1 MD (modo inline_text)Todos los modelos: el texto se incorpora al prompt

Precios y uso de tokens

Los adjuntos se facturan como tokens de entrada notificados por el proveedor del modelo: Entity Enricher no cobra una tarifa independiente por documento. El coste depende del tipo de archivo y del modelo seleccionado.

PDF, imágenes y audio (modo binary)

Consumen tokens de entrada específicos de cada modelo. Anthropic cobra alrededor de 1700 tokens por página de PDF; OpenAI factura las entradas de visión según el número de mosaicos; los modelos con capacidad de audio miden la entrada de audio en proporción a su duración. Consulte la ficha de precios de su modelo en Modelos y precios.

Documentos y hojas de cálculo de Office (texto extraído)

El texto extraído consume tokens de entrada a la tarifa estándar de texto. Los documentos grandes se limitan a 500 KB de texto extraído; el contenido más largo se trunca.

Seguridad y tenancy

Lista de permitidos MIME con detección de bytes mágicos
Se ignora el tipo de contenido proporcionado por el navegador. El servidor inspecciona los encabezados de los archivos y rechaza todo lo que quede fuera de la lista de permitidos configurada.
Almacenamiento con alcance de organización
Cada archivo se almacena bajo la organización propietaria. El endpoint de descarga exige pertenencia a la organización: no hay ninguna ruta a través de la API para acceder a los archivos de otro inquilino.
Extractores en entorno aislado
Cada extractor se ejecuta con un tiempo de espera de 10 segundos dentro de un límite try/except. Un archivo con comportamiento anómalo no puede bloquear ni hacer caer el proceso de la API.
Cifrado en reposo
Los bytes de los adjuntos residen en almacenamiento de bloques cifrado, montado en el contenedor de la aplicación con permisos restringidos.
Políticas por MIME controladas por el administrador
Los administradores del sistema pueden desactivar cualquier formato de forma global, cambiar un formato de binary a inline_text (o viceversa) o volver a etiquetarlo. Los cambios se aplican en la siguiente carga de ese tipo MIME.