Adjuntos de documentos - Documentación de Entity Enricher

Adjuntos de documentos

Adjunte PDF, imágenes, grabaciones de audio, documentos de Office, hojas de cálculo, diapositivas y archivos de texto a cualquier solicitud de enriquecimiento, generación de esquemas, generación de muestras, edición de esquemas con IA o playground. Los archivos llegan al modelo como bytes nativos (para modelos con capacidad de PDF, visión y audio) o como texto extraído por el servidor e insertado en el prompt: sin necesidad de OCR, transcripción, conversión ni segmentación manuales.

Dónde puede adjuntar documentos

Enriquecimiento individual

Adjuntos por registro junto con la entrada JSON

Enriquecimiento por lotes

Adjuntos compartidos aplicados a cada entidad del lote

Generación de esquemas (guiada)

Genere un esquema a partir de un documento de ejemplo

Generación de JSON de muestra

Extraer una entidad de muestra de un archivo de origen

Edición de esquemas con IA

Refinar un schema con lenguaje natural + un documento de referencia

Playground

Prompts personalizados de forma libre con adjuntos

Dos modos de entrega

Cada tipo MIME admitido tiene un modo de entrega configurado por el administrador. El modo determina cómo llega el archivo al model.

binaryBytes nativos

Los bytes originales se pasan al modelo como BinaryContent. El modelo lee el archivo directamente, sin preprocesamiento en el servidor.

Requiere un modelo con el indicador de capacidad correspondiente (supports_pdf_input para PDF,supports_vision para imágenes,supports_audio_input para audio). El selector de modelos se filtra automáticamente para mostrar solo los modelos compatibles.

inline_textTexto extraído

Un extractor del lado del servidor se ejecuta una sola vez al subir el archivo y almacena en caché el texto resultante. En cada llamada posterior al LLM, el texto en caché se inserta en el prompt del usuario.

No se requiere ninguna capacidad del model — funciona con todos los models. El texto sin formato y Markdown omiten el extractor y decodifican los bytes sin procesar directamente.

Formatos admitidos

19 formatos vienen habilitados por defecto. Los administradores del sistema pueden cambiar cualquier formato entre el modo binary einline_text, modificar su etiqueta o deshabilitarlo por completo desde Gestión de modelos → Políticas de documentos.

Formato	Extensiones	Modo predeterminado	Capacidad / extractor
Documento PDF	.pdf	binary	`supports_pdf_input`
Imagen PNG	.png	binary	`supports_vision`
Imagen JPEG	.jpg, .jpeg	binary	`supports_vision`
Audio MP3	.mp3	binary	`supports_audio_input`
Audio WAV	.wav	binary	`supports_audio_input`
Audio M4A	.m4a	binary	`supports_audio_input`
Audio OGG	.ogg, .oga	binary	`supports_audio_input`
Audio FLAC	.flac	binary	`supports_audio_input`
Texto sin formato	.txt	inline_text	decodificación en bruto
Markdown	.md, .markdown	inline_text	decodificación en bruto
Word (.doc heredado)	.doc	binary	docx2txt
Word (.docx)	.docx	binary	python-docx
Texto de OpenDocument	.odt	binary	odfpy
Formato de texto enriquecido	.rtf	binary	striprtf
Libro electrónico EPUB	.epub	binary	ebooklib
HTML	.html, .htm	binary	beautifulsoup
CSV	.csv	binary	csv (stdlib)
Hoja de cálculo (.xlsx)	.xlsx	binary	openpyxl
Presentación (.pptx)	.pptx	binary	python-pptx

Límites

10 MB

Por archivo

Rechazar las cargas que superen este límite

50 MB

Por solicitud

Suma de todos los archivos en una sola carga

Sin límite

Cantidad de archivos

Limitado únicamente por el total de 50 MB por solicitud

Límite de texto extraído: 500 KB por adjunto — los documentos de origen más largos se truncan al extraerse del lado del servidor. Tiempo de espera del extractor: 10 s de reloj por adjunto (las cargas que superan el tiempo de espera aún tienen éxito; el archivo se almacena, pero su texto extraído queda vacío).

Ciclo de vida

Subir

Arrastre y suelte o seleccione archivos en el panel de adjuntos de cualquier página compatible. El tipo de contenido proporcionado por el navegador no es de confianza: el servidor analiza los magic bytes y rechaza todo lo que quede fuera de la lista permitida. Cada archivo se somete a hash (SHA-256) y se almacena en almacenamiento de bloques cifrado.

Deduplicar por contenido

Los bytes idénticos subidos dos veces dentro de la misma organización se deduplican en un único archivo almacenado. Dos organizaciones distintas que suben el mismo archivo generan dos filas independientes, sin fugas entre inquilinos. La clave de deduplicación es (organization_id, sha256).

Extraer una vez (modo inline_text)

Para los formatos inline_text, el extractor se ejecuta durante la carga y el texto resultante se almacena en caché en la fila del adjunto. Las llamadas posteriores al LLM reutilizan el texto en caché, sin coste de reextracción. Los formatos binary omiten este paso.

Referenciar por ID en cualquier trabajo

Una vez cargados, los adjuntos se pasan por ID en las solicitudes posteriores de enriquecimiento, generación de esquemas o Playground. Cada adjunto se añade al contenido de usuario del modelo como bytes nativos (modo binario) o como texto insertado (modo inline_text), conservando el nombre de archivo original.

Persistido en el registro

Cuando se guarda un registro de enriquecimiento, los ID de los adjuntos se vinculan a él. La página de detalles del registro enumera todos los adjuntos con un botón de descarga. Los registros se pueden volver a fusionar o reintentar sin necesidad de volver a subirlos.

Eliminar al finalizar (opcional)

Cuando ya no necesite un archivo, elimínelo con DELETE /api/attachments/{id}: un práctico paso de limpieza posterior al enriquecimiento. La eliminación tiene alcance de organización y devuelve { success, id, filename }.

Los adjuntos se pueden cargar y eliminar mediante programación, no solo desde la interfaz web: el conector de n8n carga mediante multipart nativo, los conectores de Make.com y MCP cargan mediante la ruta JSON en base64, y cualquier cliente puede usar la API REST directamente (DELETE /api/attachments/{id} para la limpieza).

Filtrado automático de modelos

Cuando adjunta un archivo binario con un requisito de capacidad (PDF, imagen o audio), el selector de modelos se filtra para mostrar solo los modelos que declaran esa capacidad. Si adjunta varios archivos con requisitos diferentes, solo aparecen los modelos que cumplen todos los requisitos.

Archivos adjuntos	Models elegibles
1 PDF	`supports_pdf_input`
1 PNG	`supports_vision`
1 MP3	`supports_audio_input`
1 PDF + 1 PNG	`supports_pdf_input` Y `supports_vision`
1 DOCX (modo binario, sin capacidad)	Todos los modelos: se asume compatibilidad nativa con bytes cuando no se establece ningún indicador de capacidad
1 TXT o 1 MD (modo inline_text)	Todos los modelos: el texto se incorpora al prompt

Precios y uso de tokens

Los adjuntos se facturan como tokens de entrada notificados por el proveedor del modelo: Entity Enricher no cobra una tarifa independiente por documento. El coste depende del tipo de archivo y del modelo seleccionado.

PDF, imágenes y audio (modo binary)

Consumen tokens de entrada específicos de cada modelo. Anthropic cobra alrededor de 1700 tokens por página de PDF; OpenAI factura las entradas de visión según el número de mosaicos; los modelos con capacidad de audio miden la entrada de audio en proporción a su duración. Consulte la ficha de precios de su modelo en Modelos y precios.

Documentos y hojas de cálculo de Office (texto extraído)

El texto extraído consume tokens de entrada a la tarifa estándar de texto. Los documentos grandes se limitan a 500 KB de texto extraído; el contenido más largo se trunca.

Seguridad y tenancy

Lista de permitidos MIME con detección de bytes mágicos

Se ignora el tipo de contenido proporcionado por el navegador. El servidor inspecciona los encabezados de los archivos y rechaza todo lo que quede fuera de la lista de permitidos configurada.

Almacenamiento con alcance de organización

Cada archivo se almacena bajo la organización propietaria. El endpoint de descarga exige pertenencia a la organización: no hay ninguna ruta a través de la API para acceder a los archivos de otro inquilino.

Extractores en entorno aislado

Cada extractor se ejecuta con un tiempo de espera de 10 segundos dentro de un límite try/except. Un archivo con comportamiento anómalo no puede bloquear ni hacer caer el proceso de la API.

Cifrado en reposo

Los bytes de los adjuntos residen en almacenamiento de bloques cifrado, montado en el contenedor de la aplicación con permisos restringidos.

Políticas por MIME controladas por el administrador

Los administradores del sistema pueden desactivar cualquier formato de forma global, cambiar un formato de binary a inline_text (o viceversa) o volver a etiquetarlo. Los cambios se aplican en la siguiente carga de ese tipo MIME.

Flujo de enriquecimiento

Cómo encajan los adjuntos en el flujo

Generación de esquemas