Прикрепляйте PDF-файлы, изображения, аудиозаписи, документы Office, таблицы, слайды и текстовые файлы к любому запросу обогащения, генерации схем, генерации образцов, редактирования схемы с помощью ИИ или playground. Файлы поступают в модель либо в виде исходных байтов (для моделей с поддержкой PDF, изображений и аудио), либо в виде извлечённого на сервере текста, встроенного в промпт, — без ручного OCR, транскрибирования, конвертации или разбиения на фрагменты.
Каждый поддерживаемый MIME-тип имеет заданный администратором режим доставки. Режим определяет, как файл попадает в модель.
Исходные байты передаются модели как BinaryContent. Модель читает файл напрямую — без предварительной обработки на стороне сервера.
Требуется модель с соответствующим флагом возможностей (supports_pdf_input для PDF,supports_vision для изображений,supports_audio_input для аудио). Список выбора моделей автоматически фильтруется, чтобы показывать только совместимые модели.
Серверный экстрактор запускается один раз при загрузке и кэширует полученный текст. При каждом последующем вызове LLM кэшированный текст встраивается в пользовательский промпт.
Не требует возможностей модели — работает с любой моделью. Обычный текст и Markdown минуют экстрактор и декодируют исходные байты напрямую.
По умолчанию включены 19 форматов. Системные администраторы могут переключать любой формат между режимами binary иinline_text, изменять его название или полностью отключать его в разделе Управление моделями → Политики документов.
| Формат | Расширения | Режим по умолчанию | Возможность / экстрактор |
|---|---|---|---|
| PDF-документ | binary | supports_pdf_input | |
| Изображение PNG | .png | binary | supports_vision |
| Изображение JPEG | .jpg, .jpeg | binary | supports_vision |
| Аудио MP3 | .mp3 | binary | supports_audio_input |
| Аудио WAV | .wav | binary | supports_audio_input |
| Аудио M4A | .m4a | binary | supports_audio_input |
| Аудио OGG | .ogg, .oga | binary | supports_audio_input |
| Аудио FLAC | .flac | binary | supports_audio_input |
| Обычный текст | .txt | inline_text | необработанное декодирование |
| Markdown | .md, .markdown | inline_text | необработанное декодирование |
| Word (устаревший .doc) | .doc | binary | docx2txt |
| Word (.docx) | .docx | binary | python-docx |
| Текст OpenDocument | .odt | binary | odfpy |
| Rich Text Format | .rtf | binary | striprtf |
| Электронная книга EPUB | .epub | binary | ebooklib |
| HTML | .html, .htm | binary | beautifulsoup |
| CSV | .csv | binary | csv (stdlib) |
| Таблица (.xlsx) | .xlsx | binary | openpyxl |
| Презентация (.pptx) | .pptx | binary | python-pptx |
(organization_id, sha256).inline_text экстрактор запускается при загрузке, а полученный текст кэшируется в строке вложения. Последующие вызовы LLM повторно используют кэшированный текст — без затрат на повторное извлечение. Форматы binary пропускают этот шаг.DELETE /api/attachments/{id} — удобный шаг очистки после обогащения. Удаление ограничено рамками организации и возвращает { success, id, filename }.Вложения можно загружать и удалять программно, а не только через веб-интерфейс: коннектор n8n загружает их через нативный multipart, коннекторы Make.com и MCP — через маршрут base64 JSON, а любой клиент может напрямую использовать REST API (DELETE /api/attachments/{id} для очистки).
Когда вы прикрепляете бинарный файл с требованием к возможностям (PDF, изображение или аудио), список моделей фильтруется и показывает только модели, заявляющие эту возможность. Если вы прикрепляете несколько файлов с разными требованиями, отображаются только модели, удовлетворяющие всем требованиям.
| Прикреплённые файлы | Подходящие модели |
|---|---|
| 1 PDF | supports_pdf_input |
| 1 PNG | supports_vision |
| 1 MP3 | supports_audio_input |
| 1 PDF + 1 PNG | supports_pdf_input И supports_vision |
| 1 DOCX (режим binary, без возможности) | Все модели — при отсутствии флага возможностей предполагается нативная поддержка байтов |
| 1 TXT или 1 MD (режим inline_text) | Все модели — текст встраивается в промпт |
Вложения тарифицируются как входные токены, сообщаемые провайдером модели — Entity Enricher не взимает отдельную плату за документ. Стоимость зависит от типа файла и выбранной модели.
Потребляют входные токены, зависящие от модели. Anthropic взимает около 1700 токенов за страницу PDF; OpenAI оценивает входные изображения по количеству тайлов; модели с поддержкой аудио учитывают аудиовход пропорционально его длительности. Проверьте карточку цен вашей модели в разделе Модели и цены.
Извлечённый текст расходует входные токены по стандартной ставке для текста. Большие документы ограничены 500 КБ извлечённого текста — более длинное содержимое усекается.