LlamaExtract (из LlamaIndex) извлекает структурированные данные из предоставленных вами документов по пользовательской схеме с помощью первоклассного парсера. Entity Enricher работает наоборот: он обогащает сущность с помощью лучших в мире LLM — а также поиска в реальном времени в интернете и ваших документов — затем перепроверяет каждое поле по нескольким моделям и разрешает конфликты. Оба решают задачу «схема на входе, структурированный JSON на выходе», но охватывают разные её половины.
Отвечает на то, чего нет в ваших данных, используя знания LLM, интернет и ваши документы в качестве источников.
Извлекает то, что уже написано в загруженном вами документе. Без внешних знаний и поиска в интернете.
Запускает 2 и более LLM параллельно и разрешает расхождения на уровне полей с записью обоснования.
Один проход извлечения на документ. Без межмодельной проверки или арбитража.
Семантические ID присваивают каждой сущности стабильный ключ связывания, который выполняет дедупликацию между запусками, моделями и языками.
Вывод ограничен документом, из которого вы извлекали данные; сопоставление между документами — на вашей стороне.
Entity Enricher уже нативно принимает PDF-файлы, файлы Office и изображения — и может использовать вывод парсера в качестве входных данных.
Отличный вышестоящий парсер. Используйте его для подготовки сложных документов, а затем обогащайте результат в Entity Enricher.
| Функция | Entity Enricher | LlamaExtract |
|---|---|---|
| Пользовательская выходная схема | ||
| Структурированное извлечение из документов | ||
| Обогащение на основе мировых знаний LLM | ||
| Поиск в реальном времени в интернете как источник | ||
| Мультимодельное распараллеливание (2+ LLM параллельно) | ||
| Слияние и разрешение конфликтов на уровне полей | ||
| Журнал аудита арбитража | ||
| Семантические ID (идентичность / дедупликация) | ||
| Предварительная классификация сущностей | ||
| Многоязычный вывод (40 языков) | ||
| Пакетная обработка и потоковый прогресс | ||
| Используйте собственные ключи / самостоятельно размещённые модели | Частично | |
| REST API + MCP + интерфейсы n8n / Make | API + SDK | |
| Лучший в своём классе парсинг документов | Встроено | |
| Тарифная модель | Оплата за токен (BYOK) | За страницу / кредиты |
Оплата за токен
Используйте собственные ключи LLM API и платите провайдеру напрямую за использованные токены. Обработка документов встроена, поэтому для большинства файлов нет отдельного счёта за парсинг.
За страницу / кредиты
Тарификация по количеству разобранных и извлечённых страниц по кредитным тарифам LlamaCloud (с бесплатным начальным уровнем). Затраты растут в зависимости от объёма документов и числа страниц, а не количества сущностей.
Тарифы отражают публично опубликованные уровни и могут меняться — уточняйте актуальные ставки у каждого поставщика.
Анализируйте документы и обогащайте на основе знаний модели и веба — с арбитражем нескольких моделей, журналом аудита и идентификацией по семантическому ID, всё в одном конвейере.
Начать бесплатно