Аналитика затрат в реальном времени с временными графиками, разбивкой по моделям, метриками производительности и настраиваемыми пресетами дат.
Обзор
Панель затрат даёт вам полную видимость расходов и производительности LLM. Она агрегирует данные всех записей обогащения в вашей организации и представляет их через интерактивные диаграммы и сводные карточки. Используйте её для выявления тенденций затрат, сравнения эффективности моделей и оптимизации вашего конвейера обогащения.
Вкладки
2
Предустановки дат
4
Типы графиков
5
Между организациями
Владелец+
Предустановки дат
Выберите временной диапазон на боковой панели. URL обновляется, отражая выбранный пресет (например, /costs/30d), что позволяет сохранять представления в закладки:
Пресет
Диапазон времени
Группировка графиков
7d
Последние 7 дней
Ежедневно
30d
Последние 30 дней
Ежедневно
90d
Последние 90 дней
Еженедельно
all
За всё время
Ежемесячно
Владельцы и администраторы могут включить Все организации на боковой панели, чтобы видеть совокупные затраты по всей платформе. Эта настройка сохраняется в локальном хранилище.
Вкладка обзора стоимости
Вкладка по умолчанию предоставляет подробную разбивку расходов:
Карточки сводки
Общая стоимость
$12.47
Сумма всех затрат на LLM за период
Всего запросов
342
Количество выполненных вызовов LLM
Средняя стоимость/запрос
$0.036
Средняя стоимость одного вызова
Наиболее используемая модель
claude-sonnet
Модель с наибольшим числом запросов
Графики и таблицы
Стоимость во времени— Линейный график, показывающий тенденции расходов за выбранный период, сгруппированные по дням/неделям/месяцам.
Стоимость по model— Горизонтальная столбчатая диаграмма топ-10 моделей по общей стоимости. Быстро определяйте самые дорогие модели.
Использование токенов— Разбивка по входным токенам, выходным токенам и общему числу использованных токенов.
Аналитика модели— Карточки, показывающие наиболее часто используемую модель и самую дорогую модель.
Разбивка по дням— Таблица с датой, количеством запросов, общей стоимостью, средней стоимостью запроса и итогами по токенам.
Вкладка анализа производительности
Перейдите на вкладку «Производительность», чтобы проанализировать эффективность моделей и выявить компромиссы между стоимостью и производительностью:
Карточки сводки
Всего записей
156
Записи обогащения за период
Использованные модели
8
Различные модели, которые дали результаты
Языковые варианты
3
Языки, используемые в многоязычном обогащении
Диапазоны токенов
4
Различные диапазоны размеров входных токенов
Графики и таблицы
Стоимость и длительность— Точечная диаграмма, где размер пузырьков пропорционален количеству запросов. Каждый пузырёк — это модель; найдите оптимальный баланс скорости и стоимости.
Производительность по моделям— Таблица со сравнением количества запросов, средней стоимости, средней длительности и статистики токенов по каждой модели.
Стоимость по количеству языков— Столбчатая диаграмма, показывающая, как затраты растут в зависимости от числа языков, выбранных для многоязычного enrichment.
Стоимость по диапазону входных токенов— Столбчатая диаграмма с разбивкой затрат по размеру входного prompt (например, 0–1К, 1К–5К, 5К–10К токенов).
Производительность по количеству свойств схемы— Таблица, показывающая, как стоимость и длительность обогащения зависят от сложности схемы (только записи обогащения).
Советы по оптимизации
Сравнить модели
Используйте точечную диаграмму «Стоимость и длительность», чтобы найти модели, обеспечивающие хорошее качество при меньших затратах. Для простых схем часто достаточно меньших и более быстрых моделей.
Отслеживать тренды
Проверяйте график «Стоимость со временем» еженедельно. Внезапные всплески могут указывать на неправильно настроенные пакетные задачи или неожиданные циклы повторных попыток.
Оптимальный размер схем
Таблица «Производительность по количеству свойств схемы» показывает, как стоимость масштабируется с размером схемы. Удалите ненужные свойства, чтобы снизить стоимость одного обогащения.
Использовать модели с кэшированием
Модели с кэшированием промптов (например, Anthropic) снижают затраты на повторные обогащения с одной и той же схемой. Карточки использования токенов показывают экономию за счёт кэшированных токенов.