Painel de Custos - Documentação do Entity Enricher
Painel de Custos
Análises de custos em tempo real com gráficos de séries temporais, discriminações por model, métricas de desempenho e predefinições de datas configuráveis.
Visão geral
O Painel de Custos dá-lhe visibilidade total sobre os seus gastos e desempenho com LLM. Agrega os dados de todos os registos de enriquecimento da sua organização e apresenta-os através de gráficos interativos e cartões de resumo. Use-o para identificar tendências de custos, comparar a eficiência dos modelos e otimizar o seu pipeline de enriquecimento.
Separadores
2
Predefinições de Data
4
Tipos de gráfico
5
Entre organizações
Proprietário+
Predefinições de Data
Selecione um intervalo de tempo na barra lateral. O URL é atualizado para refletir a predefinição selecionada (por exemplo, /costs/30d), permitindo vistas que podem ser adicionadas aos favoritos:
Predefinição
Intervalo de tempo
Agrupamento de gráficos
7d
Últimos 7 dias
Diário
30d
Últimos 30 dias
Diário
90d
Últimos 90 dias
Semanal
all
Desde sempre
Mensal
Os proprietários e administradores podem ativar Todas as organizações na barra lateral para ver os custos agregados de toda a plataforma. Esta preferência é guardada no armazenamento local.
Separador de Visão Geral de Custos
O separador predefinido fornece uma discriminação abrangente dos gastos:
Cartões de resumo
Custo Total
$12.47
Soma de todos os custos de LLM no período
Total de Pedidos
342
Número de chamadas LLM efetuadas
Custo médio/pedido
$0.036
Custo médio por chamada individual
Modelo mais utilizado
claude-sonnet
Modelo com o maior número de pedidos
Gráficos e tabelas
Custo ao Longo do Tempo— Gráfico de linhas que mostra as tendências de gastos ao longo do período selecionado, agrupadas por dia/semana/mês.
Custo por Modelo— Gráfico de barras horizontais dos 10 principais modelos por custo total. Identifique rapidamente os modelos mais caros.
Utilização de tokens— Discriminação de tokens de entrada, tokens de saída e total de tokens consumidos.
Insights do Model— Cartões que destacam o modelo mais utilizado e o modelo mais caro.
Detalhe Diário— Tabela com data, número de pedidos, custo total, custo médio por pedido e totais de tokens.
Separador de análise de desempenho
Mude para o separador Desempenho para analisar a eficiência dos modelos e identificar compromissos entre custo e desempenho:
Cartões de resumo
Total de Registos
156
Registos de enriquecimento no período
Modelos utilizados
8
Models distintos que produziram resultados
Variantes de idioma
3
Idiomas usados no enriquecimento multilingue
Intervalos de tokens
4
Intervalos distintos de tamanho de tokens de entrada
Gráficos e tabelas
Custo vs Duração— Gráfico de dispersão com tamanhos de bolha proporcionais ao número de pedidos. Cada bolha é um modelo — encontre o melhor equilíbrio entre velocidade e custo.
Desempenho por modelo— Tabela que compara o número de pedidos, o custo médio, a duração média e as estatísticas de tokens por modelo.
Custo por Número de Idiomas— Gráfico de barras que mostra como o custo varia com o número de idiomas selecionados para enriquecimento multilingue.
Custo por Intervalo de Tokens de Entrada— Gráfico de barras que distribui os custos por intervalos de tamanho do prompt de entrada (por exemplo, 0–1K, 1K–5K, 5K–10K tokens).
Desempenho por número de propriedades do esquema— Tabela que mostra como o custo e a duração do enriquecimento se relacionam com a complexidade do schema (apenas registos de enriquecimento).
Dicas de Otimização
Comparar modelos
Utilize o gráfico de dispersão Custo vs Duração para encontrar models que oferecem boa qualidade a um custo mais baixo. Models mais pequenos e rápidos são muitas vezes suficientes para schemas simples.
Monitorizar tendências
Verifique o gráfico de Custo ao Longo do Tempo semanalmente. Picos súbitos podem indicar trabalhos em lote mal configurados ou ciclos de repetição inesperados.
Dimensione os esquemas corretamente
A tabela Desempenho por Número de Propriedades do Esquema mostra como o custo escala com o tamanho do esquema. Remova propriedades desnecessárias para reduzir o custo por enriquecimento.
Utilizar models de cache
Os modelos com cache de prompts (como a Anthropic) reduzem custos em enriquecimentos repetidos com o mesmo esquema. Os cartões de utilização de tokens mostram as poupanças de tokens em cache.