Painel de Custos - Documentação do Entity Enricher

Painel de Custos

Análises de custos em tempo real com gráficos de séries temporais, discriminações por model, métricas de desempenho e predefinições de datas configuráveis.

Visão geral

O Painel de Custos dá-lhe visibilidade total sobre os seus gastos e desempenho com LLM. Agrega os dados de todos os registos de enriquecimento da sua organização e apresenta-os através de gráficos interativos e cartões de resumo. Use-o para identificar tendências de custos, comparar a eficiência dos modelos e otimizar o seu pipeline de enriquecimento.

Separadores
2
Predefinições de Data
4
Tipos de gráfico
5
Entre organizações
Proprietário+

Predefinições de Data

Selecione um intervalo de tempo na barra lateral. O URL é atualizado para refletir a predefinição selecionada (por exemplo, /costs/30d), permitindo vistas que podem ser adicionadas aos favoritos:

PredefiniçãoIntervalo de tempoAgrupamento de gráficos
7dÚltimos 7 diasDiário
30dÚltimos 30 diasDiário
90dÚltimos 90 diasSemanal
allDesde sempreMensal

Os proprietários e administradores podem ativar Todas as organizações na barra lateral para ver os custos agregados de toda a plataforma. Esta preferência é guardada no armazenamento local.

Separador de Visão Geral de Custos

O separador predefinido fornece uma discriminação abrangente dos gastos:

Cartões de resumo

Custo Total
$12.47
Soma de todos os custos de LLM no período
Total de Pedidos
342
Número de chamadas LLM efetuadas
Custo médio/pedido
$0.036
Custo médio por chamada individual
Modelo mais utilizado
claude-sonnet
Modelo com o maior número de pedidos

Gráficos e tabelas

Custo ao Longo do TempoGráfico de linhas que mostra as tendências de gastos ao longo do período selecionado, agrupadas por dia/semana/mês.
Custo por ModeloGráfico de barras horizontais dos 10 principais modelos por custo total. Identifique rapidamente os modelos mais caros.
Utilização de tokensDiscriminação de tokens de entrada, tokens de saída e total de tokens consumidos.
Insights do ModelCartões que destacam o modelo mais utilizado e o modelo mais caro.
Detalhe DiárioTabela com data, número de pedidos, custo total, custo médio por pedido e totais de tokens.

Separador de análise de desempenho

Mude para o separador Desempenho para analisar a eficiência dos modelos e identificar compromissos entre custo e desempenho:

Cartões de resumo

Total de Registos
156
Registos de enriquecimento no período
Modelos utilizados
8
Models distintos que produziram resultados
Variantes de idioma
3
Idiomas usados no enriquecimento multilingue
Intervalos de tokens
4
Intervalos distintos de tamanho de tokens de entrada

Gráficos e tabelas

Custo vs DuraçãoGráfico de dispersão com tamanhos de bolha proporcionais ao número de pedidos. Cada bolha é um modelo — encontre o melhor equilíbrio entre velocidade e custo.
Desempenho por modeloTabela que compara o número de pedidos, o custo médio, a duração média e as estatísticas de tokens por modelo.
Custo por Número de IdiomasGráfico de barras que mostra como o custo varia com o número de idiomas selecionados para enriquecimento multilingue.
Custo por Intervalo de Tokens de EntradaGráfico de barras que distribui os custos por intervalos de tamanho do prompt de entrada (por exemplo, 0–1K, 1K–5K, 5K–10K tokens).
Desempenho por número de propriedades do esquemaTabela que mostra como o custo e a duração do enriquecimento se relacionam com a complexidade do schema (apenas registos de enriquecimento).

Dicas de Otimização

Comparar modelos

Utilize o gráfico de dispersão Custo vs Duração para encontrar models que oferecem boa qualidade a um custo mais baixo. Models mais pequenos e rápidos são muitas vezes suficientes para schemas simples.

Monitorizar tendências

Verifique o gráfico de Custo ao Longo do Tempo semanalmente. Picos súbitos podem indicar trabalhos em lote mal configurados ou ciclos de repetição inesperados.

Dimensione os esquemas corretamente

A tabela Desempenho por Número de Propriedades do Esquema mostra como o custo escala com o tamanho do esquema. Remova propriedades desnecessárias para reduzir o custo por enriquecimento.

Utilizar models de cache

Os modelos com cache de prompts (como a Anthropic) reduzem custos em enriquecimentos repetidos com o mesmo esquema. Os cartões de utilização de tokens mostram as poupanças de tokens em cache.

Próximos Passos